深入淺出數(shù)據(jù)分析(1-4章筆記)

說在最前面,我是一個(gè)不安分的人,一直在各種嘗試,大神勿噴,有建議可以提出,謝謝大家的喜歡和不喜歡。本篇沒有代碼也沒有模型圖,關(guān)于本書,目前不好評(píng)價(jià),因?yàn)榍八恼潞芎?jiǎn)單,感覺是為后面內(nèi)容做鋪墊,當(dāng)然,書單還有很多,慢慢的更新。目前職位是前端,也可以討論前端的問題。以上。

一,數(shù)據(jù)分析引言:分解數(shù)據(jù)

本章主要就是提供解決問題的常用思路:
以Acme化妝品公司超前那個(gè)保濕霜銷售需求為例,期望數(shù)據(jù)分析師幫助提高銷量
開始給出數(shù)據(jù)分析的一般執(zhí)行思路:確定->分解->評(píng)估->決策。

1,只有更多的了解信息才可以確定問題

合理的目標(biāo)銷量、掌握相關(guān)競(jìng)爭(zhēng)對(duì)手信息,廣告和社交營(yíng)銷預(yù)算

2,把問題和數(shù)據(jù)分解

提高銷量:客戶的期望是什么、哪種是有效的營(yíng)銷方式、廣告的質(zhì)量怎么樣。
對(duì)數(shù)據(jù)因子進(jìn)行分解
根據(jù)表格數(shù)據(jù)進(jìn)行對(duì)比分析
不斷的和客戶進(jìn)行溝通,了解更多的信息

3,評(píng)估

評(píng)估的目的就是形成自己的判斷,評(píng)估的方式就是進(jìn)行比較優(yōu)化得出一些結(jié)果進(jìn)行匯總
當(dāng)然還要評(píng)估自己的作為數(shù)據(jù)分析師的能力或者說是信用問題。

4,決策

評(píng)估就是給出建議,同時(shí)要保證自己的觀點(diǎn)傳達(dá)到位,讓客戶對(duì)你的意見作出正確的決策。

最后:

案例中開始作出調(diào)整廣告的建議,但是中間收看到一個(gè)產(chǎn)品針對(duì)少女市場(chǎng)飽和的新聞。那么合理建議一下子被否定了。那么就需要重新開始進(jìn)行確定->分解->評(píng)估->決策。
最后通過不斷的分解和假設(shè)到掌握真實(shí)的邊緣信息,深入挖掘市場(chǎng)數(shù)據(jù)得到新的目標(biāo)客戶發(fā)現(xiàn)有男士使用該產(chǎn)品,最后得出推出新男士品牌的決策,提高銷量達(dá)到客戶要求。

二,實(shí)驗(yàn),校驗(yàn)?zāi)愕睦碚?/h2>

本章主要介紹一定要用實(shí)驗(yàn)來校驗(yàn)自己對(duì)數(shù)據(jù)分析產(chǎn)生的結(jié)論。
以咖啡咖啡銷量為背景

1,觀察數(shù)據(jù)要考慮到混雜因素,并列舉出來

選址方便、咖啡溫度、員工熱情、咖啡價(jià)值、偏愛去處

2,拆分?jǐn)?shù)據(jù)塊,管理混雜因素

東安地區(qū)分店、西雅圖區(qū)分店、SOHO區(qū)分店

3,實(shí)驗(yàn)必須加入實(shí)驗(yàn)組和控制組

為什么要加入控制組?
因?yàn)樵诘谝淮卧囼?yàn)中,有降價(jià)和向客戶說服咖啡是有價(jià)值的兩條建議,但是實(shí)驗(yàn)只采取了降價(jià)措施,并沒有說服價(jià)值行動(dòng),這樣就會(huì)受到降價(jià)是否有效的質(zhì)疑,所以最終建立了降價(jià)和說服兩個(gè)實(shí)驗(yàn)組和一個(gè)默認(rèn)控制組,從而可以進(jìn)行最后的比較。
故以控制組為基準(zhǔn)才可以證實(shí)實(shí)驗(yàn)對(duì)應(yīng)的假設(shè)條件是否有效。
其中,也講到了隨機(jī)選擇相似組的方法和重要性

最后的整個(gè)流程就是:

將數(shù)據(jù)表劃分為微區(qū)域->將微區(qū)域隨機(jī)分配給控制組和實(shí)驗(yàn)組->進(jìn)行實(shí)驗(yàn)觀察->收集結(jié)果->組與組進(jìn)行相互比較,分析結(jié)果。

三,最優(yōu)化:尋找最大值

本章主要講解如何找出變量因子組合的最大值,涉及到了Excel中的solver方法以及基本的線性數(shù)學(xué)知識(shí)。
案例背景:如何生產(chǎn)對(duì)應(yīng)數(shù)量的橡皮魚和橡皮鴨兩種浴盆玩具已得到最大的利潤(rùn)?

1,變量因子受到的限制條件:

廠家有多少橡膠用來生產(chǎn)這些產(chǎn)品、廠家生產(chǎn)這兩類產(chǎn)品需要多長(zhǎng)時(shí)間?

2,借助目標(biāo)函數(shù)來發(fā)現(xiàn)目標(biāo)C1X1 + C2X2 =P

C表示約束條件、X表示決策變量、P是你的目標(biāo)
那么C1X1表示橡皮鴨利潤(rùn)、C2X2表示橡皮魚利潤(rùn),P就是總利潤(rùn)
C可以表示每個(gè)產(chǎn)品的利潤(rùn),X可以表示產(chǎn)品的數(shù)量,CX就表示總利潤(rùn)了。

3,確定合理的選擇區(qū)

規(guī)定的時(shí)間內(nèi),最多只能生產(chǎn)400只橡皮鴨和300條橡皮魚。
根據(jù)橡膠的供應(yīng)量,只能生產(chǎn)500只橡皮鴨,或者400條橡皮魚。
畫出對(duì)應(yīng)的選擇區(qū)域利用Excel中的Solver工具進(jìn)行求解。

4,結(jié)果實(shí)際利潤(rùn)中發(fā)現(xiàn)通過1,2,3步驟得出的結(jié)論是錯(cuò)誤的

因?yàn)槟愕哪P椭皇敲枋隽四阋?guī)定的情況,于是找出歷史數(shù)據(jù)進(jìn)行具體的分析
發(fā)現(xiàn)每個(gè)月的銷售數(shù)量和利潤(rùn)隨著月份在波動(dòng)。

5,堤防負(fù)相關(guān)變量

通過折線圖可以發(fā)現(xiàn),一個(gè)產(chǎn)品越多,另一個(gè)產(chǎn)品就越少,并且折線圖可以反映每個(gè)月的 波動(dòng)情況。
于是改變約束條件,即下個(gè)月的銷售數(shù)量的最大值從折線圖來看不會(huì)超過多少來增加限制,從而得出最優(yōu)解。最終得出有效的解決方案。

四,數(shù)據(jù)圖形化,圖形讓你更精明

本章主要講解是如何讓數(shù)據(jù)圖形化,這里就不是簡(jiǎn)單的利用Excel自帶的一些表格來繪制圖形,而是開始講到用R語言來繪制。

1,數(shù)據(jù)圖形化的根本在于正確比較

2,使用散點(diǎn)圖探索原因

3,最優(yōu)秀的圖形是多元圖形

4,同時(shí)展示多張圖形,體現(xiàn)更多變量

總結(jié):

這張主要就是講解要學(xué)會(huì)從大量數(shù)據(jù)中篩選有用的數(shù)據(jù)(不是所有的數(shù)據(jù)都是有效的),然后將數(shù)據(jù)圖形化的時(shí)候不是之前章節(jié)簡(jiǎn)單的折線圖或者直方圖或者線性圖,而是離散且多變量圖形的展示,便開始引出R語言來將數(shù)據(jù)可視化的概念。而不是簡(jiǎn)單的Excel圖形工具。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容