當我們談論數(shù)據(jù)分析時,我們在談論什么?
我們其實在談論數(shù)據(jù)分析的三個部分。
1. 數(shù)據(jù)采集 數(shù)據(jù)采集是我們的「原材料」,主要通過爬蟲以及一些自動化工具采集得來。
2. 數(shù)據(jù)挖掘 數(shù)據(jù)挖掘是數(shù)據(jù)分析中最有價值的部分,主要是要幫助我們找到數(shù)據(jù)的規(guī)律,幫助我們做出決策,完成業(yè)務訴求。
3. 數(shù)據(jù)可視化 數(shù)據(jù)可視化可以幫助我們更直白地看到做出的結果,幫助我們理解或者向他人演示。
數(shù)據(jù)挖掘是數(shù)據(jù)分析的重中之重,大家的差異和價值也體現(xiàn)在其中。
下面我列出數(shù)據(jù)挖掘的知識清單,供大家學習參考。

數(shù)據(jù)挖掘
每一個算法都可能花你很多時間去搞懂,我希望大家可以先去了解下每個算法的基本含義以及作用,這樣你才會有更深刻的印象。
留一個思考題,你要開始學習數(shù)據(jù)挖掘了,你有什么心得體會呢?如果一個淘寶店家要查看店鋪商品之間的關聯(lián)關系,他應該用那個算法呢?為什么?
歡迎大家留言討論,后續(xù)我會持續(xù)更新,記得關注我哦!