數(shù)據(jù)分析即從歷史數(shù)據(jù)中找到某些潛伏在數(shù)據(jù)背后的事實(shí)(特征之間的關(guān)聯(lián)性),提煉出具體的模型,給決策者提供理論的支持,用以最大程度確保決策的成功。簡(jiǎn)單來(lái)說(shuō)就是找到規(guī)律,預(yù)測(cè)未來(lái)。
數(shù)據(jù)分析一般分為5步:
- 確定想要解決的問題
- 數(shù)據(jù)采集和數(shù)據(jù)清理
- 探索數(shù)據(jù)(熟悉數(shù)據(jù)、培養(yǎng)直覺、找到模式)
- 總結(jié)結(jié)論或作出預(yù)測(cè)(機(jī)器學(xué)習(xí))
- 交流成果
python的計(jì)算庫(kù)numpy、pandas以及可視化庫(kù)matplotlib的學(xué)習(xí),編程相關(guān)的內(nèi)容就不詳細(xì)說(shuō)了。
學(xué)習(xí)了一個(gè)相關(guān)性算法:皮爾遜積矩相關(guān)系數(shù)