數(shù)據(jù)分析學(xué)習(xí)推薦書籍

自己是一枚做數(shù)據(jù)平臺(tái)的 Engineer,這里根據(jù)網(wǎng)上搜集整理列出數(shù)據(jù)分析學(xué)習(xí)書單list.

基礎(chǔ)知識(shí):

SQL + Python + 一門面向?qū)ο驦anguage。

此處建議

W3C?

菜鳥學(xué)習(xí)

就可以搞定上述基礎(chǔ)。

下面的書籍自己只是Mark,慢慢看,后期會(huì)對(duì)這些書籍進(jìn)行篩選。

一、數(shù)據(jù)分析入門:

《Head First Data Analysis》鏈接:深入淺出數(shù)據(jù)分析 (豆瓣)

電子工業(yè)出版社的經(jīng)典書目系列,從數(shù)據(jù)分析基本步驟開(kāi)始、實(shí)驗(yàn)方法、最優(yōu)化方法、假設(shè)檢驗(yàn)方法、貝葉斯統(tǒng)計(jì)方法、主觀概率法、啟發(fā)法、直方圖法、回歸法、誤差處理、相關(guān)數(shù)據(jù)庫(kù)、數(shù)據(jù)整理技巧一一講到。圖比較多,適合入門。

《Head First Statistics》鏈接:深入淺出統(tǒng)計(jì)學(xué) (豆瓣)

推薦理由同上,適合入門者的經(jīng)典教材。

《R in Action-Data Analysis and Graphics with R》鏈接:R語(yǔ)言實(shí)戰(zhàn) (豆瓣)

R是屬于GNU系統(tǒng)的一個(gè)自由、免費(fèi)、源代碼開(kāi)放的軟件,用于統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖。這本書從實(shí)用的統(tǒng)計(jì)研究角度逐例分析R在數(shù)據(jù)處理、模型構(gòu)建、以及圖形操作上的由淺入深的結(jié)合,堪稱經(jīng)典。

《數(shù)據(jù)之魅-基于開(kāi)源工具的數(shù)據(jù)分析》鏈接:數(shù)據(jù)之魅 (豆瓣)

作者是華盛頓大學(xué)理論物理學(xué)博士。這本書是數(shù)據(jù)分析的經(jīng)典之一,包含大量的R語(yǔ)言模擬過(guò)程及結(jié)果展示,例舉了很多數(shù)據(jù)分析實(shí)例和代碼。

《數(shù)據(jù)挖掘-市場(chǎng)營(yíng)銷、銷售與客戶關(guān)系管理領(lǐng)域應(yīng)用》鏈接:數(shù)據(jù)挖掘技術(shù) (豆瓣)

作者是Data Miners的創(chuàng)辦人,有二十多年的營(yíng)銷和客戶關(guān)系管理結(jié)合數(shù)據(jù)挖掘的經(jīng)驗(yàn)。詳細(xì)介紹了作為一個(gè)數(shù)據(jù)挖掘團(tuán)隊(duì)需要的知識(shí)體系,包括數(shù)據(jù)庫(kù)、SAS使用、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、數(shù)據(jù)可視化、如何訪問(wèn)用戶收集需求、如何寫論文與溝通等等。有條件的建議看英文原版。

Data Analytics for Beginners: Basic Guide to Master Data Analytics

入門五星推薦。里面很多圖表實(shí)例,手把手教你如何EXCEL畫圖,對(duì)各種知識(shí)點(diǎn)(平均值,模式,中值,方差,標(biāo)準(zhǔn)偏差)的講解相當(dāng)?shù)牡轿唬绕鸫髮W(xué)里的各種課本靠譜。

先把這些花時(shí)間啃啃,數(shù)據(jù)分析的理論部分就基本入門了,根據(jù)實(shí)際情況還需要結(jié)合你的業(yè)務(wù)需求來(lái)進(jìn)行系統(tǒng)的學(xué)習(xí)。

二、數(shù)據(jù)分析進(jìn)階:

Doing Data Science

作者Cathy O’Neil是哈佛大學(xué)的博士,MIT的數(shù)據(jù)博士后,曾今作為一名Quant在對(duì)沖基金D.E. Shaw 工作,目前是一家紐約初創(chuàng)公司的Data scientist 。這本書需要有一定的編程和理論基礎(chǔ),作為入門教材來(lái)說(shuō)有點(diǎn)難,雖然只有400來(lái)頁(yè),但是涉及的知識(shí)點(diǎn)很全面。每一章節(jié)的核心內(nèi)容都附有編程案例,R/Python/Shell三種語(yǔ)言任君挑選。

Python for Data Analysis

Python數(shù)據(jù)分析必看,適合入行不久的數(shù)據(jù)分析師。作者有多年的Python數(shù)據(jù)分析工作經(jīng)驗(yàn),對(duì)各種Pyhon包iPython,NumPy,pandas,matpotlib等有著很深的理解??赐赀@本,敲完代碼,Python數(shù)據(jù)分析就算入行了。

Data Science for Business

很多牛人為之作序,數(shù)據(jù)科學(xué)如何與商業(yè)結(jié)合,相信這本書會(huì)給你一些啟發(fā)。

Python Data Science Handbook

2016年6月出版的,500頁(yè)保質(zhì)保量,作者(Jake VanderPlas)是華盛頓大學(xué)電子科學(xué)研究所的高級(jí)數(shù)據(jù)科學(xué)研究員,研究領(lǐng)域包括天文統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)和可擴(kuò)展計(jì)算。書的前半部分介紹了用于數(shù)據(jù)分析和一般的科學(xué)計(jì)算的基本Python庫(kù),后面從實(shí)際應(yīng)用的角度使用Python庫(kù)scikit-learn開(kāi)始機(jī)器學(xué)習(xí)實(shí)踐。適合有一定Python基礎(chǔ)人(或者R基礎(chǔ)),并且想學(xué)習(xí)如何使用Python進(jìn)行數(shù)據(jù)分析的人。

Storytelling with Data

作者Cole NussbaumerKnaflic,私募分析師,前Google人力分析團(tuán)隊(duì)總監(jiān)。本書展示了如何高效率展示量化資訊,如何用豐富的資料講故事。Google內(nèi)部的數(shù)據(jù)可視化課程講師,之前也在Maryland Institute College of Art兼職講師。如果你想知道如何以圖敘事,這邊好書不容錯(cuò)過(guò)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容