數(shù)據(jù)分析 | 零基礎入門數(shù)據(jù)分析(三):從入門到住院?

大家好,我是人生苦短python娜。o(〃'▽'〃)o

也許,我們昨夜才雄心勃勃定下的目標,今早醒來就忍不住泄氣了。我很想告訴你一件事:在未來會有一個全新的你,別把他困在你舊舊的身體里!兩個月前,我還是個傳統(tǒng)行業(yè)里人稱捧著鐵飯碗的國企娜,決心辭職的那一刻,腦海里也確實有兩個小人在掙扎:26歲才開始學xxxx晚了嗎?難道不晚嗎?晚嗎?不晚嗎?

我躺在床上,絕望地盯著天花板,花了30分鐘勉強說服自己:?_?

世界上大大小小的錯誤大概可以分為三種,有一種錯誤是絕對不能犯的,比如殺人放火;還有一種錯誤是最好不要犯的,比如離婚;最后有一種錯是犯了也沒多大關系的,比如娜姐我26歲了從國企辭職。就算這是個錯誤的決定又怎么樣,混得不好又怎么樣,最壞的結(jié)果不過就是兜兜轉(zhuǎn)轉(zhuǎn)找了一圈還是沒找著工作而已,天又塌不下來,讓我們都臉皮厚一點也自私一次吧,天塌下來讓個兒高的人去頂著!

人生苦短,去嘗試你喜歡的事情為時不晚。


所以,和我一起向前邁出一小步吧!

娜娜醬的第二個python學習小作業(yè):知乎數(shù)據(jù)清洗整理和結(jié)論研究

作業(yè)要求:

1、數(shù)據(jù)清洗 - 創(chuàng)建函數(shù)去除空值

2、問題1 知友全國地域分布情況,分析出TOP20

① 按照地域統(tǒng)計 知友數(shù)量、知友密度(知友數(shù)量/城市常住人口)

② 知友數(shù)量,知友密度,標準化處理,取值0-100,通過多系列柱狀圖,做圖表可視化

3、問題2 知友所在不同學校擁有粉絲數(shù)情況,分析出TOP20

① 按照學校(教育經(jīng)歷字段)統(tǒng)計粉絲數(shù)(‘關注者’)、關注人數(shù)(‘關注’),并篩選出粉絲數(shù)TOP20的學校

② 通過散點圖,橫坐標為關注人數(shù),縱坐標為粉絲數(shù),做圖表可視化

知乎數(shù)據(jù).csv示意

足智多謀娜娜醬(在jupyter notebook里做的):

1. 讀取知乎數(shù)據(jù),創(chuàng)建函數(shù):用“缺失數(shù)據(jù)”替換字符型的空值,用0替換數(shù)值型的空值

處理后的數(shù)據(jù)大概長這樣:

2. 按照地域統(tǒng)計知友數(shù)量、密度,并標準化處理,這里加載了一個常住人口的數(shù)據(jù):

常住人口數(shù)據(jù)示意

3. 通過matplotlib包作bar chart

4. 問題2 分析知友學校擁有粉絲數(shù)情況,對學校校名進行一些簡單處理(很多人的校名信息是亂填的,所以這里需要稍微注意一下),出散點圖

有很多很多不足之處,歡迎指教!

以上就是從計算機白癡到會用python做一點點點點點數(shù)據(jù)分析的人生贏家娜娜醬,暫時還沒有住院!請繼續(xù)期待后續(xù)的打怪升級小作業(yè)~

這是零基礎入門數(shù)據(jù)分析系列的第三篇,其他內(nèi)容在這里:

第一篇:零基礎小白自學數(shù)據(jù)分析:從入門到摔門?

第二篇:零基礎小白自學數(shù)據(jù)分析:從入門到絆倒?

第四篇:零基礎小白自學數(shù)據(jù)分析:從入門到出家?

第五篇:零基礎小白自學數(shù)據(jù)分析:從入門到脫發(fā)?

可能你也會對數(shù)據(jù)分析,從入門到放棄感興趣。

(-'?_?'-)謝謝您閱讀,請勿轉(zhuǎn)載。

最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容