大家好,我是人生苦短python娜。o(〃'▽'〃)o
也許,我們昨夜才雄心勃勃定下的目標,今早醒來就忍不住泄氣了。我很想告訴你一件事:在未來會有一個全新的你,別把他困在你舊舊的身體里!兩個月前,我還是個傳統(tǒng)行業(yè)里人稱捧著鐵飯碗的國企娜,決心辭職的那一刻,腦海里也確實有兩個小人在掙扎:26歲才開始學xxxx晚了嗎?難道不晚嗎?晚嗎?不晚嗎?
我躺在床上,絕望地盯著天花板,花了30分鐘勉強說服自己:?_?
世界上大大小小的錯誤大概可以分為三種,有一種錯誤是絕對不能犯的,比如殺人放火;還有一種錯誤是最好不要犯的,比如離婚;最后有一種錯是犯了也沒多大關系的,比如娜姐我26歲了從國企辭職。就算這是個錯誤的決定又怎么樣,混得不好又怎么樣,最壞的結(jié)果不過就是兜兜轉(zhuǎn)轉(zhuǎn)找了一圈還是沒找著工作而已,天又塌不下來,讓我們都臉皮厚一點也自私一次吧,天塌下來讓個兒高的人去頂著!
人生苦短,去嘗試你喜歡的事情為時不晚。
所以,和我一起向前邁出一小步吧!
娜娜醬的第二個python學習小作業(yè):知乎數(shù)據(jù)清洗整理和結(jié)論研究
作業(yè)要求:
1、數(shù)據(jù)清洗 - 創(chuàng)建函數(shù)去除空值
2、問題1 知友全國地域分布情況,分析出TOP20
① 按照地域統(tǒng)計 知友數(shù)量、知友密度(知友數(shù)量/城市常住人口)
② 知友數(shù)量,知友密度,標準化處理,取值0-100,通過多系列柱狀圖,做圖表可視化
3、問題2 知友所在不同學校擁有粉絲數(shù)情況,分析出TOP20
① 按照學校(教育經(jīng)歷字段)統(tǒng)計粉絲數(shù)(‘關注者’)、關注人數(shù)(‘關注’),并篩選出粉絲數(shù)TOP20的學校
② 通過散點圖,橫坐標為關注人數(shù),縱坐標為粉絲數(shù),做圖表可視化

足智多謀娜娜醬(在jupyter notebook里做的):
1. 讀取知乎數(shù)據(jù),創(chuàng)建函數(shù):用“缺失數(shù)據(jù)”替換字符型的空值,用0替換數(shù)值型的空值

處理后的數(shù)據(jù)大概長這樣:

2. 按照地域統(tǒng)計知友數(shù)量、密度,并標準化處理,這里加載了一個常住人口的數(shù)據(jù):


3. 通過matplotlib包作bar chart



4. 問題2 分析知友學校擁有粉絲數(shù)情況,對學校校名進行一些簡單處理(很多人的校名信息是亂填的,所以這里需要稍微注意一下),出散點圖



以上就是從計算機白癡到會用python做一點點點點點數(shù)據(jù)分析的人生贏家娜娜醬,暫時還沒有住院!請繼續(xù)期待后續(xù)的打怪升級小作業(yè)~
這是零基礎入門數(shù)據(jù)分析系列的第三篇,其他內(nèi)容在這里:
第一篇:零基礎小白自學數(shù)據(jù)分析:從入門到摔門?
第二篇:零基礎小白自學數(shù)據(jù)分析:從入門到絆倒?
第四篇:零基礎小白自學數(shù)據(jù)分析:從入門到出家?
第五篇:零基礎小白自學數(shù)據(jù)分析:從入門到脫發(fā)?
可能你也會對數(shù)據(jù)分析,從入門到放棄感興趣。
(-'?_?'-)謝謝您閱讀,請勿轉(zhuǎn)載。