繼簡(jiǎn)書(shū)用戶數(shù)據(jù)第一篇之后,現(xiàn)在出第二篇啦。先看下數(shù)據(jù)分析的結(jié)果大概長(zhǎng)什么樣!

圖里面是什么呢,下面就開(kāi)始說(shuō)說(shuō)

這篇文章主要是對(duì)用戶的動(dòng)態(tài)做分析。
0.分析什么
說(shuō)是對(duì)動(dòng)態(tài)做分析,啥是動(dòng)態(tài)?就像你微信朋友圈的發(fā)表、點(diǎn)贊、評(píng)論、被評(píng)論一樣。你在簡(jiǎn)書(shū)的操作也被記錄下來(lái)啦,像這樣:

在簡(jiǎn)書(shū)的可見(jiàn)動(dòng)態(tài)分為八種類型:發(fā)表評(píng)論,喜歡文章,贊賞文章,發(fā)表文章,關(guān)注用戶,關(guān)注專題,點(diǎn)贊評(píng)論,關(guān)注文集 。
1.數(shù)據(jù)從哪里來(lái)
當(dāng)然還是用python寫(xiě)爬蟲(chóng)代碼來(lái)簡(jiǎn)書(shū)抓了,一個(gè)個(gè)復(fù)制粘貼是不可能的,要又要不到,只能寫(xiě)爬蟲(chóng)來(lái)抓啊,這樣子才能維持?jǐn)?shù)據(jù)來(lái)源……

看,蠻快的!數(shù)據(jù)嗖嗖的就來(lái)了,還不是美滋滋~

2.分析過(guò)程
略(不要在意這些細(xì)節(jié),直接看結(jié)果啦)
3.分析結(jié)果
先以簡(jiǎn)叔為例吧,記得剛注冊(cè)簡(jiǎn)書(shū),就收到一個(gè)私信,我還以為哪妹子看上我了!
嗯,扯遠(yuǎn)了。咱還是來(lái)認(rèn)(hu)真(luan)分析一下數(shù)據(jù)吧。
3.1基本信息

截止至2017-08-20 18:32:11,也就是我現(xiàn)在碼這段字的前幾秒。簡(jiǎn)叔關(guān)注了2346個(gè)用戶(說(shuō)好的上限1000呢~)。粉絲87137個(gè),粉絲排行榜前幾名啦。
發(fā)表文章122篇,收獲喜歡30137,喜歡文章11292,嗯?點(diǎn)了那么多喜歡?
發(fā)表評(píng)論8454次,打賞文章2128次,土豪吧。想到我占1/2128,不禁有些激動(dòng)。

3.2 第一次
隨著動(dòng)態(tài)越來(lái)越多,因?yàn)閯?dòng)態(tài)按時(shí)間倒排,你可能翻了跟多頁(yè)還是不知道你在簡(jiǎn)書(shū)第一個(gè)關(guān)注的用戶,喜歡的文章,發(fā)表的評(píng)論。沒(méi)關(guān)系,我記得(能快速找出來(lái)……)!
咱們看看簡(jiǎn)叔的第一次!
2012-09-05 11:26:57
注冊(cè),加入簡(jiǎn)書(shū)。
(我以為是第一個(gè)注冊(cè)用戶,去抓下來(lái)的用戶中查了下,larryzhao是2012-09-05 11:08:37注冊(cè)的,早十幾分鐘。看了介紹,這個(gè)也是簡(jiǎn)書(shū)聯(lián)合創(chuàng)始人。應(yīng)該沒(méi)有比這早了的吧)
2012-12-20 15:31:53
第一次發(fā)表文章:價(jià)值主張的工作表
2012-12-13 17:19:31
第一次喜歡文章:簡(jiǎn)書(shū)發(fā)表的獻(xiàn)給寫(xiě)作者的 Markdown 新手指南
2013-05-23 05:36:28
第一次關(guān)注用戶:趙云波
2013-12-08 11:40:56
第一次對(duì)文章 為什么你應(yīng)該每天寫(xiě)作 評(píng)論:
“我覺(jué)得哪怕真是有興趣,要堅(jiān)持每天寫(xiě)作也是非常困難的事情。一周寫(xiě)上一篇,或者一個(gè)月寫(xiě)上一篇,這種才是休閑活動(dòng)?!该刻鞂?xiě)作」這個(gè)行為絕不可能成為一項(xiàng)「休閑活動(dòng)」??梢宰龅健该刻鞂?xiě)作」的人,要么他是一個(gè)真正從事文字工作的人,要么他對(duì)「每天寫(xiě)作」這件事情有一種強(qiáng)迫癥。”
嗯,同意簡(jiǎn)叔3.6年前的觀點(diǎn)。天天喊著「每天寫(xiě)作」大都是文字工作者。上班族們,不要一聽(tīng)別人的鼓動(dòng)就給自己立個(gè)誓,到時(shí)候打臉的可是自己啊!一天記流水賬似的一篇,干嘛,感動(dòng)自己???
2014-03-27 12:37:08
第一次關(guān)注文集:社區(qū)的藝術(shù)
文集這個(gè)概念在別的用戶瀏覽的時(shí)候好像不是那么重要,所以一般關(guān)注文集較少或沒(méi)有。
2014-07-30 06:13:35
第一次關(guān)注專題:毒眼尋珠
2015-03-30 11:47:11
第一次打賞文章 :劉淼 發(fā)表的20150318村上問(wèn)答之「我的生活正發(fā)生怪事」
2015-07-27 17:01:30
第一次贊了評(píng)論: 我的比較波折,第一次發(fā)被快遞的臨時(shí)工搞丟了,簡(jiǎn)書(shū)服務(wù)不錯(cuò),幫我和中通交涉,中通賠了錢(qián),后來(lái)補(bǔ)發(fā)了一份。書(shū)看完一本了,還不錯(cuò)誒,好評(píng)!
這個(gè)文章已經(jīng)不在了,文章應(yīng)該是關(guān)于簡(jiǎn)書(shū)出版的書(shū)。
3.3 各種動(dòng)態(tài)占比

喜歡文章、發(fā)表評(píng)論、關(guān)注用戶、贊賞文章,這四種占比較高,說(shuō)明簡(jiǎn)叔還是很關(guān)注和支持簡(jiǎn)書(shū)的用戶創(chuàng)作。
3.4月度動(dòng)態(tài)趨勢(shì)

總體呈波段上升趨勢(shì),簡(jiǎn)叔在簡(jiǎn)書(shū)平臺(tái)還是很活躍的。
3.5 日動(dòng)態(tài)趨勢(shì)
自注冊(cè)以來(lái),每天的動(dòng)態(tài)次數(shù)。像這樣,密密麻麻

峰值是 2016-01-04,這天動(dòng)態(tài)次數(shù)212次。因?yàn)閳D較大,降低了幀率,所以看起來(lái)有些卡頓。
3.6 時(shí)動(dòng)態(tài)趨勢(shì)

如果按11點(diǎn)以后算熬夜的話,可以看出簡(jiǎn)叔還是有不少熬夜情況的。大叔,注意身體!

白天各個(gè)時(shí)間段瀏覽簡(jiǎn)書(shū)較均衡,畢竟是老板,沒(méi)有確切的工作時(shí)間段。有事沒(méi)事刷下簡(jiǎn)書(shū)!
3.7 周內(nèi)發(fā)表文章頻次

圓形氣泡越大,代表發(fā)文章頻率越高。簡(jiǎn)叔非工作時(shí)段發(fā)文還是蠻多的。
其他用戶分析的,文字工作者一般都是集中在周一到周五,上班族周六周日更集中一些。
要想詩(shī)和遠(yuǎn)方,還是要先解決眼前的茍且。
3.8 周內(nèi)喜歡文章頻次

??!什么鬼?一個(gè)個(gè)連續(xù)的飽滿的小球。09:00-15:00,21:00-0:00。這兩個(gè)時(shí)間段內(nèi)簡(jiǎn)叔喜歡文章很頻繁,下午少一些。
3.9 周內(nèi)關(guān)注用戶頻次

早上關(guān)注用戶多一些?
3.10 周內(nèi)打賞頻次

晚上打個(gè)賞?

3.11 發(fā)表的評(píng)論
對(duì)所有評(píng)論進(jìn)行分詞,詞頻統(tǒng)計(jì)后制作出詞云,然后……


哈哈哈,簡(jiǎn)叔天天好開(kāi)心?。。?!
愿大家都有簡(jiǎn)叔的心態(tài)!!
你還愣著干什么?笑??!

4.最后
其實(shí)我已經(jīng)在封裝爬蟲(chóng)和分析過(guò)程及web展示,由于域名過(guò)期還沒(méi)來(lái)得及上線到服務(wù)器上,完整的是requests+mongodb+flask+echarts集合成的微服務(wù)。輸入個(gè)人主頁(yè),就能交互式自動(dòng)生成展示頁(yè)面。如輸入彭小六主頁(yè),提交后顯示分析結(jié)果:

項(xiàng)目(gayhub地址)還在籌備中,后面會(huì)上線該服務(wù)供大家訪問(wèn)瀏覽。
