基于圖像識別(神經(jīng)網(wǎng)絡(luò))的微信朋友圈抓?。?)

(學(xué)完深度學(xué)習(xí)之后,最開始想做的是一個(gè)朋友圈預(yù)測,但是第一步數(shù)據(jù)收集就卡住了。微信朋友圈沒有什么接口開放出,只能一個(gè)個(gè)的手動粘,極其耗時(shí),粘了幾十條之后,就不愛弄了。)

(網(wǎng)上也有人問,但沒什么有用的答案,唯一有用的是一篇講反編譯微信安卓APP的,這個(gè)思路很好,其實(shí)可以走這條路,另一個(gè)可能通的路是抓微信的包,分析傳輸數(shù)據(jù)什么的)

突然想到,可以換個(gè)思路,完全可以用圖像識別的方式去“看”,哪個(gè)部分分別是什么,然后通過模擬器點(diǎn)擊去抓取存儲:

(圖片來自本人的iphone6sp截屏)

簡單的劃分一下:

1.最左上角是個(gè)“完成”按鈕

2.接下來是個(gè)“頭像”,旁邊是“昵稱”

3.下面是“文本段”,可能沒有,長度也不一定

4.再下面是“圖片”,單張圖片,會全部顯示,多于2張的,會是縮小圖,圖片也可能沒有,最多9張

5.這里還有可能是別的內(nèi)容,比如網(wǎng)頁的分享,或是小視屏

6.如果這里是從別的app分享過來的,下面還會有“來自哪個(gè)app”

7.再往下是“發(fā)布時(shí)間”

8.然后可能是“點(diǎn)贊”

9.再下一點(diǎn)可能是評論回復(fù),這個(gè)截圖里面沒有,長度和數(shù)量不確定

10.最下面是回復(fù)框

基于以上分析,有些區(qū)域的位置其實(shí)是固定的,比如“完成”按鈕,“頭像”,“昵稱”(昵稱的長度可能不確定,但基本就是在那一行上)

還有一些,比如發(fā)布時(shí)間和點(diǎn)贊的位置基本都是在那一列上

往下是重點(diǎn),內(nèi)容分析:“文本段”,“圖片”,“小視屏”,“網(wǎng)頁”,每一個(gè)都有自己的規(guī)則,其實(shí)規(guī)則還挺好找的,放之后慢慢說吧。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 2017.02.22 可以練習(xí),每當(dāng)這個(gè)時(shí)候,腦袋就犯困,我這腦袋真是神奇呀,一說讓你做事情,你就犯困,你可不要太...
    Carden閱讀 1,503評論 0 1
  • 嶗山一直是大姑的心結(jié) 08年要升入初中的那個(gè)暑假,大姑帶著我和我哥去了青島,說是可以游泳看帆船比賽 具體干了什么真...
    折耳根先生閱讀 294評論 0 2
  • 我承認(rèn) 我時(shí)常自我矛盾 上一刻還活力滿滿 相信世界充滿善意 下一秒便萎靡沮喪 懷疑自己太過天真 還有,愛你這件事 ...
    Aprilme閱讀 420評論 4 3

友情鏈接更多精彩內(nèi)容