信息采集
需要登錄 cookies+jsoup
不需要登錄 cookies
cookies來源
通過webview獲取
jsoup使用
爬取規(guī)則
標(biāo)簽內(nèi)部屬性爬取 例如 <a class="test" type="v"> 目的:爬取type
標(biāo)簽直接爬取 例如<a>文字</a> 目的:爬取文字
標(biāo)簽內(nèi)到標(biāo)簽內(nèi) 例如 <a>我是文字<br>干擾信息文字</a> 目的:爬取我是文字
爬取數(shù)量統(tǒng)計(jì)
size()函數(shù)
1)、Android Studio使用已經(jīng)順手,alt+enter是一個(gè)很不錯(cuò)的選擇
2)、解決的難點(diǎn)問題
1、使用webview登錄后獲取cookies,利用cookies再通過jsoup自動(dòng)登錄采集信息
ps:還可以通過chrome瀏覽器F12開發(fā)人員工具直接讀取cookies
2、Jsoup抓取相關(guān)的問題
抓取一個(gè)標(biāo)簽內(nèi)部的屬性值方法:
attr[shuxing]
統(tǒng)計(jì)item個(gè)數(shù):
size()函數(shù)