五天早中晚進(jìn)展<信息采集及獲取>

信息采集

需要登錄 cookies+jsoup
不需要登錄 cookies

cookies來源

通過webview獲取

jsoup使用

爬取規(guī)則
標(biāo)簽內(nèi)部屬性爬取 例如 <a class="test" type="v"> 目的:爬取type
標(biāo)簽直接爬取 例如<a>文字</a> 目的:爬取文字
標(biāo)簽內(nèi)到標(biāo)簽內(nèi) 例如 <a>我是文字<br>干擾信息文字</a> 目的:爬取我是文字
爬取數(shù)量統(tǒng)計(jì)
size()函數(shù)

1)、Android Studio使用已經(jīng)順手,alt+enter是一個(gè)很不錯(cuò)的選擇

2)、解決的難點(diǎn)問題

1、使用webview登錄后獲取cookies,利用cookies再通過jsoup自動(dòng)登錄采集信息

ps:還可以通過chrome瀏覽器F12開發(fā)人員工具直接讀取cookies

2、Jsoup抓取相關(guān)的問題

抓取一個(gè)標(biāo)簽內(nèi)部的屬性值方法:

attr[shuxing]

統(tǒng)計(jì)item個(gè)數(shù):

size()函數(shù)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢(shì)1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 179,366評(píng)論 25 708
  • 國家電網(wǎng)公司企業(yè)標(biāo)準(zhǔn)(Q/GDW)- 面向?qū)ο蟮挠秒娦畔?shù)據(jù)交換協(xié)議 - 報(bào)批稿:20170802 前言: 排版 ...
    庭說閱讀 12,557評(píng)論 6 13
  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn),斷路器,智...
    卡卡羅2017閱讀 136,724評(píng)論 19 139
  • 一日曹操帳中閑坐,忽聞帳外腳步聲聲。郭嘉大步進(jìn)來滿面春風(fēng):“恭喜主公,賀喜主公!”曹操一皺眉:“大喬同意改嫁了還是...
    大司馬大將軍閱讀 567評(píng)論 0 1
  • 聽說你去過很多地方 也看過很多風(fēng)景 聽說你有很好的愛人 也有多年密交的老友 聽說你有高薪體面的工作 也有一套不大卻...
    盛夏小葵閱讀 278評(píng)論 0 0

友情鏈接更多精彩內(nèi)容