Automated data collection with R(Preface)

Automated data collection with R

A practical guide to web scraping and text mining
關于R語言數(shù)據(jù)自動化處理,如爬蟲,還有一些網(wǎng)頁相關基礎。

參考書就是Automated data collection with R
先是介紹一下本書的緒論和資源:

首先,怎么判斷你的需求,是否需要爬蟲來解決問題:

  • 該任務是否經(jīng)常需要重復執(zhí)行,比如更新你的數(shù)據(jù)庫?

  • 你是否希望其他人能夠重復你的數(shù)據(jù)收集過程?

  • 你是否經(jīng)常處理在線數(shù)據(jù)?

  • 這個任務在規(guī)模上和復雜度上如何?

  • 如果這個任務可以手動做,你是否有足夠的人手資源或時間

  • 你是否愿意通過編程來自動化你的分析

作者介紹了一些R的實用網(wǎng)站:

新手快速入門之QuickR:https://www.statmethods.net/

R bloggers: 非常有趣的R topics,收集了所有關于R的博客:http://www.r-bloggers.com/

recent advances in web technologies:關于R與其網(wǎng)站應用的一些更新:https://cran.r-project.org/web/views/WebTechnologies.html

整本書的website在:http://www.r-datacollection.com/ 包含本書配套的教程,代碼,blog等等。blog會經(jīng)常更新,推送一些實戰(zhàn)資源。

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內(nèi)容