php抓取程序邏輯代碼

  • 帶緩存的抓取邏輯
public static function crawlContent($url, $encode = true) {
    $file_name = '../cache/'.md5($url);
    if (!file_exists($file_name)) {
        @touch($file_name);
    }
    $content = file_get_contents($file_name);
    if (empty($content)) {
        $content = Request::curl($url);
        if (empty($content)) {
            sleep(1);
            $content = Request::curl($url);
        }
        $encode && $content = iconv("GBK", "UTF-8//IGNORE",$content);
        file_put_contents($file_name, $content);
    }
    return $content;
}
  • 不帶緩存,直接curl數(shù)據(jù)
    public static function curlContent($url, $encode = true) {  //不走緩存
            $content = Request::curl($url);
            if (empty($content)) {
                sleep(1);
                $content = Request::curl($url);
            }
            $encode && $content = iconv("GBK", "UTF-8//IGNORE",$content);
        return $content;
    }
最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

  • Spring Cloud為開發(fā)人員提供了快速構建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務發(fā)現(xiàn),斷路器,智...
    卡卡羅2017閱讀 136,715評論 19 139
  • 一、什么是CURL? cURL 是一個利用URL語法規(guī)定來傳輸文件和數(shù)據(jù)的工具,支持很多協(xié)議,如HTTP、FTP、...
    伊Summer閱讀 1,402評論 0 4
  • 原文地址:PHPcURL庫函數(shù)抓取頁面內(nèi)容(轉)作者:巴克 cURL是一個利用URL語法規(guī)定來傳輸文件和數(shù)據(jù)的工具...
    司馬東陽閱讀 1,268評論 0 3
  • 一、什么是CURL? cURL 是一個利用URL語法規(guī)定來傳輸文件和數(shù)據(jù)的工具,支持很多協(xié)議,如HTTP、FTP、...
    茶藝瑤閱讀 4,837評論 0 6
  • 練習硬筆書法,楷書打卡,摘抄唐詩(一)。
    遇見英語閱讀 519評論 0 3

友情鏈接更多精彩內(nèi)容