如果url連結給的是https://mbd.baidu.com/newspage/data/landingsuper?context={"nid":"news_4480296238548479181"}&n_type=0&p_from=1
#的連結怎麼爬取網頁資訊
用curl來爬取網站注意https
是的,1樓的說的很完整,取得頁面資訊通常用的也就這兩種方法,file_get_contents和透過curl請求
可以用file_get_contents 或curl 程式碼:
function getHTTPS($url) { $ch = curl_init(); curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE); curl_setopt($ch, CURLOPT_HEADER, false); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_REFERER, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE); $result = curl_exec($ch); curl_close($ch); return $result; }
用curl來爬取網站注意https
是的,1樓的說的很完整,取得頁面資訊通常用的也就這兩種方法,file_get_contents和透過curl請求
可以用file_get_contents 或curl 程式碼:
#