這篇文章帶給大家的內容是關於php爬取圖片並保存到本地的程式碼範例,有一定的參考價值,有需要的朋友可以參考一下,希望對你有幫助。
透過一個簡單的範例複習一下幾個php函數的用法
curl 發送網路請求
preg_match 正規匹配
$url = 'http://desk.zol.com.cn/bizhi/7386_91671_2.html'; $headers = [ 'user-agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36' ]; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); //将curl_exec()获取的信息以字符串返回,而不是直接输出。 curl_setopt($ch, CURLOPT_HEADER, $headers); $output = curl_exec($ch); curl_close($ch); $str = mb_convert_encoding($output, 'utf-8', 'gb2312'); //或$str = iconv('gb2312//IGNORE', 'utf-8', $output); preg_match('!<img id="bigImg" src="(?<src>http.*\.(?<ext>jpg|png))".*>!', $str, $m); file_put_contents('./meinv.' . $m['ext'], file_get_contents($m['src']));
在php中建立curl連線的步驟一般為:初始化,設定選項,執行操作,釋放連線。
$ch = curl_init(); curl_setopt($ch, CURLOPT, $opt); $out = curl_exec($ch); curl_close();
常用的CURLOPT
設置,更多參考文件http://php.net/manual/zh/function.curl-setopt.php
CURLOPT_URL, string //设置url必须 CURLOPT_HEADER, array //设置请求header CURLOPT_RETURNTRANSFER, bool //为true时,以字符串返回响应,不包含header CURLOPT_SSL_VERIFYPEER, bool //为false时,不验证https证书,用于请求https的url CURLOPT_POST, int //为1时配合CURLOPT_POSTFIELDS使用post请求,默认使用get CURLOPT_POSTFIELDS, array //post数据数组
直接輸出$output發現亂碼,透過查看原始碼發現網頁使用的是gb2312編碼,用mb_convert_encoding或iconv轉換成utf-8編碼輸出。
preg_match 正規符合
透過查看原始碼發現我們需要的圖片標籤為
<img id="bigImg" src="(?<src>http.*\.(?<ext>jpg|png))".*>
以上是php爬取圖片並儲存到本機的程式碼範例的詳細內容。更多資訊請關注PHP中文網其他相關文章!