php能做爬蟲嗎? php能寫爬蟲嗎?提到網頁爬蟲,大家一定第一時間想到是Python當爬蟲。其實用PHP也可以實現網頁爬蟲功能!
下面我們就來跟大家介紹如何用PHP做一個簡單的網頁爬蟲吧!
其實從另一個網站取得一個標籤並解析資料是非常容易的。可以透過一個PHP函數file_get_contents
來完成,如下所示:
<?php $webpage = file_get_contents('http://www.tonylea.com'); ?>
現在,變數$webpage
包含了http://www.tonylea.com的所有標籤(來源)。
基本上,如果我們想要解析數據,我們就可以這樣做:
<?php $url = 'http://www.tonylea.com'; $webpage = file_get_contents($url); function get_images($page) { if (!empty($page)){ preg_match_all('/<img([^>]+)\/>/i', $page, $images); return !empty($images[1]) ? $images[1] : FALSE; } } function get_links($page) { if (!empty($this->markup)){ preg_match_all('/<a([^>]+)\>(.*?)\<\/a\>/i', $this->markup, $links); return !empty($links[1]) ? $links[1] : FALSE; } } $images = get_images($webpage); foreach($images as $image) { echo $image.'<br />'; } ?>
在上面的範例中,我們從指定的URL獲得了標記,並獲得了'a'標籤和'img'標籤中包含的值。然後程式碼列印出“img”標籤中的資料。透過更多的解析,你可以顯示從已抓取或爬行的頁面中獲得的圖像和連結。
以上是PHP能寫爬蟲嗎? (PHP實現爬蟲技術範例)的詳細內容。更多資訊請關注PHP中文網其他相關文章!