首頁 > 後端開發 > php教程 > PHP 簡易爬蟲

PHP 簡易爬蟲

WBOY
發布: 2016-07-25 09:08:50
原創
1049 人瀏覽過
  1. function get_urls($url)
  2. {
  3. $url_array=array();
  4. $the_first_content=file_get_contents($url);
  5. $the_second_content=file_get_contents($url);
  6. $pattern1 = "/http://[a-zA-Z0-9.?/-=&:+-_'"]+/";
  7. $pattern2="/http://[a-zA-Z0-9.]+/";
  8. preg_match_all($pattern2, $the_second_content, $matches2);
  9. preg_match_all($pattern1, $the_first_content, $matches1);
  10. $new_array1=array_unique($matches1[0]);
  11. $new_array2=array_unique($matches2[0]);
  12. $final_array=array_merge($new_array1,$new_array2);
  13. $final_array=array_unique($final_array);
  14. for($i=0;$i {
  15. echo $final_array[$i]."
    ";
  16. }
  17. }
  18. get_urls("http://www.baidu.com");
复制代码


相關標籤:
來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板