PHP 简易爬虫
WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
Lepaskan: 2016-07-25 09:08:50
asal
1127 orang telah melayarinya
- function get_urls($url)
- {
- $url_array=array();
- $the_first_content=file_get_contents($url);
- $the_second_content=file_get_contents($url);
- $pattern1 = "/http:\/\/[a-zA-Z0-9\.\?\/\-\=\&\:\+\-\_\'\"]+/";
- $pattern2="/http:\/\/[a-zA-Z0-9\.]+/";
- preg_match_all($pattern2, $the_second_content, $matches2);
- preg_match_all($pattern1, $the_first_content, $matches1);
- $new_array1=array_unique($matches1[0]);
- $new_array2=array_unique($matches2[0]);
- $final_array=array_merge($new_array1,$new_array2);
- $final_array=array_unique($final_array);
- for($i=0;$i {
- echo $final_array[$i]."
";
- }
- }
- get_urls("http://www.baidu.com");
复制代码
|
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
-
2025-02-26 03:58:14
-
2025-02-26 03:38:10
-
2025-02-26 03:17:10
-
2025-02-26 02:49:09
-
2025-02-26 01:08:13
-
2025-02-26 00:46:10
-
2025-02-25 23:42:08
-
2025-02-25 22:50:13
-
2025-02-25 21:54:11
-
2025-02-25 20:45:11
Isu terkini
-
2025-03-21 13:39:34
-
2025-03-21 13:38:34
-
2025-03-21 13:37:19
-
2025-03-21 13:35:24
-
2025-03-21 13:34:32
Topik-topik yang berkaitan
Lagi>