php实现递归抓取网页类实例_PHP教程

WBOY
Freigeben: 2016-07-13 09:58:13
Original
995 Leute haben es durchsucht

php实现递归抓取网页类实例

 具体如下:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

class crawler{

private $_depth=5;

private $_urls=array();

function extract_links($url)

{

if(!$this->_started){

$this->_started=1;

$curr_depth=0;

}else{

$curr_depth++;

}

if($curr_depth_depth)

{

$data=file_get_contents($url);

if(preg_match_all('/((?:http|https)://(?:www.)*(?:[a-zA-Z0-9_-]{1,15}.+[a-zA-Z0-9_]{1,}){1,}(?:[a-zA-Z0-9_/.-?&:%,!;]*))/',$data,$urls12))

{

foreach($urls12[0] as $k=>$v){

$check=get_headers($v,1);

if(strstr($v,$url) && $check[0]=='HTTP/1.1 200 OK' && !array_search($v,$this->_urls) && $curr_depth_depth){

$this->_urls[]=$v;

$this->extract_links($v);

}

}

}

}

return $this->_urls;

}

}

?>

www.bkjia.comtruehttp://www.bkjia.com/PHPjc/978265.htmlTechArticlephp实现递归抓取网页类实例 具体如下: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 ?php class crawler{ private $_depth=5; private...
Verwandte Etiketten:
Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage