首页 > php教程 > PHP源码 > php正则表达式取得内容所有链接

php正则表达式取得内容所有链接

PHP中文网
发布: 2016-05-23 17:09:20
原创
1569 人浏览过

跳至

1

2

3

4

5

6

7

function get_all_url($code){ 

 

        preg_match_all('/"' ]+)["|']?s*[^>]*>([^>]+)/i',$code,$arr); 

 

        return array('name'=>$arr[2],'url'=>$arr[1]); 

 

}

登录后复制

2. [代码]方法二

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

/**

 * date 2015-07-24

 * edit http://www.aichengxu.com/view/62054

 **/

 

$site=substr($url,0,strpos($url,"/",8));//站点

 

$base=substr($url,0,strrpos($url,"/")+1);//文件所在目录

 

$fp = fopen($url, "r" );//打开url

 

  

 

while(!feof($fp))$contents.=fread($fp,1024);//

 

$pattern="|href=['"]?([^ '"]+)['" ]|u";

 

  

 

preg_match_all($pattern,$contents, $regarr, preg_set_order);//匹配所有href=

 

for($i=0;$i<count($regarr);$i++){//遍历所有匹配

 

if(!eregi("://",$regarr[$i][1]))//是否是相对路径,即是否还有://

 

if(substr($regarr[$i][1],0,1)=="/")//是否是站点的根目录

 

   echo "link".($i+1).":".$site.$regarr[$i][1]."

";//根目录

 

else

 

   echo "link".($i+1).":".$base.$regarr[$i][1]."

";//当前目录

 

else

 

echo "link".($i+1).":".$regarr[$i][1]."

";//相对路径

 

}

 

fclose($fp);

登录后复制

           

       

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
最新问题
热门推荐
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板