首页 php教程 php手册 PHP实现抓取网页的所有超链接的代码

PHP实现抓取网页的所有超链接的代码

Jun 21, 2016 am 08:57 AM

因为最近要做一个类似专业搜索引擎的东西,需要抓取网页的所有超链接。大家帮忙测试一下子,下面的代码是否可以针对所有的标准超链接。

通用HTML标准超链接参数取得正则表达式测试

因为最近要做一个类似专业搜索引擎的东西,需要抓取网页的所有超链接。
大家帮忙测试一下子,下面的代码是否可以针对所有的标准超链接。

测试代码如下:
 

<?php  
<br/>// --------------------------------------------------------------------------
<br>// File name   : Noname1.php
<br>// Description : 通用链接参数获取正则表达式测试
<br>// Requirement : PHP4 (http://www.php.net)
<br>// Copyright(C), HonestQiao, 2005, All Rights Reserved.
<br>// Author: HonestQiao (honestqiao@hotmail.com)
<br>// 参数说明:
<br>// $strSource: 包含标准链接的HTML网页
<br>// $strResult: 处理的结果
<br>// 附加说明:
<br>// 标准链接,使用<a></a>形势包含的链接
<br>// --------------------------------------------------------------------------
<br>$strSource = <a>t1</a>
<br><a>t2</a>
<br><a>t3</a>
<br><a>t4</a>
<br>HTML;
<br>preg_match_all('/<a.>(.+?)/sim', $strSource, $strResult, PREG_PATTERN_ORDER);
<br>for($i = 0; $i {
<br>    printf("%d href=(%s) title=(%s) \n", $i, $strResult[1][$i], $strResult[2][$i]);
<br>} 
<br>
<br>?></a.>
登录后复制



如果您的测试数据,符合标准链接,但是此处没有被处理出来,请告诉我测试数据,以及你的测试环境。

谢谢。
 



本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1658
14
CakePHP 教程
1415
52
Laravel 教程
1309
25
PHP教程
1257
29
C# 教程
1231
24