communauté

Apprendre

Bibliothèque d'outils

Outils d'IA

Loisirs

Français

Maison > développement back-end > tutoriel php > 用php解析html的实现代码_PHP教程

用php解析html的实现代码_PHP教程

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Libérer： 2016-07-21 15:25:05

original

844 Les gens l'ont consulté

最近想用php写一个爬虫，就需要解析html，在sourceforge上找到一个项目叫做PHP Simple HTML DOM Parser，它可以以类似jQuery的方式通过css选择器来返回指定的DOM元素，功能十分强大。
首先要在程序的开始引入simple_html_dom.php这个文件

复制代码代码如下:

include_once('simple_html_dom.php');

PHP Simple HTML DOM Parser提供了3种方式来创建DOM对象

复制代码代码如下:

 
// Create a DOM object from a string 
$html = str_get_html('Hello!'); 
// Create a DOM object from a URL 
$html = file_get_html('http://www.google.com/'); 
// Create a DOM object from a HTML file 
$html = file_get_html('test.htm'); 

得到DOM对象后就可以进行各种操作了

复制代码代码如下:

// Find all anchors, returns a array of element objects
$ret = $html->find('a');
// Find (N)th anchor, returns element object or null if not found (zero based)
$ret = $html->find('a', 0);
// Find lastest anchor, returns element object or null if not found (zero based)
$ret = $html->find('a', -1);
// Find all

with the id attribute
$ret = $html->find('div[id]');
// Find all

which attribute id=foo
$ret = $html->find('div[id=foo]');

这里可以使用各种css选择器，就像在jQuery中进行DOM操作一样，非常方便。此外，还有两个特殊的属性可以得到文本和注释的内容

复制代码代码如下:

 
// Find all text blocks 
$es = $html->find('text'); 
// Find all comment () blocks 
$es = $html->find('comment'); 

当然，还是类似于jQuery，PHP Simple HTML DOM Parser也支持链式操作，以及各种访问DOM元素的简单方法

复制代码代码如下:

 
// Example 
echo $html->find("#div1", 0)->children(1)->children(1)->children(2)->id; 
// or 
echo $html->getElementById("div1")->childNodes(1)->childNodes(1)->childNodes(2)->getAttribute('id'); 

Étiquettes associées：

html php 代码 Écrire exister 实现爬虫 utiliser de 解析 besoin

Article précédent：shopex中集成的站长统计功能的代码简单分析_PHP教程 Article suivant：PHP版国家代码、缩写查询函数代码_PHP教程

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Derniers articles par auteur

Qu'est-ce qu'une NullPointerException et comment y remédier ?

2024-10-22 09:46:29
De novice à codeur : votre voyage commence par les principes fondamentaux du C

2024-10-13 13:53:41
Débloquer le développement Web avec PHP : guide du débutant

2024-10-12 12:15:51
Démystifier C : un chemin clair et simple pour les nouveaux programmeurs

2024-10-11 22:47:31
Libérez votre potentiel de codage : programmation C pour les débutants absolus

2024-10-11 19:36:51
Libérez votre programmeur intérieur : C pour les débutants absolus

2024-10-11 15:50:41
Automatisez votre vie avec C : scripts et outils pour les débutants

2024-10-11 15:07:41
PHP Made Easy : vos premiers pas dans le développement Web

2024-10-11 14:21:21
Construisez n'importe quoi avec Python : un guide du débutant pour libérer votre créativité

2024-10-11 12:59:11
La clé du codage : libérer la puissance de Python pour les débutants

2024-10-11 12:17:31

Derniers numéros

用{?><?php}报错Erreur d'analyse : erreur de syntaxe, fin de fichier inattendue dans E:\web\WWW\web23\index1.php à la ligne 36

Depuis 1970-01-01 08:00:00

0

0

0

javascript - typescript 使用const 报Impossible de redéclarer une variable de portée bloc

Depuis 1970-01-01 08:00:00

0

0

0

Pourquoi mon ajax continue-t-il d'appeler une erreur ! ! ! ! !

Depuis 1970-01-01 08:00:00

0

0

0

Dans TodoDispatcher.js, une erreur TypeError : TodoDispatcher.regeist n'est pas une fonction se produit. Comment la résoudre ?

Depuis 1970-01-01 08:00:00

0

0

0

Comment puis-je ne recevoir aucune donnée ?

Depuis 1970-01-01 08:00:00

0

0

0

Rubriques connexes

Plus>

Recommandations populaires

Tutoriels populaires

Plus>

Tutoriels associés

Recommandations populaires

Derniers cours

Derniers téléchargements

Plus>

effets Web

Code source du site Web

Matériel du site Web

Modèle frontal