communauté

Apprendre

Bibliothèque d'outils

Outils d'IA

Loisirs

Français

Maison > développement back-end > tutoriel php > 网页爬虫 - 请问PHP怎么使用xpath解析html内容呢？

网页爬虫 - 请问PHP怎么使用xpath解析html内容呢？

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Libérer： 2016-06-06 20:44:21

original

1428 Les gens l'ont consulté

在网上查看了很多相关资料，但都是PHP用xpath解析xml的，请问PHP有没有相关的函数或是类库能解析html吗？谢谢

回复内容：

在网上查看了很多相关资料，但都是PHP用xpath解析xml的，请问PHP有没有相关的函数或是类库能解析html吗？谢谢

直接用zend-dom吧，方便多了！
http://framework.zend.com/manual/2.3/en/modules/zend.dom.query.html
引入不用教了吧？

<code>$url = 'http://www.baidu.com';
$ch = curl_init();
curl_setopt($ch, CURLOPT_FILE, fopen('php://stdout', 'w'));
curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
curl_setopt($ch, CURLOPT_URL, $url);
$html = curl_exec($ch); 
curl_close($ch);

// create document object model
$dom = new DOMDocument();
// load html into document object model
@$dom->loadHTML($html);
// create domxpath instance
$xPath = new DOMXPath($dom);
// get all elements with a particular id and then loop through and print the href attribute
$elements = $xPath->query('//*[@id="lg"]/img/@src');
foreach ($elements as $e) {
  echo ($e->nodeValue);
}</code>

Copier après la connexion

差不多这样的

Étiquettes associées：

html php xpath 网页爬虫

Article précédent：这段php得到用户IP的代码参数是哪来的？ Article suivant：WordPress 文章页面如何调用摘要？

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Derniers articles par auteur

Comment fonctionnent les LLM: pré-formation à la formation post-formation, réseaux de neurones, hallucinations et inférence

2025-02-26 03:58:14
J'ai combiné la blockchain et l'IA pour générer de l'art. Voici ce qui s'est passé ensuite.

2025-02-26 03:38:10
Ingénierie rapide avancée: chaîne de pensée (COT)

2025-02-26 03:17:10
Génération augmentée augmentée de récupération dans SQLite

2025-02-26 02:49:09
Comment utiliser un chauffeur à propulsion LLM pour construire votre propre API Node.js

2025-02-26 01:08:13
LLMS pour le codage en 2024: prix, performance et bataille pour le meilleur

2025-02-26 00:46:10
Invitant les modèles de langue de vision

2025-02-25 23:42:08
Comment mesurer la fiabilité de la réponse d'un modèle grand

2025-02-25 22:50:13
Une illusion de la vie

2025-02-25 21:54:11
Les scientifiques vont sérieux au sujet de grands modèles de langue reflétant la pensée humaine

2025-02-25 20:45:11

Derniers numéros

Expliquez comment implémenter la mise en cache dans PHP.

2025-03-21 13:39:34
Comment utilisez-vous la classe DateTime dans PHP?

2025-03-21 13:38:34
Expliquez le but des espaces de noms dans PHP.

2025-03-21 13:37:19
Quelle est la différence entre clone et __clone () dans PHP?

2025-03-21 13:35:24
Comment utilisez-vous la fonction spl_autoload_register ()?

2025-03-21 13:34:32

Rubriques connexes

Plus>

Recommandations populaires

Tutoriels populaires

Plus>

Tutoriels associés

Recommandations populaires

Derniers cours

Derniers téléchargements

Plus>

effets Web

Code source du site Web

Matériel du site Web

Modèle frontal