Maison > développement back-end > tutoriel php > Exemple d'analyse et de traitement HTML/XML pour le filtrage de contenu à l'aide de PHP

Exemple d'analyse et de traitement HTML/XML pour le filtrage de contenu à l'aide de PHP

WBOY
Libérer: 2023-09-12 10:24:01
original
761 Les gens l'ont consulté

Exemple danalyse et de traitement HTML/XML pour le filtrage de contenu à laide de PHP

Exemple d'utilisation de PHP pour analyser et traiter HTML/XML pour le filtrage de contenu

Introduction :
Dans le développement Web, nous devons souvent extraire du contenu spécifique de fichiers HTML ou XML, ou filtrer et filtrer le contenu de ceux-ci. . En tant que puissant langage de script côté serveur, PHP possède de nombreuses fonctions et classes intégrées pour le traitement HTML/XML, nous permettant d'analyser et de traiter facilement les fichiers HTML/XML. Cet article va vous montrer un exemple de la façon d'analyser et de traiter HTML/XML pour le filtrage de contenu à l'aide de PHP.

1. Analyse HTML/XML
En PHP, nous pouvons utiliser certaines fonctions et classes intégrées pour analyser les fichiers HTML/XML, telles que la fonction file_get_contents(), SimpleXMLElement code > Classe etc. <code>file_get_contents()函数、SimpleXMLElement类等。

示例一:解析HTML
我们假设有一个名为example.html的HTML文件,内容如下:

<html>
<body>
  <h1>欢迎来到我的网站</h1>
  <p>这是一个演示HTML解析的示例页面。</p>
  <ul>
    <li>列表项1</li>
    <li>列表项2</li>
    <li>列表项3</li>
  </ul>
</body>
</html>
Copier après la connexion

现在,我们希望从该HTML文件中提取<h1>标签和<ul>标签下的所有<li>标签。

<?php
$html = file_get_contents('example.html');

$dom = new DOMDocument();
$dom->loadHTML($html);

$h1 = $dom->getElementsByTagName('h1')->item(0)->nodeValue; // 提取<h1>标签内容

$liList = $dom->getElementsByTagName('li');
foreach ($liList as $li) {
    echo $li->nodeValue . "<br>"; // 遍历输出所有<li>标签内容
}
?>
Copier après la connexion

运行上述PHP代码,我们可以得到以下输出:

欢迎来到我的网站
列表项1
列表项2
列表项3
Copier après la connexion

示例二:解析XML
假设有一个名为example.xml

Exemple 1 : Analyse HTML

Nous supposons qu'il existe un fichier HTML nommé example.html avec le contenu suivant :

<books>
  <book>
    <title>PHP教程</title>
    <author>张三</author>
  </book>
  <book>
    <title>JavaScript教程</title>
    <author>李四</author>
  </book>
  <book>
    <title>Python教程</title>
    <author>王五</author>
  </book>
</books>
Copier après la connexion

Maintenant, nous voulons extraire le <h1&gt de ce fichier HTML. ; et toutes les balises <li> sous la balise <ul>.

<?php
$xml = file_get_contents('example.xml');

$dom = new SimpleXMLElement($xml);

foreach ($dom->book as $book) {
    $title = $book->title;
    $author = $book->author;
    
    echo "书名:$title,作者:$author<br>";
}
?>
Copier après la connexion

En exécutant le code PHP ci-dessus, nous pouvons obtenir le résultat suivant :

书名:PHP教程,作者:张三
书名:JavaScript教程,作者:李四
书名:Python教程,作者:王五
Copier après la connexion

Exemple 2 : Analyse XML

Supposons qu'il existe un fichier XML nommé example.xml avec le contenu suivant :

<?php
$input = "<p><strong>欢迎访问我们的网站!</strong></p>";
$output = strip_tags($input); // 过滤HTML标签
$output = htmlspecialchars($output); // 转义特殊字符

echo $output;
?>
Copier après la connexion

Maintenant, nous voulons extraire tous les titres de livres et auteurs de ce fichier XML.

欢迎访问我们的网站!
Copier après la connexion
Exécutez le code PHP ci-dessus, nous pouvons obtenir le résultat suivant :

rrreee
2. Filtrage de contenu

En plus d'analyser les fichiers HTML/XML, nous pouvons également utiliser PHP pour le filtrage de contenu. Ceci est souvent utilisé dans le développement Web pour filtrer les données soumises par les utilisateurs afin de prévenir les risques de sécurité potentiels.

Exemple 3 : Filtrage des balises HTML et des caractères spéciaux🎜Supposons que nous ayons un contenu texte soumis par l'utilisateur qui contient des balises HTML et des caractères spéciaux, et que nous souhaitons supprimer ou échapper ces balises et caractères. 🎜rrreee🎜Exécutez le code PHP ci-dessus, nous pouvons obtenir le résultat suivant : 🎜rrreee🎜 3. Résumé🎜Grâce aux exemples ci-dessus, nous avons appris comment utiliser PHP pour analyser et traiter HTML/XML, et comment effectuer un filtrage de contenu. Ces techniques sont très pratiques dans le développement Web et peuvent nous aider à extraire et traiter rapidement un contenu spécifique, ainsi qu'à garantir la sécurité des saisies des utilisateurs. 🎜🎜J'espère que cet article vous aidera à comprendre comment PHP analyse et traite le HTML/XML pour le filtrage de contenu ! Si vous avez des questions ou des suggestions, n'hésitez pas à nous contacter. Merci d'avoir lu! 🎜

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal