ホームページ > バックエンド開発 > PHPチュートリアル > PHP で HTML を解析して、正規表現を使用せずに見出し間のテキストを抽出する方法

PHP で HTML を解析して、正規表現を使用せずに見出し間のテキストを抽出する方法

Susan Sarandon
リリース: 2024-12-07 22:58:13
オリジナル
987 人が閲覧しました

How to Parse HTML in PHP to Extract Text Between Headings Without Regular Expressions?

PHP HTML コードの解析

Q: PHP 変数に格納されている HTML コードを解析して見出し間のテキストを抽出するにはどうすればよいですか。正規表現を使用せずに?

A: PHP ドキュメント オブジェクトを使用します。モデル:

$DOM = new DOMDocument;
$DOM->loadHTML($html);
$items = $DOM->getElementsByTagName('h1');
for ($i = 0; $i < $items->length; $i++)
    echo $items->item($i)->nodeValue . "<br/>";
ログイン後にコピー

見出し間のコンテンツが必要な場合は、次の正規表現を使用します:

echo preg_replace("#<h1.*?>.*?</h1>#", "", $html);
ログイン後にコピー

以上がPHP で HTML を解析して、正規表現を使用せずに見出し間のテキストを抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート