ホームページ バックエンド開発 PHPチュートリアル PHP 解析 HTML クラス ライブラリ simple_html_dom (詳細な紹介)_PHP チュートリアル

PHP 解析 HTML クラス ライブラリ simple_html_dom (詳細な紹介)_PHP チュートリアル

Jul 21, 2016 pm 03:01 PM
dom html https php simple ダウンロード 導入 住所 クラスライブラリ 解析する 詳しい

ダウンロード アドレス: https://github.com/samacs/simple_html_dom

パーサーは、HTML ドキュメントの検証に役立つだけでなく、W3C 標準に準拠していない HTML ドキュメントも解析できます。 jQuery に似た要素セレクターを使用して、ID、クラス、タグなどで要素を検索し、ドキュメント ツリーを追加、削除、変更する機能も提供します。もちろん、このような強力な HTML Dom パーサーは完璧ではありません。使用中のメモリ消費には細心の注意が必要です。ただし、この記事では最後にメモリの過剰な消費を避ける方法を説明しますので、ご安心ください。
始めましょう
クラス ファイルをアップロードした後、このクラスを呼び出すには 3 つの方法があります:
URL から HTML ドキュメントをロードする
文字列から HTML ドキュメントをロードする
ファイルから HTML ドキュメントをロードする

コードをコピーするコードは次のとおりです:

// 新しいDomインスタンスを作成します
$html = new simple_html_dom();

// URLからロードします
$html->load_file('http://www .jb51 .net');

// Load
$html->load('文字列から HTML ドキュメントのデモをロード' );

/ /ファイルからロード
$html->load_file('path/file/test.html');
?>

文字列から HTML ドキュメントをロードする場合は、まずインターネットからダウンロードする必要があります。 cURL を使用して HTML ドキュメントを取得し、DOM にロードすることをお勧めします。
HTML 要素を検索する
検索関数を使用して、HTML ドキュメント内の要素を検索できます。返される結果は、オブジェクトを含む配列です。これらのオブジェクトにアクセスするには、HTML DOM 解析クラスの関数を使用します。次に、いくつかの例を示します。
コードをコピーします。 コードは次のとおりです。

//HTML 内のハイパーリンクを検索します。 document 要素
$a = $html->find('a');

//ドキュメント内の (N) 番目のハイパーリンクを検索し、見つからない場合は空の配列を返します
$a = $html-> ;find ('a', 0);

// ID main を持つ div 要素を検索します
$main = $html->find('div[id=main]',0);

// すべて検索しますid を持つ div 要素を含む要素attribute
$divs = $html->find('div[id]');

// id を含む要素をすべて検索しますattribute
$divs = $html->find('[id ]');
?>


jQuery のようなセレクターを使用して、位置指定された要素を見つけることもできます:

コードをコピーします コードは次のとおりです:
// Find id='#container' element
$ret = $html->find('#container');

// class=foo を持つすべての要素を検索
$ret = $html->find('.foo ');

// 複数の HTML タグを検索
$ret = $html->find('a, img');

// このように使うこともできます
$ret = $html->find ('a[title] , img[title]');
?>


パーサーはサブ要素の検索をサポートしています

コードをコピーします コードは次のとおりです:

// ul リスト内のすべてを検索 The li item
$ret = $html->find('ul li');

// ul リスト内で指定された class=selected を持つ li item を検索します
$ ret = $html->find('ul li.selected ');

?>


これを使うのが面倒な場合は、組み込み関数を使用して親要素、子要素を簡単に見つけることができます要素の隣接要素

コードをコピーします コードは次のとおりです:
// 親要素を返します
$e->parent;

// 配列を返します子要素の数
$e->children;

// 指定された子要素をインデックス番号で返します
$e-> ;children(0);

// 最初のリソース要素を返します
$e->first_child ();

// 最後の子要素を返す
$e->last _child ();

// 前の隣接する要素を返す
$e->prev_sibling ();

// 次の隣接する要素を返すelement
$e->next_sibling ();
?>


要素の属性操作
属性セレクターを操作するには、単純な正規表現を使用します。
[attribute] - 特定の属性を含む HTML 要素を選択します
[attribute=value] - 指定された値属性を持つすべての HTML 要素を選択します
[attribute!=value] - 指定されていない値属性を持つすべての HTML 要素を選択します
[attribute^ =value ] - 指定された値で始まる属性を持つすべての HTML 要素を選択します
[attribute$=value] 指定された値で終わる属性を持つすべての HTML 要素を選択します
[attribute*=value] - 指定された値を持つ属性を含むすべての HTML 要素を選択しますvalue
パーサーで呼び出されます 要素属性
DOM 内の要素属性もオブジェクトです:


コードをコピーします コードは次のとおりです:

// この例では、$a のアンカー リンク値を $link 変数に割り当てます
$link = $a->href;
?>

または:
コードをコピーします コードは次のとおりです:

$link = $html->find('a',0)->href;
?

各オブジェクトには 4 つの基本オブジェクトがあります。プロパティ:
tag – HTML タグ名を返します
innertext – innerHTML を返します
outertext – externalHTML を返します
plaintext – HTML タグ内のテキストを返します
パーサーで要素を編集します
要素属性の編集の使用法は、次の呼び出しと似ています:
コードをコピーします コードは次のとおりです:

//$a
$a->href = 'http://www. jb51.net';

//アンカーリンクを削除
$a->href = null;

//アンカーリンクが存在するか検出
if(isset($a->href)) {
//コード
}
?>

解析 コンテナ内の要素を追加または削除する特別な方法はありませんが、別の方法で使用できます。
コードをコピーします コードは次のとおりです。 ?php
// 要素
$e->outertext = '
' をカプセル化します。 $e->outertext '
';

// 要素を削除します
$e->outertext = '';

// 要素を追加します
$e->outertext = $e->outertext '
foo
';

// 要素を挿入します
$ e->outertext = '
foo
' . $e->outertext;
?


変更した HTML DOM ドキュメントの保存も非常に簡単です:


コードをコピーします。コードは次のとおりです:
$doc = $html;/ / Output
echo $doc;
?>




パーサーが大量のメモリを消費しないようにする方法

この記事の冒頭で、著者は Simple HTML DOM パーサーが大量のメモリを消費する問題について言及しました。 PHP スクリプトがメモリを大量に消費すると、Web サイトが応答を停止し、一連の深刻な問題が発生します。解決策も非常に簡単です。パーサーが HTML ドキュメントをロードして使用した後、必ずこのオブジェクトをクリーンアップしてください。もちろん、問題をあまり深刻に考えないでください。 2 ~ 3 枚の原稿しかセットされていない場合は、クリーニングしてもしなくても大きな違いはありません。 5 つ、10 つ、またはそれ以上のドキュメントをロードする場合、使用後にメモリをクリアするのは絶対にあなたの責任です ^_^
コードをコピーします

コードは次のとおりです:
$html ->クリア();?>




http://www.bkjia.com/PHPjc/327997.html
www.bkjia.com

本当http://www.bkjia.com/PHPjc/327997.html技術記事ダウンロード アドレス: https://github.com/samacs/simple_html_dom パーサーは、HTML ドキュメントの検証に役立つだけでなく、W3C 標準に準拠していない HTML ドキュメントも解析できます。 jQuer のようなものを使用します...
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Ubuntu および Debian 用の PHP 8.4 インストールおよびアップグレード ガイド Ubuntu および Debian 用の PHP 8.4 インストールおよびアップグレード ガイド Dec 24, 2024 pm 04:42 PM

PHP 8.4 では、いくつかの新機能、セキュリティの改善、パフォーマンスの改善が行われ、かなりの量の機能の非推奨と削除が行われています。 このガイドでは、Ubuntu、Debian、またはその派生版に PHP 8.4 をインストールする方法、または PHP 8.4 にアップグレードする方法について説明します。

PHP 開発用に Visual Studio Code (VS Code) をセットアップする方法 PHP 開発用に Visual Studio Code (VS Code) をセットアップする方法 Dec 20, 2024 am 11:31 AM

Visual Studio Code (VS Code とも呼ばれる) は、すべての主要なオペレーティング システムで利用できる無料のソース コード エディター (統合開発環境 (IDE)) です。 多くのプログラミング言語の拡張機能の大規模なコレクションを備えた VS Code は、

PHPでHTML/XMLを解析および処理するにはどうすればよいですか? PHPでHTML/XMLを解析および処理するにはどうすればよいですか? Feb 07, 2025 am 11:57 AM

このチュートリアルでは、PHPを使用してXMLドキュメントを効率的に処理する方法を示しています。 XML(拡張可能なマークアップ言語)は、人間の読みやすさとマシン解析の両方に合わせて設計された多用途のテキストベースのマークアップ言語です。一般的にデータストレージに使用されます

JSON Web Tokens(JWT)とPHP APIでのユースケースを説明してください。 JSON Web Tokens(JWT)とPHP APIでのユースケースを説明してください。 Apr 05, 2025 am 12:04 AM

JWTは、JSONに基づくオープン標準であり、主にアイデンティティ認証と情報交換のために、当事者間で情報を安全に送信するために使用されます。 1。JWTは、ヘッダー、ペイロード、署名の3つの部分で構成されています。 2。JWTの実用的な原則には、JWTの生成、JWTの検証、ペイロードの解析という3つのステップが含まれます。 3. PHPでの認証にJWTを使用する場合、JWTを生成および検証でき、ユーザーの役割と許可情報を高度な使用に含めることができます。 4.一般的なエラーには、署名検証障害、トークンの有効期限、およびペイロードが大きくなります。デバッグスキルには、デバッグツールの使用とロギングが含まれます。 5.パフォーマンスの最適化とベストプラクティスには、適切な署名アルゴリズムの使用、有効期間を合理的に設定することが含まれます。

母音を文字列にカウントするPHPプログラム 母音を文字列にカウントするPHPプログラム Feb 07, 2025 pm 12:12 PM

文字列は、文字、数字、シンボルを含む一連の文字です。このチュートリアルでは、さまざまな方法を使用してPHPの特定の文字列内の母音の数を計算する方法を学びます。英語の母音は、a、e、i、o、u、そしてそれらは大文字または小文字である可能性があります。 母音とは何ですか? 母音は、特定の発音を表すアルファベットのある文字です。大文字と小文字など、英語には5つの母音があります。 a、e、i、o、u 例1 入力:string = "tutorialspoint" 出力:6 説明する 文字列「TutorialSpoint」の母音は、u、o、i、a、o、iです。合計で6元があります

PHPでの後期静的結合を説明します(静的::)。 PHPでの後期静的結合を説明します(静的::)。 Apr 03, 2025 am 12:04 AM

静的結合(静的::) PHPで後期静的結合(LSB)を実装し、クラスを定義するのではなく、静的コンテキストで呼び出しクラスを参照できるようにします。 1)解析プロセスは実行時に実行されます。2)継承関係のコールクラスを検索します。3)パフォーマンスオーバーヘッドをもたらす可能性があります。

PHPマジックメソッド(__construct、__destruct、__call、__get、__setなど)とは何ですか? PHPマジックメソッド(__construct、__destruct、__call、__get、__setなど)とは何ですか? Apr 03, 2025 am 12:03 AM

PHPの魔法の方法は何ですか? PHPの魔法の方法には次のものが含まれます。1。\ _ \ _コンストラクト、オブジェクトの初期化に使用されます。 2。\ _ \ _リソースのクリーンアップに使用される破壊。 3。\ _ \ _呼び出し、存在しないメソッド呼び出しを処理します。 4。\ _ \ _ get、dynamic属性アクセスを実装します。 5。\ _ \ _セット、動的属性設定を実装します。これらの方法は、特定の状況で自動的に呼び出され、コードの柔軟性と効率を向上させます。

一致式(PHP 8)とそれがスイッチとどのように異なるかを説明します。 一致式(PHP 8)とそれがスイッチとどのように異なるかを説明します。 Apr 06, 2025 am 12:03 AM

PHP8では、一致式は、式の値に基づいて異なる結果を返す新しい制御構造です。 1)Switchステートメントに似ていますが、実行ステートメントブロックの代わりに値を返します。 2)一致式の式は厳密に比較され、セキュリティが向上します。 3)スイッチステートメントの脱落の可能性を回避し、コードのシンプルさと読みやすさを向上させます。

See all articles