この記事の例では、PHP が simple_html_dom を使用して HTML を解析する方法を説明します。詳細は次のとおりです:
今日は 2 つのクローラーを作成しました。1 つは Python を使用し、もう 1 つは PHP を使用します。正直に言うと、どちらの実装方法も非常に便利です。
オープンの使用について話しましょう。ソースクラス simple_html_dom HTML コードを解析します:
1. simple_html_dom:
http://sourceforge.net/projects/simplehtmldom/files/
をダウンロードするか、ここをクリックしてこのサイトからダウンロードします。
2. 使用例:
<?php // example of how to use basic selector to retrieve HTML contents include('../simple_html_dom.php'); // get DOM from URL or file $html = file_get_html('http://www.google.com/'); // find all link foreach($html->find('a') as $e) echo $e->href . '<br>'; // find all image foreach($html->find('img') as $e) echo $e->src . '<br>'; // find all image with full tag foreach($html->find('img') as $e) echo $e->outertext . '<br>'; // find all div tags with id=gbar foreach($html->find('div#gbar') as $e) echo $e->innertext . '<br>'; // find all span tags with class=gb1 foreach($html->find('span.gb1') as $e) echo $e->outertext . '<br>'; // find all td tags with attribite align=center foreach($html->find('td[align=center]') as $e) echo $e->innertext . '<br>'; // extract text from table echo $html->find('td[align="center"]', 1)->plaintext.'<br><hr>'; // extract text from HTML echo $html->plaintext; ?>
PHP 関連のコンテンツに興味のある読者は、このサイトの特別トピック「PHP コーディングおよびトランスコーディング操作スキルの概要」、「PHP オブジェクトの入門チュートリアル」を参照してください。 「Oriented Programming」、「PHP 算術演算スキルまとめ」、「PHP 配列 (Array) 演算スキル総まとめ」、「PHP 文字列 (string) の使い方まとめ」、「PHP データ構造とアルゴリズム チュートリアル」、「PHP プログラミング アルゴリズム」 summary」、「php正規表現 「数式の使い方まとめ」と「PHPデータベースの一般的な操作スキルまとめ」
この記事がPHPプログラミングの皆様のお役に立てれば幸いです。
上記では、PHP で HTML を解析するために simple_html_dom を使用する例を、関連する内容も含めて紹介しています。PHP チュートリアルに興味のある友人に役立つことを願っています。