収集したデータを処理したり、PHP サーバー上で HTML ドキュメントを処理したりする場合、通常は正規表現を使用して必要な部分を取得します。
HTML ページで正規表現を使用しない方がよい理由は主に 3 つあります
1. 条件式を書くのが面倒
特に初心者にとってはよく見るものです「わからない」のキャラクターコメントを全部まとめると頭が爆発しそうになります。分離対象に明確な特徴がない場合、正規表現を記述するのはさらに面倒になります。
2. 非効率
PHP の場合、文字列関数で解決できる場合は、正規化を気にする必要はありません。正規表現を使用して 30K を超えるファイルを処理する場合、効率は保証されません。
3. phpQuery を使用する
jQuery を使用したことがある場合は、phpQuery を使用するとこれが可能になります。 jQuery の構文セレクターに従って、必要なデータをフィルターできます。
phpQuery は、php5 で新しく追加された DOMDocument をベースにしています。 DOMDocument は、html/xml を処理するために特別に使用されます。強力な xpath セレクターやその他の多くの html/xml 操作関数を提供し、html/xml の処理を非常に便利にします。
include 'phpQuery.php';
phpQuery::newDocumentFile('http://www.scutephp. com' );
$companies = pq('#hotcoms .coms')->find('div');
foreach($companies as $company)
{
echo pq( $company )->find('h3 a')->text()."
";
}
?>
概要
pq()は jQuery の $() に似ています
基本的に、すべての jQuery セレクターは phpQuery で使用できます。'.' を '->' に変更するだけです
phpQuery には、文字列を使用する方法と、ファイル (URL を含む) を選択するときは、
プロジェクトのアドレス: http://code.google.com/p/phpquery/
に注意してください。