LaravelでSymfonyのCrawlerコンポーネントを使用した分析例-PHPチュートリアル-php.cn

ホームページ

バックエンド開発

PHPチュートリアル

LaravelでSymfonyのCrawlerコンポーネントを使用した分析例

微波

Jun 28, 2017 am 11:44 AM

laravel symfony

この記事では、laravel で HTML を解析するための Symfony の Crawler コンポーネントの使用法を主に紹介します。必要な友人は参照してください。

Crawler の正式名は DomCrawler で、Symfony フレームワークのコンポーネントです。とんでもないのは、DomCrawler には中国語のドキュメントがなく、Symfony はこの部分を翻訳していないため、DomCrawler を使用した開発は少しずつしか探索できないことです。ここで使用プロセスの経験をまとめます。

最初に

composer require symfony/dom-crawler
composer require symfony/css-selector

ログイン後にコピー

css-seelctorをインストールします。これはcssセレクターでノードを選択するときにいくつかの関数が使用されます

マニュアルで使用されている例は

use Symfony\Component\DomCrawler\Crawler;
$html = <<<‘HTML‘
Hello World!
Hello Crawler!
HTML;
$crawler = new Crawler($html);
foreach ($crawler as $domElement)
{
var_dump($domElement->nodeName);
}

ログイン後にコピー

です

出力結果は

です。

string ‘html‘ (length=4)

ログイン後にコピー

そのため、HTMLコードのnodeNameはhtmlになっており、使い始めたときはプログラムが間違っているのではないかと思いました。。。

実際の使用プロセスで、新しいクローラ ($html) にコード化けの問題が発生する場合は、ページのエンコーディングに関連しているはずです。そのため、次の方法を使用して、最初にクローラを初期化してから、 node

$crawler = new Crawler();
$crawler->addHtmlContent($html);

ログイン後にコピー

addHtmlContent の 2 番目のパラメータは charset で、デフォルトは utf-8 です。

他の例については、公式ドキュメント http://symfony.com/doc/current/components/dom_crawler.html を参照してください

仕事で少し試した使用方法を記録してください

filterXPath( string $xpath)メソッド、マニュアルによると、このメソッドのパラメータは$xpathで、pやpなどのブロックがよく使われます。

echo $crawler->filterXPath(‘//body/p‘)->text();
echo $crawler->filterXPath(‘//body/p‘)->last()->text();

ログイン後にコピー

出力は最初と次の p タグブロックのテキストです

var_dump($crawler->filterXPath(‘//body‘)->html());

ログイン後にコピー

出力は本文の HTML です

foreach ($crawler->filterXPath(‘//body/p‘) as $i => $node) {
$c = new Crawler($node);
echo $c->filter(‘p‘)->text();
}

ログイン後にコピー

filterXPath は DOMElement ブロックの配列を取得し、各 DOMElement ブロックは新しいクローラーオブジェクトを使用して続行できますparsing

$nodeValues =
$crawler->filterXPath(‘//body/p‘)->each(function (Crawler $node, $i) {
return $node->text();
});

ログイン後にコピー

crawler は各ループを提供し、クロージャー関数を使用してコードを簡素化します。ただし、この方法で $nodeValues を記述すると配列になるため、さらに処理が必要になることに注意してください。

その他の用途

echo $crawler->filterXPath(‘//body/p‘)->attr(‘class‘);

ログイン後にコピー

最初のpタグに対応するclass属性の値「message」を取得できます

$crawler->filterXPath(‘//p[@class="样式"]‘)->filter(‘a‘)->attr(‘href‘);
$crawler->filterXPath(‘//p[@class="样式"]‘)->filter(‘a>img‘)->extract(array(‘alt‘, ‘href‘))

ログイン後にコピー

上記はタグ属性を取得する方法のいくつかです

filterはfilterXPathとは異なり、マニュアルにはcssと書いてありますが、セレクターはpのようなXPathノードに含まれる要素であることは理解しています。具体的な状況は実際の開発で試す必要があります。

一般的に、単純な HTML dom よりも DomCrawler の方が使いやすいと感じます。

上記は Crawler の基本的な機能です。さらに詳しい使用方法については、symfony マニュアルの Crawler 部分の機能を参照してください

http://api.symfony.com/3.2/Symfony/Component/DomCrawler/Crawler .html

Crawler の主な問題は、やはり使用例が少なすぎることと、機能マニュアルに使用例がないため、実際に使用して調べるしかありません。。。。

DomCrawler に関する symfony のドキュメント。いくつかの例が含まれています

http://symfony.com/doc/current/components/dom_crawler.html

上記は、laravel で Symfony の Crawler を使用するためのエディターによる HTML のコンポーネント分析の紹介です。ご質問がございましたら、メッセージを残してください。編集者がすぐに返信させていただきます。

以上がLaravelでSymfonyのCrawlerコンポーネントを使用した分析例の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

ホットツール

ホットトピック

Gmailメールのログイン入り口はどこですか？

7526

CakePHP チュートリアル

1378

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

Laravel と CodeIgniter の最新バージョンの比較 Jun 05, 2024 pm 05:29 PM

Laravel 9 と CodeIgniter 4 の最新バージョンでは、更新された機能と改善が提供されます。 Laravel9はMVCアーキテクチャを採用しており、データベース移行、認証、テンプレートエンジンなどの機能を提供します。 CodeIgniter4 は、HMVC アーキテクチャを使用してルーティング、ORM、およびキャッシュを提供します。パフォーマンスの面では、Laravel9 のサービスプロバイダーベースの設計パターンと CodeIgniter4 の軽量フレームワークにより、優れたパフォーマンスが得られます。実際のアプリケーションでは、Laravel9 は柔軟性と強力な機能を必要とする複雑なプロジェクトに適しており、CodeIgniter4 は迅速な開発や小規模なアプリケーションに適しています。

Laravel と CodeIgniter のデータ処理機能はどのように比較されますか? Jun 01, 2024 pm 01:34 PM

Laravel と CodeIgniter のデータ処理機能を比較します。 ORM: Laravel はクラスとオブジェクトのリレーショナルマッピングを提供する EloquentORM を使用しますが、CodeIgniter は ActiveRecord を使用してデータベースモデルを PHP クラスのサブクラスとして表します。クエリビルダー: Laravel には柔軟なチェーンクエリ API がありますが、CodeIgniter のクエリビルダーはよりシンプルで配列ベースです。データ検証: Laravel はカスタム検証ルールをサポートする Validator クラスを提供しますが、CodeIgniter には組み込みの検証関数が少なく、カスタムルールの手動コーディングが必要です。実践例：ユーザー登録例はLarを示しています

Laravel と CodeIgniter ではどちらが初心者に優しいでしょうか? Jun 05, 2024 pm 07:50 PM

初心者にとって、CodeIgniter は学習曲線が緩やかで機能は少ないですが、基本的なニーズはカバーしています。 Laravel は幅広い機能セットを提供しますが、学習曲線はわずかに急になります。パフォーマンスの点では、Laravel と CodeIgniter はどちらも良好なパフォーマンスを示します。 Laravel にはより広範なドキュメントとアクティブなコミュニティサポートがあり、CodeIgniter はよりシンプルで軽量で、強力なセキュリティ機能を備えています。ブログアプリケーションを構築する実際のケースでは、Laravel の EloquentORM を使用するとデータ操作が簡素化されますが、CodeIgniter ではより手動の構成が必要になります。

Laravel - アーティザンコマンド Aug 27, 2024 am 10:51 AM

Laravel - アーティザンコマンド - Laravel 5.7 には、新しいコマンドを処理およびテストするための新しい方法が付属しています。これには職人コマンドをテストする新しい機能が含まれており、そのデモについては以下で説明します。

Laravel と CodeIgniter: 大規模プロジェクトにはどちらのフレームワークが適していますか? Jun 04, 2024 am 09:09 AM

大規模プロジェクト用のフレームワークを選択する場合、Laravel と CodeIgniter にはそれぞれ独自の利点があります。 Laravel はエンタープライズレベルのアプリケーション向けに設計されており、モジュール設計、依存関係の注入、強力な機能セットを提供します。 CodeIgniter は、速度と使いやすさを重視した、小規模から中規模のプロジェクトに適した軽量フレームワークです。複雑な要件と多数のユーザーを伴う大規模なプロジェクトには、Laravel のパワーとスケーラビリティがより適しています。単純なプロジェクトやリソースが限られている状況では、CodeIgniter の軽量で迅速な開発機能がより理想的です。

Laravel と CodeIgniter: 小規模プロジェクトにはどちらのフレームワークが適していますか? Jun 04, 2024 pm 05:29 PM

小規模なプロジェクトの場合、Laravel は強力な機能とセキュリティを必要とする大規模なプロジェクトに適しています。 CodeIgniter は、軽量さと使いやすさを必要とする非常に小規模なプロジェクトに適しています。

Laravel と CodeIgniter ではどちらのテンプレートエンジンが優れていますか? Jun 03, 2024 am 11:30 AM

Laravel の Blade と CodeIgniter の Twig テンプレートエンジンを比較し、プロジェクトのニーズと個人的な好みに基づいて選択してください。Blade は MVC 構文に基づいており、適切なコード編成とテンプレートの継承を促進します。 Twig は、柔軟な構文、強力なフィルター、拡張サポート、セキュリティサンドボックスを提供するサードパーティライブラリです。