Symfony の Crawler コンポーネントを使用して、laravel で HTML_php インスタンスを分析する-PHPチュートリアル-php.cn

ホームページ

バックエンド開発

PHPチュートリアル

Symfony の Crawler コンポーネントを使用して、laravel で HTML_php インスタンスを分析する

微波

Jun 28, 2017 pm 03:40 PM

laravel symfony

この記事では、laravel で HTML を解析するための Symfony の Crawler コンポーネントの使用法を主に紹介します。必要な友人は参照してください。

Crawler の正式名は DomCrawler で、Symfony フレームワークのコンポーネントです。とんでもないのは、DomCrawler には中国語のドキュメントがなく、Symfony はこの部分を翻訳していないため、DomCrawler を使用した開発は少しずつしか探索できないことです。ここで使用プロセスの経験をまとめます。

最初に

composer require symfony/dom-crawler
composer require symfony/css-selector

ログイン後にコピー

css-seelctorをインストールします。これはcssセレクターでノードを選択するときにいくつかの関数が使用されます

マニュアルで使用されている例は

use Symfony\Component\DomCrawler\Crawler;
$html = <<<‘HTML‘
Hello World!
Hello Crawler!
HTML;
$crawler = new Crawler($html);
foreach ($crawler as $domElement)
{
var_dump($domElement->nodeName);
}

ログイン後にコピー

です

出力結果は

です。

string ‘html‘ (length=4)

ログイン後にコピー

そのため、HTMLコードのnodeNameはhtmlになっており、使い始めたときはプログラムが間違っているのではないかと思いました。。。

実際の使用プロセスで、新しいクローラ ($html) にコード化けの問題が発生する場合は、ページのエンコーディングに関連しているはずです。そのため、次の方法を使用して、最初にクローラを初期化してから、 node

$crawler = new Crawler();
$crawler->addHtmlContent($html);

ログイン後にコピー

addHtmlContent の 2 番目のパラメータは charset で、デフォルトは utf-8 です。

他の例については、公式ドキュメント http://symfony.com/doc/current/components/dom_crawler.html を参照してください

仕事で少し試した使用方法を記録してください

filterXPath( string $xpath)メソッド、マニュアルによると、このメソッドのパラメータは$xpathで、pやpなどのブロックがよく使われます。

echo $crawler->filterXPath(‘//body/p‘)->text();
echo $crawler->filterXPath(‘//body/p‘)->last()->text();

ログイン後にコピー

出力は最初と次の p タグブロックのテキストです

var_dump($crawler->filterXPath(‘//body‘)->html());

ログイン後にコピー

出力は本文の HTML です

foreach ($crawler->filterXPath(‘//body/p‘) as $i => $node) {
$c = new Crawler($node);
echo $c->filter(‘p‘)->text();
}

ログイン後にコピー

filterXPath は DOMElement ブロックの配列を取得し、各 DOMElement ブロックは新しいクローラーオブジェクトを使用して続行できますparsing

$nodeValues =
$crawler->filterXPath(‘//body/p‘)->each(function (Crawler $node, $i) {
return $node->text();
});

ログイン後にコピー

crawler は各ループを提供し、クロージャー関数を使用してコードを簡素化します。ただし、この方法で $nodeValues を記述すると配列になるため、さらに処理が必要になることに注意してください。

その他の用途

echo $crawler->filterXPath(‘//body/p‘)->attr(‘class‘);

ログイン後にコピー

最初のpタグに対応するclass属性の値「message」を取得できます

$crawler->filterXPath(‘//p[@class="样式"]‘)->filter(‘a‘)->attr(‘href‘);
$crawler->filterXPath(‘//p[@class="样式"]‘)->filter(‘a>img‘)->extract(array(‘alt‘, ‘href‘))

ログイン後にコピー

上記はタグ属性を取得する方法のいくつかです

filterはfilterXPathとは異なり、マニュアルにはcssと書いてありますが、セレクターはpのようなXPathノードに含まれる要素であることは理解しています。具体的な状況は実際の開発で試す必要があります。

一般的に、単純な HTML dom よりも DomCrawler の方が使いやすいと感じます。

上記は Crawler の基本的な機能です。さらに詳しい使用方法については、symfony マニュアルの Crawler 部分の機能を参照してください

http://api.symfony.com/3.2/Symfony/Component/DomCrawler/Crawler .html

Crawler の主な問題は、やはり使用例が少なすぎ、機能マニュアルにも使用例がないため、実際に使用して調べるしかありません。。。。

DomCrawler に関する symfony のドキュメント。いくつかの例があります

http://symfony.com/doc/current/components/dom_crawler.html

以上がSymfony の Crawler コンポーネントを使用して、laravel で HTML_php インスタンスを分析するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

ホットツール

ホットトピック

Gmailメールのログイン入り口はどこですか？

7347

Java チュートリアル

1627

CakePHP チュートリアル

1352

Laravel チュートリアル

1265

PHP チュートリアル

1214

Related knowledge

PHP vs. Flutter: モバイル開発に最適な選択 May 06, 2024 pm 10:45 PM

PHP と Flutter は、モバイル開発でよく使われるテクノロジです。 Flutter は、クロスプラットフォーム機能、パフォーマンス、ユーザーインターフェイスに優れており、高パフォーマンス、クロスプラットフォーム、カスタマイズされた UI を必要とするアプリケーションに適しています。 PHP は、クロスプラットフォームではなく、パフォーマンスが低いサーバー側アプリケーションに適しています。

PHP でオブジェクトリレーショナルマッピング (ORM) を使用してデータベース操作を簡素化するにはどうすればよいですか? May 07, 2024 am 08:39 AM

PHP でのデータベース操作は、オブジェクトをリレーショナルデータベースにマップする ORM を使用して簡素化されます。 Laravel の EloquentORM を使用すると、オブジェクト指向構文を使用してデータベースと対話できます。モデルクラスを定義したり、Eloquent メソッドを使用したり、実際にブログシステムを構築したりすることで ORM を使用できます。

PHP単体テストツールの長所と短所の分析 May 06, 2024 pm 10:51 PM

PHP 単体テストツール分析: PHPUnit: 大規模プロジェクトに適しており、包括的な機能を提供し、インストールが簡単ですが、冗長で遅い場合があります。 PHPUnitWrapper: 小規模プロジェクトに適しており、使いやすく、Lumen/Laravel に最適化されていますが、機能が限られており、コードカバレッジ分析は提供されず、コミュニティサポートも限られています。

Laravel - アーティザンコマンド Aug 27, 2024 am 10:51 AM

Laravel - アーティザンコマンド - Laravel 5.7 には、新しいコマンドを処理およびテストするための新しい方法が付属しています。これには職人コマンドをテストする新しい機能が含まれており、そのデモについては以下で説明します。

Laravel と CodeIgniter の最新バージョンの比較 Jun 05, 2024 pm 05:29 PM

Laravel 9 と CodeIgniter 4 の最新バージョンでは、更新された機能と改善が提供されます。 Laravel9はMVCアーキテクチャを採用しており、データベース移行、認証、テンプレートエンジンなどの機能を提供します。 CodeIgniter4 は、HMVC アーキテクチャを使用してルーティング、ORM、およびキャッシュを提供します。パフォーマンスの面では、Laravel9 のサービスプロバイダーベースの設計パターンと CodeIgniter4 の軽量フレームワークにより、優れたパフォーマンスが得られます。実際のアプリケーションでは、Laravel9 は柔軟性と強力な機能を必要とする複雑なプロジェクトに適しており、CodeIgniter4 は迅速な開発や小規模なアプリケーションに適しています。

Laravel と CodeIgniter のデータ処理機能はどのように比較されますか? Jun 01, 2024 pm 01:34 PM

Laravel と CodeIgniter のデータ処理機能を比較します。 ORM: Laravel はクラスとオブジェクトのリレーショナルマッピングを提供する EloquentORM を使用しますが、CodeIgniter は ActiveRecord を使用してデータベースモデルを PHP クラスのサブクラスとして表します。クエリビルダー: Laravel には柔軟なチェーンクエリ API がありますが、CodeIgniter のクエリビルダーはよりシンプルで配列ベースです。データ検証: Laravel はカスタム検証ルールをサポートする Validator クラスを提供しますが、CodeIgniter には組み込みの検証関数が少なく、カスタムルールの手動コーディングが必要です。実践例：ユーザー登録例はLarを示しています

PHPコードの単体テストと統合テスト May 07, 2024 am 08:00 AM

PHP 単体テストおよび統合テストガイド単体テスト: コードまたは関数の単一単位に焦点を当て、PHPUnit を使用して検証用のテストケースクラスを作成します。統合テスト: 複数のコードユニットがどのように連携するかに注意し、PHPUnit の setUp() メソッドと TearDown() メソッドを使用してテスト環境をセットアップおよびクリーンアップします。実際のケース: PHPUnit を使用して、データベースの作成、サーバーの起動、テストコードの作成など、Laravel アプリケーションの単体テストと統合テストを実行します。

Laravel と CodeIgniter ではどちらが初心者に優しいでしょうか? Jun 05, 2024 pm 07:50 PM

初心者にとって、CodeIgniter は学習曲線が緩やかで機能は少ないですが、基本的なニーズはカバーしています。 Laravel は幅広い機能セットを提供しますが、学習曲線はわずかに急になります。パフォーマンスの点では、Laravel と CodeIgniter はどちらも良好なパフォーマンスを示します。 Laravel にはより広範なドキュメントとアクティブなコミュニティサポートがあり、CodeIgniter はよりシンプルで軽量で、強力なセキュリティ機能を備えています。ブログアプリケーションを構築する実際のケースでは、Laravel の EloquentORM を使用するとデータ操作が簡素化されますが、CodeIgniter ではより手動の構成が必要になります。

See all articles

Symfony の Crawler コンポーネントを使用して、laravel で HTML_php インスタンスを分析する

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック