PHP は QueryList をどのように使用して、動的にレンダリングされた JS ページを簡単に収集しますか?
この章では、PHP で QueryList を使用して JS の動的レンダリング ページを簡単に収集する方法を紹介します?これには一定の参考値があります。必要な友人は参照できます。お役に立てば幸いです。
QueryList は収集に jQuery を使用し、豊富なプラグインを備えています。 QueryList が PhantomJS プラグインを使用して、JS によって動的に作成されたページ コンテンツをキャプチャすることを示します。
1. インストール
Composer を使用してインストールします:
1. QueryList をインストールします
composer require jaeger/querylist
GitHub : https://github.com/jae-jae/QueryList
2. PhantomJS プラグインをインストールします
composer require jaeger/querylist-phantomjs
GitHub: https://github .com/jae-jae/QueryList-PhantomJS
2.PhantomJS バイナリ ファイルをダウンロードします
PhantomJS 公式 Web サイト:http://phantomjs.org から、プラットフォームに対応する PhantomJS バイナリ ファイルをダウンロードします。
3. プラグイン API
QueryList ブラウザ($url,$debug = false,$commandOpt = []): で開きますブラウザ接続
4. 使用
# 「今日の頭条」のモバイル版を例に挙げます。 Toutiao は React フレームワークに基づいており、コンテンツは純粋に動的にレンダリングされます。
以下は、QueryList の PhantomJs プラグインの使用方法を示しています:
1. プラグインをインストールします
use QL\QueryList; use QL\Ext\PhantomJs; $ql = QueryList::getInstance(); // 安装时需要设置PhantomJS二进制文件路径 $ql->use(PhantomJs::class,'/usr/local/bin/phantomjs'); //or Custom function name $ql->use(PhantomJs::class,'/usr/local/bin/phantomjs','browser');
2.Example-1
Get動的にレンダリングされた HTML:
$html = $ql->browser('https://m.toutiao.com')->getHtml(); print_r($html);
すべての p タグのテキスト コンテンツを取得:
$data = $ql->browser('https://m.toutiao.com')->find('p')->texts(); print_r($data->all());
出力:
Array( [0] => 自拍模式开启!国庆假期我和国旗合个影 [1] => 你旅途已开始 他们仍在自己的岗位上为你的假期保驾护航 [2] => 喜极而泣,都教授终于回到地球了! //....)
http プロキシを使用:
// 更多选项可以查看文档: http://phantomjs.org/api/command-line.html $ql->browser('https://m.toutiao.com',true,[ // 使用http代理 '--proxy' => '192.168.1.42:8080', '--proxy-type' => 'http' ])
3.Example-2
複雑なリクエストをカスタマイズします:
$data = $ql->browser(function (\JonnyW\PhantomJs\Http\RequestInterface $r){ $r->setMethod('GET'); $r->setUrl('https://m.toutiao.com'); $r->setTimeout(10000); // 10 seconds $r->setDelay(3); // 3 seconds return $r; })->find('p')->texts(); print_r($data->all());
デバッグ モードをオンにして、Cookie ファイルをローカルにロードします:
$data = $ql->browser(function (\JonnyW\PhantomJs\Http\RequestInterface $r){ $r->setMethod('GET'); $r->setUrl('https://m.toutiao.com'); $r->setTimeout(10000); // 10 seconds $r->setDelay(3); // 3 seconds return $r; },true,[ '--cookies-file' => '/path/to/cookies.txt' ])->rules([ 'title' => ['p','text'], 'link' => ['a','href'] ])->query()->getData(); print_r($data->all());
以上がPHP は QueryList をどのように使用して、動的にレンダリングされた JS ページを簡単に収集しますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









PHP 8.4 では、いくつかの新機能、セキュリティの改善、パフォーマンスの改善が行われ、かなりの量の機能の非推奨と削除が行われています。 このガイドでは、Ubuntu、Debian、またはその派生版に PHP 8.4 をインストールする方法、または PHP 8.4 にアップグレードする方法について説明します。

CakePHP は、PHP 用のオープンソース フレームワークです。これは、アプリケーションの開発、展開、保守をより簡単にすることを目的としています。 CakePHP は、強力かつ理解しやすい MVC のようなアーキテクチャに基づいています。モデル、ビュー、コントローラー

ファイルのアップロードを行うには、フォーム ヘルパーを使用します。ここではファイルアップロードの例を示します。

Visual Studio Code (VS Code とも呼ばれる) は、すべての主要なオペレーティング システムで利用できる無料のソース コード エディター (統合開発環境 (IDE)) です。 多くのプログラミング言語の拡張機能の大規模なコレクションを備えた VS Code は、

CakePHP はオープンソースの MVC フレームワークです。これにより、アプリケーションの開発、展開、保守がはるかに簡単になります。 CakePHP には、最も一般的なタスクの過負荷を軽減するためのライブラリが多数あります。

このチュートリアルでは、PHPを使用してXMLドキュメントを効率的に処理する方法を示しています。 XML(拡張可能なマークアップ言語)は、人間の読みやすさとマシン解析の両方に合わせて設計された多用途のテキストベースのマークアップ言語です。一般的にデータストレージに使用されます
