php を使用して HTTP リクエストを送信し、Web ページのデータをキャプチャする
php を使用して Http リクエストを送信し、Web ページ データをキャプチャします
j2ee または Android 開発を行ったことがある人なら、多かれ少なかれ Apache の HttpClient クラス ライブラリを使用したことがあるはずです。このクラス ライブラリは、非常に強力なサーバー側 HTTP リクエスト操作を提供します。開発時に使用すると非常に便利です。
最近、PHP開発をしていると、サーバー側でhttpリクエストを送って、それを処理してクライアントに返すという作業もソケットを使えばそれほど面倒ではないかもしれません。 PHPのクラスライブラリにHttpClientのようなものがないか調べてみました。
Google で、PHP に本当にそのようなクラス ライブラリがあることを発見しました。名前は HTTPClient です。一見すると、何年も更新されておらず、機能が制限されていることがわかりました。ああ。そこで、別のクラス ライブラリである Snoopy を見つけました。このクラス ライブラリについてはあまり知りませんでしたが、オンラインでの反応が非常に良かったので、これを使用することにしました。その API の使用法は Apache の HttpClient とは大きく異なりますが、それでも非常に使いやすいです。また、ページ内のフォームのみを取得する、またはすべてのリンクを取得するなど、多くの特別な目的のメソッドが提供されます。
include 'Snoopy.class.php'; $snoopy = new Snoopy(); $snoopy->fetch("http://www.baidu.com"); echo $snoopy->results;
上記の数行のコードを使用すると、Baidu ページを簡単にクロールできます。
もちろん、投稿フォームを送信する必要がある場合は、submit メソッドを使用してデータを送信できます。
同時に、リクエストヘッダー、対応するヘッダー、および Cookie 関連の操作関数も渡します。これは非常に強力です。
include "Snoopy.class.php"; $snoopy = new Snoopy(); $snoopy->proxy_host = "http://www.baidu.cn"; $snoopy->proxy_port = "80"; $snoopy->agent = "(compatible; MSIE 4.01; MSN 2.5; AOL 4.0; Windows 98)"; $snoopy->referer = "http://www.4wei.cn"; $snoopy->cookies["SessionID"] = '238472834723489'; $snoopy->cookies["favoriteColor"] = "RED"; $snoopy->rawheaders["Pragma"] = "no-cache"; $snoopy->maxredirs = 2; $snoopy->offsiteok = false; $snoopy->expandlinks = false; $snoopy->user = "joe"; $snoopy->pass = "bloe"; if($snoopy->fetchtext("http://www.baidu.cn")) { echo "<PRE>" . htmlspecialchars($snoopy->results) . "\n"; } else { echo "error fetching document: " . $snoopy->error . "\n"; }
この時点では、snoopy はページをクロールして戻すだけです。クロールされたページからデータを抽出したい場合は、あまり役に立ちません。ここで、php が HTML を解析するためのもう 1 つの優れたツールである phpQuery を見つけました。このツールが提供する操作方法は jquery とほぼ同じで、jquery に慣れている子供にとっては非常に簡単に使用できるはずです。 phpquery、さらには phpQuery ドキュメントはもう必要ありません..
Snoopy+PhpQuery を使用すると、Web ページのクローリングとデータ分析を簡単に実現できます。私も最近この分野で必要になり、Java で多くのことができることがわかりました。 . PHP でも同じことができます。
興味のある学生は、これらを使用して簡単な Web クローラーを作成してみることもできます。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック

PHP 8.4 では、いくつかの新機能、セキュリティの改善、パフォーマンスの改善が行われ、かなりの量の機能の非推奨と削除が行われています。 このガイドでは、Ubuntu、Debian、またはその派生版に PHP 8.4 をインストールする方法、または PHP 8.4 にアップグレードする方法について説明します。

CakePHP でデータベースを操作するのは非常に簡単です。この章では、CRUD (作成、読み取り、更新、削除) 操作について理解します。

ファイルのアップロードを行うには、フォーム ヘルパーを使用します。ここではファイルアップロードの例を示します。

CakePHP は、PHP 用のオープンソース フレームワークです。これは、アプリケーションの開発、展開、保守をより簡単にすることを目的としています。 CakePHP は、強力かつ理解しやすい MVC のようなアーキテクチャに基づいています。モデル、ビュー、コントローラー
