PHP の cURL ライブラリを使用して、Web ページを簡単かつ効果的にクロールします。スクリプトを実行して、クロールした Web ページを分析するだけで、必要なデータをプログラムで取得できます。リンクから部分データを取得する場合でも、XML ファイルを取得してデータベースにインポートする場合でも、単に Web ページのコンテンツを取得する場合でも、cURL は強力な PHP ライブラリです。
PHPのCURL関数ライブラリ(Client URL Library Function)のよく使われる関数は以下の通りです:
- curl_close — Curl セッションを閉じる
- curl_copy_handle — Curl 接続リソースのすべてのコンテンツとパラメーターをコピーします
- curl_errno — 現在のセッションのエラー情報を含む数値を返します
- curl_error — 現在のセッションのエラー情報を含む文字列を返します
- curl_exec — Curl セッションを実行します
- curl_getinfo — Curl 接続リソース ハンドルに関する情報を取得します
- curl_init — Curl セッションを初期化します
- curl_multi_add_handle — 個々のcurlハンドルリソースをcurlバッチセッションに追加します
- curl_multi_close — バッチ ハンドル リソースを閉じる
- curl_multi_exec — Curl バッチ ハンドルを解析します
- curl_multi_getcontent — フェッチされた出力のテキスト ストリームを返します
- curl_multi_info_read — 現在解析されているcurlの関連する送信情報を取得します
- curl_multi_init — Curl バッチ ハンドル リソースを初期化します
- curl_multi_remove_handle — Curl バッチ ハンドル リソース内のハンドル リソースを削除します
- curl_multi_select — cURL 拡張機能に関連付けられたすべてのソケットを取得し、「選択」できます
- curl_setopt_array — Curl のセッションパラメータを配列として設定します
- curl_setopt — Curl のセッションパラメータを設定する
- curl_version — Curl 関連のバージョン情報を取得します
- curl_init() 関数の役割は、curl セッションを初期化することです。curl_init() 関数の唯一のパラメータは、URL アドレスを表します。
- curl_exec() 関数は、curl セッションを実行するために使用されます。唯一のパラメーターは、curl_init() 関数によって返されるハンドルです。
- curl_close() 関数は、curl セッションを閉じるために使用されます。唯一のパラメータは、curl_init() 関数によって返されるハンドルです。
基本的な例
リーリー
投稿データ
2 つのフォーム フィールドを受け入れます。1 つは電話番号、もう 1 つはテキスト メッセージの内容です。
リーリー
プロキシサーバーを使用する
リーリー
模擬ログイン
discuz プログラムへのログインをシミュレートします。
れーれー
http://www.bkjia.com/PHPjc/752496.htmlwww.bkjia.comtruehttp://www.bkjia.com/PHPjc/752496.html技術記事 PHP の cURL ライブラリを使用すると、Web ページを簡単かつ効果的にスクレイピングできます。スクリプトを実行して、クロールした Web ページを分析するだけで、必要なものをプログラムで取得できます...