ホームページ > バックエンド開発 > PHPチュートリアル > PHPでWebページのコンテンツを取得する手順の概要

PHPでWebページのコンテンツを取得する手順の概要

WBOY
リリース: 2016-06-13 12:09:22
オリジナル
881 人が閲覧しました

php で Web ページのコンテンツを取得する方法の概要

原文: php で Web ページのコンテンツを取得する方法の概要

?

Using php to Capture the実際の開発では、ページのコンテンツが非常に重要です。 簡単なコンテンツコレクターを作成したり、Web ページからコンテンツの一部を抽出したりする場合などに便利です。

?

?

キャプチャされたコンテンツは正規表現によって処理されます。フィルタリングを行うだけで、必要なコンテンツが得られます。興味のある方のために、ここでは紹介しません。 PHP を使用して Web ページのコンテンツをクロールする方法を使用しました。
1.file_get_contents
PHP コード

コードをコピー コードは次のとおりです:

< ;?php
$url = "http://www.jb51.net";
$contents = file_get_contents($url);
//中国語が文字化けする場合は以下を使用してくださいcode
// $getcontent = iconv("gb2312", "utf-8",$contents);
echo $contents;


2.curl PHP コード

コードをコピー コードは次のとおりです:
$url = "http://www.jb51.net";
$ch =curl_init();
$timeout = 5;
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER , 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout)
//ユーザー検出が必要な Web ページに次の 2 行を追加する必要があります
//curl_setopt($ch, CURLOPT_HTTPAUTH, CURLAUTH_ANY);
//curl_setopt($ch, CURLOPT_USERPWD, US_NAME.":".US_PWD);
$contents =curl_exec($ch); $ch);
echo $contents;


3.fopen->fread->fclose

PHP コード>
コードをコピー

コードは次のとおりです:
$handle = fopen ("http:// www.jb51.net", "rb"); $contents = "";

do {
$data = fread($handle, 1024);
if (strlen($data) == 0) {
break;
}
$contents;
} while(true); 🎜>?>


注:
1. file_get_contents と fopen を使用して、allow_url_fopen を有効にします。方法: php.ini を編集し、allow_url_fopen = On に設定します。allow_url_fopen がオフの場合、fopen も file_get_contents もリモート ファイルを開くことができません。
2.curl を使用するには、curl を有効にするためのスペースが必要です。方法: Windows で php.ini を変更し、extension=php_curl.dll の前のセミコロンを削除し、ssleay32.dll と libeay32.dll を C:WINDOWSsystem32 にコピーします。Linux では、curl 拡張機能をインストールします。


関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート