原文: php で Web ページのコンテンツを取得する方法の概要
?
Using php to Capture the実際の開発では、ページのコンテンツが非常に重要です。 簡単なコンテンツコレクターを作成したり、Web ページからコンテンツの一部を抽出したりする場合などに便利です。
?
?
キャプチャされたコンテンツは正規表現によって処理されます。フィルタリングを行うだけで、必要なコンテンツが得られます。興味のある方のために、ここでは紹介しません。 PHP を使用して Web ページのコンテンツをクロールする方法を使用しました。
1.file_get_contents
PHP コード
コードをコピー コードは次のとおりです:
< ;?php
$url = "http://www.jb51.net";
$contents = file_get_contents($url);
//中国語が文字化けする場合は以下を使用してくださいcode
// $getcontent = iconv("gb2312", "utf-8",$contents);
echo $contents;
< ;?php
$url = "http://www.jb51.net";
$contents = file_get_contents($url);
//中国語が文字化けする場合は以下を使用してくださいcode
// $getcontent = iconv("gb2312", "utf-8",$contents);
echo $contents;
2.curl PHP コード
コードをコピー コードは次のとおりです:
$url = "http://www.jb51.net";
$ch =curl_init();
$timeout = 5;
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER , 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout)
//ユーザー検出が必要な Web ページに次の 2 行を追加する必要があります
//curl_setopt($ch, CURLOPT_HTTPAUTH, CURLAUTH_ANY);
//curl_setopt($ch, CURLOPT_USERPWD, US_NAME.":".US_PWD);
$contents =curl_exec($ch); $ch);
echo $contents;
3.fopen->fread->fclose
$ch =curl_init();
$timeout = 5;
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER , 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout)
//ユーザー検出が必要な Web ページに次の 2 行を追加する必要があります
//curl_setopt($ch, CURLOPT_HTTPAUTH, CURLAUTH_ANY);
//curl_setopt($ch, CURLOPT_USERPWD, US_NAME.":".US_PWD);
$contents =curl_exec($ch); $ch);
echo $contents;
3.fopen->fread->fclose
PHP コード>
コードをコピー
$handle = fopen ("http:// www.jb51.net", "rb"); $contents = ""; do {
$data = fread($handle, 1024);
if (strlen($data) == 0) {
break;
}
$contents;
} while(true); 🎜>?>
注:
1. file_get_contents と fopen を使用して、allow_url_fopen を有効にします。方法: php.ini を編集し、allow_url_fopen = On に設定します。allow_url_fopen がオフの場合、fopen も file_get_contents もリモート ファイルを開くことができません。
2.curl を使用するには、curl を有効にするためのスペースが必要です。方法: Windows で php.ini を変更し、extension=php_curl.dll の前のセミコロンを削除し、ssleay32.dll と libeay32.dll を C:WINDOWSsystem32 にコピーします。Linux では、curl 拡張機能をインストールします。
if (strlen($data) == 0) {
break;
}
$contents;
} while(true); 🎜>?>
注:
1. file_get_contents と fopen を使用して、allow_url_fopen を有効にします。方法: php.ini を編集し、allow_url_fopen = On に設定します。allow_url_fopen がオフの場合、fopen も file_get_contents もリモート ファイルを開くことができません。
2.curl を使用するには、curl を有効にするためのスペースが必要です。方法: Windows で php.ini を変更し、extension=php_curl.dll の前のセミコロンを削除し、ssleay32.dll と libeay32.dll を C:WINDOWSsystem32 にコピーします。Linux では、curl 拡張機能をインストールします。