ホームページ > バックエンド開発 > PHPチュートリアル > ディスカッション: PHP を使用してページをクロールするいくつかの方法

ディスカッション: PHP を使用してページをクロールするいくつかの方法

WBOY
リリース: 2016-07-25 08:58:34
オリジナル
1066 人が閲覧しました
  1. $url='http://t.qq.com';
  2. $lines_array=file($url);
  3. $lines_string=implode('',$lines_array);
  4. echo htmlspecialchars($lines_string);
コードをコピー

2. file_get_contents() 関数 file_get_contents と fopen を使用するには、allow_url_fopen を有効にする必要があります。 方法: php.ini を編集し、allow_url_fopen = On に設定します。allow_url_fopen がオフの場合、fopen も file_get_contents もリモート ファイルを開くことができません。

  1. $url='http://t.qq.com';
  2. $lines_string=file_get_contents($url);
  3. echo htmlspecialchars($lines_string);
コードをコピー

3. fopen()->fread()->fclose() モード

  1. $url='http://t.qq.com';
  2. $handle=fopen($url,"rb");
  3. $lines_string="";
  4. do{
  5. $data=fread($handle,1024);
  6. if(strlen($data)==0) {
  7. break;
  8. }
  9. $lines_string.=$data;
  10. }while(true);
  11. fclose($handle );
  12. echo htmlspecialchars($lines_string);
コードをコピー

4. curl を使用するには、curl を有効にするためのスペースが必要です。方法: Windows で php.ini を変更し、extension=php_curl.dll の前のセミコロンを削除し、ssleay32.dll と libeay32.dll を C:WINDOWSsystem32 にコピーします。Linux では、curl 拡張機能をインストールします。

  1. $url='http://t.qq.com';
  2. $ch=curl_init();
  3. $timeout=5;
  4. curl_setopt($ch, CURLOPT_URL, $url );
  5. curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
  6. curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
  7. $lines_string=curl_exec($ch);
  8. curl_close($ch);
  9. echo htmlspecialchars($lines_string);
コードをコピー

5. fsockopen() 関数ソケットモード ソケット モードが正しく実行できるかどうかは、サーバーの設定にも関係します。たとえば、ローカルの php ソケットでは http が有効になっていないため、テストには udp しか使用できません。それ。

  1. $fp = fsockopen("udp://127.0.0.1", 13, $errno, $errstr);
  2. if (!$fp) {
  3. echo "エラー: $errno - $errstr
    n"
  4. } else {
  5. fwrite($fp, "n")
  6. echo fread($fp, 26)
  7. fclose($fp)
  8. }
コードをコピー


ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート