これに関連する問題は、Curl がページをクロールできないという点で少し難しいです。-PHPチュートリアル-php.cn

ホームページ

バックエンド開発

PHPチュートリアル

これに関連する問題は、Curl がページをクロールできないという点で少し難しいです。

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 13, 2016 pm 12:17 PM

cookie curl nbsp

この問題は少し難しく、curl ではページをクロールできません。

この投稿は、2015-03-07 15:57:23 に xroha によって最終編集されました Baidu Experience の URL (例: http://jingyan.baidu.com/article/e2284b2b24eeb2e2e6118dfd)。 html

ページのソースコードを直接見てみると、記事データがあります。
しかし、curlを使用すると記事の内容が正常に取得できません。
これはなぜですか? IP、オリジン、Cookieなどを偽造しましたが、それでも取得できません。
注: ローカルでキャプチャすることはできますが、サーバーにアップロードすることはできません。
SAE、Alibaba Cloud、Business China のスペースの 3 つのサーバーをテストしましたが、取得できません。
Baidu はデータクロールを防ぐために何を使用していますか?どうやってそれを破るのですか？

コードは次のとおりです:

<br />function fcontents( $url, $timeout = 5, $referer = "" ){<br />    $t = parse_url($url);<br />    $ch = curl_init();<br />    $header = array (<br />        'User-Agent: Mozilla/5.0 (Windows NT 5.2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.1.1916.153 Safari/537.36','X-FORWARDED-FOR:154.135.25.15', 'CLIENT-IP:154.135.25.15'<br />    );<br />    $cookie_jar = dirname(__FILE__)."/jy.cookie";<br />    curl_setopt($ch, CURLOPT_URL, $url);<br />    curl_setopt($ch, CURLOPT_TIMEOUT, $timeout);<br />    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);<br />    curl_setopt($ch, CURLOPT_HTTPHEADER, $header);<br />    curl_setopt($ch, CURLOPT_REFERER, "http://$t[host]/");   //构造来路 <br />    curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_jar);<br />    curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_jar);<br />    curl_setopt($ch, CURLOPT_HEADER, 0);<br />    $result = curl_exec($ch);<br />    curl_close($ch);<br />    return $result;<br />}<br />

ログイン後にコピー

-----ソリューションのアイデア-------- - ----------
それらはすべてcurlをサポートしていますか?
------解決策----------------------
Baidu はあなたの IP アクセス頻度を感知します非常に疑わしい
または複雑な Cookie 検証プロセスがあります
-----ソリューションのアイデア----------------------
1. ローカルでは動作するが、サーバーでは動作しない場合。プログラムには問題ありません。
2.SAE、Alibaba Cloud、Business China Space
これらは、curl をサポートしていますか? 他のアドレスを収集してみましたか?
3. これらのサーバーはこの期間中に Baidu を収集したため、ブロックされた可能性があります。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7368

Java チュートリアル

1628

CakePHP チュートリアル

1354

Laravel チュートリアル

1266

PHP チュートリアル

1214

Related knowledge

解決策: 組織では PIN を変更する必要があります。 Oct 04, 2023 pm 05:45 PM

ログイン画面に「組織から PIN の変更を求められています」というメッセージが表示されます。これは、個人のデバイスを制御できる組織ベースのアカウント設定を使用しているコンピューターで PIN の有効期限の制限に達した場合に発生します。ただし、個人アカウントを使用して Windows をセットアップした場合、エラーメッセージは表示されないのが理想的です。常にそうとは限りませんが。エラーが発生したほとんどのユーザーは、個人アカウントを使用して報告します。私の組織が Windows 11 で PIN を変更するように要求するのはなぜですか?アカウントが組織に関連付けられている可能性があるため、主なアプローチはこれを確認することです。ドメイン管理者に問い合わせると解決できます。さらに、ローカルポリシー設定が間違っていたり、レジストリキーが間違っていたりすると、エラーが発生する可能性があります。今すぐ

Windows 11 でウィンドウの境界線の設定を調整する方法: 色とサイズを変更する Sep 22, 2023 am 11:37 AM

Windows 11 では、新鮮でエレガントなデザインが前面に押し出されており、最新のインターフェイスにより、ウィンドウの境界線などの細部をカスタマイズして変更することができます。このガイドでは、Windows オペレーティングシステムで自分のスタイルを反映した環境を作成するのに役立つ手順について説明します。ウィンドウの境界線の設定を変更するにはどうすればよいですか? + を押して設定アプリを開きます。 Windows [個人用設定] に移動し、[色の設定] をクリックします。ウィンドウの境界線の色の変更設定ウィンドウ 11" width="643" height="500" > [タイトルバーとウィンドウの境界線にアクセントカラーを表示する] オプションを見つけて、その横にあるスイッチを切り替えます。 [スタート] メニューとタスクバーにアクセントカラーを表示するにはスタートメニューとタスクバーにテーマの色を表示するには、[スタートメニューとタスクバーにテーマを表示] をオンにします。

Windows 11 でタスクバーのサムネイルプレビューを有効または無効にする方法 Sep 15, 2023 pm 03:57 PM

タスクバーのサムネイルは楽しい場合もありますが、気が散ったり煩わしい場合もあります。この領域にマウスを移動する頻度を考えると、重要なウィンドウを誤って閉じてしまったことが何度かある可能性があります。もう 1 つの欠点は、より多くのシステムリソースを使用することです。そのため、リソース効率を高める方法を探している場合は、それを無効にする方法を説明します。ただし、ハードウェアの仕様が対応可能で、プレビューが気に入った場合は、有効にすることができます。 Windows 11でタスクバーのサムネイルプレビューを有効にする方法は? 1. 設定アプリを使用してキーをタップし、[設定] をクリックします。 Windows では、「システム」をクリックし、「バージョン情報」を選択します。「システムの詳細設定」をクリックします。 [詳細設定] タブに移動し、[パフォーマンス] の下の [設定] を選択します。「視覚効果」を選択します

Windows 11 でのディスプレイスケーリングガイド Sep 19, 2023 pm 06:45 PM

Windows 11 のディスプレイスケーリングに関しては、好みが人それぞれ異なります。大きなアイコンを好む人もいれば、小さなアイコンを好む人もいます。ただし、適切なスケーリングが重要であることには誰もが同意します。フォントのスケーリングが不十分であったり、画像が過度にスケーリングされたりすると、作業中の生産性が大幅に低下する可能性があるため、システムの機能を最大限に活用するためにカスタマイズする方法を知る必要があります。カスタムズームの利点: これは、画面上のテキストを読むのが難しい人にとって便利な機能です。一度に画面上でより多くの情報を確認できるようになります。特定のモニターおよびアプリケーションにのみ適用するカスタム拡張プロファイルを作成できます。ローエンドハードウェアのパフォーマンスの向上に役立ちます。画面上の内容をより詳細に制御できるようになります。 Windows 11の使用方法

Windows 11で明るさを調整する10の方法 Dec 18, 2023 pm 02:21 PM

画面の明るさは、最新のコンピューティングデバイスを使用する上で不可欠な部分であり、特に長時間画面を見る場合には重要です。目の疲れを軽減し、可読性を向上させ、コンテンツを簡単かつ効率的に表示するのに役立ちます。ただし、設定によっては、特に新しい UI が変更された Windows 11 では、明るさの管理が難しい場合があります。明るさの調整に問題がある場合は、Windows 11 で明るさを管理するすべての方法を次に示します。 Windows 11で明るさを変更する方法【10の方法を解説】シングルモニターユーザーは、次の方法でWindows 11の明るさを調整できます。これには、ラップトップだけでなく、単一のモニターを使用するデスクトップシステムも含まれます。はじめましょう。方法 1: アクションセンターを使用するアクションセンターにアクセスできる

iPhoneのSafariでプライベートブラウジング認証をオフにする方法は？ Nov 29, 2023 pm 11:21 PM

iOS 17 では、Apple はモバイルオペレーティングシステムにいくつかの新しいプライバシーおよびセキュリティ機能を導入しました。その 1 つは、Safari のプライベートブラウジングタブに対して 2 段階認証を要求する機能です。その仕組みとオフにする方法は次のとおりです。 iOS 17 または iPadOS 17 を実行している iPhone または iPad では、Safari でプライベートブラウズタブを開いていて、再度アクセスするためにセッションまたはアプリを終了する場合、Apple のブラウザでは Face ID/Touch ID 認証またはパスコードが必要になります。言い換えれば、ロックが解除されている iPhone または iPad を誰かが手に入れても、パスコードを知らなければプライバシーを閲覧することはできません。

Linux での CURL バージョンの更新に関するチュートリアル! Mar 07, 2024 am 08:30 AM

Linux でカールのバージョンを更新するには、以下の手順に従います。現在のカールのバージョンを確認します。まず、現在のシステムにインストールされているカールのバージョンを確認する必要があります。ターミナルを開き、次のコマンドを実行します。curl --version このコマンドは、現在のcurlバージョン情報を表示します。利用可能なcurlのバージョンを確認する:curlを更新する前に、利用可能な最新バージョンを確認する必要があります。 Curl の公式 Web サイト (curl.haxx.se) または関連ソフトウェアソースにアクセスして、curl の最新バージョンを見つけることができます。 Curl ソースコードをダウンロードする:curl またはブラウザを使用して、選択した CURL バージョンのソースコードファイル (通常は .tar.gz または .tar.bz2) をダウンロードします。

Win10/11 デジタルアクティベーションスクリプト MAS バージョン 2.2 がデジタルアクティベーションを再サポート Oct 16, 2023 am 08:13 AM

有名なアクティベーションスクリプト MAS2.2 バージョンでは、デジタルアクティベーションが再びサポートされています。このメソッドは @asdcorp とそのチームが考案したもので、MAS 作成者はそれを HWID2 と呼んでいます。 https://github.com/massgravel/Microsoft-Activation-Scripts から Gatherosstate.exe (オリジナルではなく、変更されたもの) をダウンロードし、パラメータを指定して実行し、AuthenticTicket.xml を生成します。まず元のメソッド: Gatherosstate.exePfn=xxxxxxx;DownlevelOriginalState=1 を確認し、次に最新のメソッド: Gatheros と比較します。

See all articles