PHP Curl 情報収集はブラウザー収集をシミュレートします
今日、突然何かを収集したいと思いました。最初は問題ありませんでしたが、しばらくすると、問題がどこにあるのかわかりません。コードは次のとおりです。皆さん、アドバイスをお願いします。このアドレスの内容を収集してみてください: http://www .tianya.cn/43064769元々は面白いコンテンツが欲しかっただけなのですが、その後ページすら開けなくなりました
あなたのところでは集められないでしょうか
そうですね、集めすぎたかもしれませんね彼らには少し残念だ。ブラウザでは正常に開くことができますが、収集が機能しません。今すぐ収集を続ける方法はありますか?
実際、私のプログラムは十分に完璧ではないと感じています。そうしないと、ブラウザは動作しますが、プログラムが動作しません。プログラムのどこが完璧ではないのかわかりません。アドバイスをお願いします。 ! ! !
ここで改善することは何もありません。おそらく、頻繁に呼び出しすぎる可能性があります。どうやって呼んだのか分かりません。
ここには改善すべき点は何もありません、おそらくそれを頻繁に呼び出しすぎます。どうやって呼んだのか分かりません。
あまり頻繁ではないので、アドレスを入力して電話をかけました。
私はループ呼び出しを使用しました。途中で一時停止することはなく、ループは 100 回未満続きました。サイクルを一時停止しましたが、ピッキングを続行できない場合はどうすればよいですか?
わかりませんが、サーバーに大きな負荷がかかることは間違いありません。
明らかにブロックされています。一般的には、2 日後にサンプリングを続行できます。
ブラウザーを開くことができる場合は、パケットのキャプチャと検査を完全にシミュレートする必要があることを意味します。
ブラウザが開ける場合は、ブロックされていないことを意味します。パケット キャプチャ チェックの完全なシミュレーションは確実に機能します。
これは必ずしも真実ではありませんが、ブラウザは正常に開くことができます。しかし、データは収集できません。相手が疑似キャプチャであるかどうかを判断している可能性があります。