Python - クローラーがログインをシミュレートした後、csdn バックグラウンド記事リストをクロールする際に問題が発生しました
ringa_lee
ringa_lee 2017-05-18 10:51:59
0
2
1019

個人情報をクロールしてキャプチャできるため、クローラーは確かにログインしましたが、次の図の URL はキャプチャできません:

URL は http://write.blog.csdn.net/postlist です。これは csdn バックエンドです。

コードを投稿します。py2.7 用です。

リーリー

上記のコードの出力は次のとおりです。 リーリー

ringa_lee
ringa_lee

ringa_lee

全員に返信(2)
小葫芦

このアドレスは 302 ジャンプを返すため、返されたヘッダーの場所に基づいてリクエストを続行し、返されたコンテンツを分析して処理を続行する必要があります。ブラウザは、これらの 302 ジャンプを実行し、返された js などを実行するのに役立ちます。コンテンツを手動でキャプチャするには、自分で処理する必要があります。

いいねを押す +0
迷茫

Cookieを使用するだけです

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!