84669 人が学習中
152542 人が学習中
20005 人が学習中
5487 人が学習中
7821 人が学習中
359900 人が学習中
3350 人が学習中
180660 人が学習中
48569 人が学習中
18603 人が学習中
40936 人が学習中
1549 人が学習中
1183 人が学習中
32909 人が学習中
個人情報をクロールしてキャプチャできるため、クローラーは確かにログインしましたが、次の図の URL はキャプチャできません:
URL は http://write.blog.csdn.net/postlist です。これは csdn バックエンドです。
コードを投稿します。py2.7 用です。
上記のコードの出力は次のとおりです。 リーリー
ringa_lee
このアドレスは 302 ジャンプを返すため、返されたヘッダーの場所に基づいてリクエストを続行し、返されたコンテンツを分析して処理を続行する必要があります。ブラウザは、これらの 302 ジャンプを実行し、返された js などを実行するのに役立ちます。コンテンツを手動でキャプチャするには、自分で処理する必要があります。
Cookieを使用するだけです
このアドレスは 302 ジャンプを返すため、返されたヘッダーの場所に基づいてリクエストを続行し、返されたコンテンツを分析して処理を続行する必要があります。ブラウザは、これらの 302 ジャンプを実行し、返された js などを実行するのに役立ちます。コンテンツを手動でキャプチャするには、自分で処理する必要があります。
Cookieを使用するだけです