拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。 网络人气名人讲师,...
実際にテストした結果、bs4 は属性の順序を変更するという結論になりました。
検査要素 Web ページのソース コードを表示します
検査要素
Web ページのソース コードを表示します
結果:
クラスと ID の順序が違うだけです。Chrome と Firefox を使用して同じ Web ページのソース コードを表示すると、順序も異なります。
誰もがデバッグを手伝ってもらえるように、質問者が Web サイトまたは自分のコードを投稿することをお勧めします。クローラーによってクロールされたコンテンツが静的ページとして保存され、ブラウザーで表示されるものと異なる場合は、相手のアンチクローラー メカニズムがそれを認識しているはずなので、サーバーは異なる情報を返します。 。クローラーを識別する方法はたくさんあります。ご不明な点がございましたら、お気軽にお問い合わせください。
投稿者は、Web サイトではユーザーが人間のブラウザーを操作しているのかクローラーを操作しているのかを識別できるため、すべてのソース コードを投稿することを推奨しています。
現在のコードを見ると、ヘッダー情報を追加することをお勧めします。 use-agent そのコード行です。
実際にテストした結果、bs4 は属性の順序を変更するという結論になりました。
1. ブラウザでページを右クリックし、次の項目を選択します。
2. Python3 プログラムでの比較:
リーリー結果:
リーリークラスと ID の順序が違うだけです。
Chrome と Firefox を使用して同じ Web ページのソース コードを表示すると、順序も異なります。
誰もがデバッグを手伝ってもらえるように、質問者が Web サイトまたは自分のコードを投稿することをお勧めします。クローラーによってクロールされたコンテンツが静的ページとして保存され、ブラウザーで表示されるものと異なる場合は、相手のアンチクローラー メカニズムがそれを認識しているはずなので、サーバーは異なる情報を返します。 。クローラーを識別する方法はたくさんあります。ご不明な点がございましたら、お気軽にお問い合わせください。
投稿者は、Web サイトではユーザーが人間のブラウザーを操作しているのかクローラーを操作しているのかを識別できるため、すべてのソース コードを投稿することを推奨しています。
現在のコードを見ると、ヘッダー情報を追加することをお勧めします。 use-agent そのコード行です。