Blog Park ブログ内の画像をクロールするための小さなコードを書きました。このコードは一部のリンクでは有効ですが、一部のリンクはクロールされるとすぐにエラーを報告します。理由は何ですか?
図に示すように、画像は正しくクロールできます
URLを
その後、すぐにエラーを報告してください
解決してください、ありがとう!
Web ページのソース コードを見ると、エラー メッセージはすでに非常に明白です。一致する最初の画像は GIF 形式であり、まだ相対パスであるため、ダウンロードできないため、IOerror が表示されます。ダウンロードした場合、形式を JPG として指定したため、開くことができません。 したがって、必要なのは判断してフィルタリングすることだけです
もちろん、これは最も単純な判断にすぎませんが、2 番目のプログラムがエラーを報告しないようにすることができ、またアイデアも得られます。
Web ページのソース コードを見ると、エラー メッセージはすでに非常に明白です。一致する最初の画像は GIF 形式であり、まだ相対パスであるため、ダウンロードできないため、IOerror が表示されます。ダウンロードした場合、形式を JPG として指定したため、開くことができません。 したがって、必要なのは判断してフィルタリングすることだけです
リーリーもちろん、これは最も単純な判断にすぎませんが、2 番目のプログラムがエラーを報告しないようにすることができ、またアイデアも得られます。