python - 爬虫中的图片该怎么处理?

Question

如题，比如爬取新闻类，该新闻中含图片,图片该怎么处理，如果有多张图片呢 类似 {代码...} 或者 {代码...} 需要下载图片到本地?还是直接用该网站的图片源,如果要下载到本地,文字内容上又该怎么处理。 多谢各位的...

ringa_lee · Answer

保存や収集の必要がない場合（例えば、ウェブサイトが閉鎖されたり、元の画像が無効になる恐れがある場合）は、ウェブサイトの画像ソースを直接使用しても問題ありません。スペース、管理、または著作権の条件。もちろん、難易度も比較的低いです。

黄舟 · Answer

外部リンクできる場合はそうしてください。ただし、ホットリンクを避けるように注意してください。最も安全な方法は、ローカルにダウンロードすることです

ringa_lee · Answer

Bs4 を使用して対応するノードを選択でき、xpath も使用でき、必要なものを抽出できます

迷茫 · Answer

ローカルにダウンロードし、Web ページの src をローカルの相対ディレクトリに置き換えます

ringa_lee · Answer

ニュース?ポータルサイトには基本的にリーチ防止機能が備わっています

まず偽造されたリファラーをローカルにダウンロードしてから、元のテキストの画像アドレスをローカルのアドレスに置き換えることをお勧めします

巴扎黑 · Answer

http://blog.csdn.net/qq_34844199/article/details/51468841 これを読めば、すべてが明確になります