python - 爬虫中的图片该怎么处理?

Question

如题，比如爬取新闻类，该新闻中含图片,图片该怎么处理，如果有多张图片呢 类似 {代码...} 或者 {代码...} 需要下载图片到本地?还是直接用该网站的图片源,如果要下载到本地,文字内容上又该怎么处理。 多谢各位的...

ringa_lee · Answer

Jika tidak perlu simpan atau kumpul (contohnya, anda takut laman web akan ditutup atau imej asal menjadi tidak sah), anda boleh terus menggunakan sumber imej laman web tersebut. Tiada masalah dalam syarat ruang, pengurusan atau hak cipta. Sudah tentu, kesukaran melakukan ini juga agak rendah.

黄舟 · Answer

Jika anda boleh memaut secara luaran, lakukan, tetapi berhati-hati untuk mengelakkan hotlinking. Cara paling selamat ialah memuat turunnya secara setempat

ringa_lee · Answer

Anda boleh menggunakan Bs4 untuk memilih nod yang sepadan, xpath juga boleh digunakan, dan anda boleh mengekstrak apa sahaja yang anda mahu

迷茫 · Answer

Muat turun ke setempat, kemudian gantikan src dalam halaman web dengan direktori relatif setempat

ringa_lee · Answer

Berita? Laman portal pada asasnya mempunyai perlindungan anti-lintah

Adalah lebih baik untuk memuat turun Perujuk palsu secara setempat dahulu, dan kemudian menggantikan alamat imej dalam teks asal dengan alamat setempat

巴扎黑 · Answer

http://blog.csdn.net/qq_34844199/article/details/51468841 Selepas membaca ini, semuanya jelas