웹 크롤러 - Python을 사용하여 Blog Park 블로그의 사진을 크롤링하는 방법은 무엇입니까?
某草草
某草草 2017-05-18 10:45:39
0
1
828

Blog Park 블로그의 사진을 크롤링하기 위해 작은 코드를 작성했습니다. 이 코드는 일부 링크에 효과적이지만 일부 링크는 크롤링되자마자 오류를 보고합니다. 이유는 무엇입니까?

으아악

사진과 같이 이미지 크롤링이 제대로 가능합니다

URL을

로 변경하면 으아악

그러면 즉시 오류가 보고됩니다

해결해주세요, 감사합니다!

某草草
某草草

모든 응답(1)
我想大声告诉你

오류 메시지는 이미 매우 명확합니다. 웹 페이지의 소스 코드를 보면 일치하는 첫 번째 이미지가 GIF 형식이고 여전히 상대 경로이므로 다운로드할 수 없으므로 IOerror가 발생합니다. 다운로드한 경우에는 형식을 JPG로 지정했기 때문에 열 수 없습니다. 그러니 판단하고 필터링만 하면 됩니다

으아악

내가 추가한 곳을 보세요. 물론 이것은 가장 단순한 판단일 뿐이지만 두 번째 프로그램이 오류를 보고하지 않도록 보장할 수 있고 아이디어도 제공합니다!

최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!