网络爬虫 - python urlopen.read()不完整

Question

这个目的说来有点不忍启齿....不过抱着解决问题的态度，我还是提了这个问题：这个是原网页https://movie.douban.com/tag/%E6%83%85%E8%89%B2?start=0&amp;type=T 这个网页有20个电影，但我抓取的结果只有17个，我...

大家讲道理 · Answer

이 페이지에는 17개의 영화만 있습니다.
보충:
로그인하지 않은 경우 결과는 17입니다.
로그인하면 결과가 20개 입니다.
이 논리에 따르면 로그인을 시뮬레이션하면 이 문제를 해결할 수 있습니다.

怪我咯 · Answer

https://movie.douban.com/tag/%E6%83%85%E8%89%B2?start=0&type=T

이 페이지에는 17개의 영화만 있습니다

巴扎黑 · Answer

크롬의 xpath 복사 기능을 이용하여 마지막 영화인 17번째 영화의 xpath를 복사하세요.
//*[@id="content"]/p/p[1]/p[2]/ 테이블 [17]