html - 为什么BeautifulSoup find_all 返回的list都不是按照网页显示顺序排序的？

Question

我想爬糗百的段子，显示作者，和对应的段子，先只爬第一面 {代码...} print 结果： {代码...} html.fromstring xpath 也这样 {代码...} print 结果： {代码...} 但网页的实际显示顺序是: {代码...} 如何让返回的l...

大家讲道理 · Answer

应该是因为它页面的内容的排序是在变动的。他的排序是根据评论里面的个“好笑”数来排的，好笑数字接近的，顺序变化正常，而且有时有新的段子加入这页。你浏览器取得页面的时间，和爬虫爬取的时间不一样，看到的段子顺序不一样很正常。