网页爬虫 - python爬虫用BeautifulSoup爬取~~元素并写入字典，但某些div下没有这一元素，导致自动写入下一条，如何解决？~~

Question

新手写二手车网站爬虫，爬卖价和原价，原价以&lt;s&gt;删除线形式放在&lt;p class="priType-s"&gt;下。但是遇到没有标记原价，也就是并没有&lt;s&gt;标签的情况下，会自动把下一个&lt;s&gt;内的信息写入上一条占...

大家讲道理 · Answer

Idea umum ialah menambah lebih banyak pemilih, menjadikannya kosong, dan kemudian anda membuat keputusan

大家讲道理 · Answer

prices0=soup.select('p.list > ul > li > p > p.priType-s > span> i')
prices1=soup.select('p.list > ul > li > p > p.priType-s > span + s')

Cubalah.
Jika ia masih tidak berkesan, saya akan mendapatkan keseluruhan perenggan untuk anda dan menggunakan regex untuk mengekstraknya

天蓬老师 · Answer

Cuba idea ini:
1. Setiap kereta terpakai akan mempunyai blok untuk dipamerkan,

..

dan seumpamanya
2. Di setiap blok, datang lagi Tangkap harga asal dan harga semasa
Dengan cara ini, titik harga seterusnya tidak akan diisi dengan harga asal kereta sebelumnya kerana kereta terpakai tidak mempunyai harga asal