python - 为什么正则表达式抓取不到数据?
高洛峰
高洛峰 2017-04-18 09:17:41
0
2
720

已经把需要抓取的html写入txt,但是无法使用正则表达式抓取数据,抓取结果永远是空的,请问为什么会出现这种问题?

def zhengze():

material=open(r"c:\test.txt","r")
print(material.read())
pattern=re.compile(r"<p>")
joke=re.search(pattern,material.read())
print(joke)

这行代码应该是抓取整个html里所有的"<p>",但返回结果一直是none,为什么?

高洛峰
高洛峰

拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。 网络人气名人讲师,...

membalas semua(2)
刘奇

material.read() Anda menggunakannya dua kali!!!
Anda pasti anda boleh membaca data untuk kali kedua
Kaedah baca() adalah untuk membaca keseluruhan fail mencapai penghujung fail Again Reading kembali '', adalah disyorkan untuk menulis seperti ini:

def zhengze():
    material=open(r"c:\test.txt","r")
    res = material.read()
    print(res)
    pattern=re.compile(r"<p>")
    joke=re.search(pattern,res)
    print(joke)
伊谢尔伦

Simpan data dahulu selepas baca() dalam pembolehubah.

Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan