已经把需要抓取的html写入txt,但是无法使用正则表达式抓取数据,抓取结果永远是空的,请问为什么会出现这种问题?
def zhengze():
material=open(r"c:\test.txt","r")
print(material.read())
pattern=re.compile(r"<p>")
joke=re.search(pattern,material.read())
print(joke)
这行代码应该是抓取整个html里所有的"<p>",但返回结果一直是none,为什么?
material.read()
Anda menggunakannya dua kali!!!Anda pasti anda boleh membaca data untuk kali kedua
Kaedah baca() adalah untuk membaca keseluruhan fail mencapai penghujung fail Again Reading kembali '', adalah disyorkan untuk menulis seperti ini:
Simpan data dahulu selepas baca() dalam pembolehubah.