已经把需要抓取的html写入txt,但是无法使用正则表达式抓取数据,抓取结果永远是空的,请问为什么会出现这种问题?
def zhengze():
material=open(r"c:\test.txt","r")
print(material.read())
pattern=re.compile(r"<p>")
joke=re.search(pattern,material.read())
print(joke)
这行代码应该是抓取整个html里所有的"<p>",但返回结果一直是none,为什么?
material.read()
你用了两次!!!你确定第二次能读到数据.
read() 方法是读取整个文件,读完文件指针应该到了文件末尾,再次读取就返回''了,建议这样写:
先把read()后的数据保存的变量里。