从网站上打印html后发现fieldset标签里的id属性和原网站上的属性不同,猜想可能是被js修改了这个id的值,试了很多办法都没有成功。主要是没办法获取被修改后的id的值
从图上可以看出,两者的id不同,请教大神,有什么办法能够获取被修改后的id的值吗?
全部代码贴在下面:
response = urllib.urlopen(url)
soup =BeautifulSoup(response,'lxml')
# text_que = soup.find_all('li',class_="QUES_LI")
print soup.prettify()
除非你了解他这个ID的生成规则,不然的话是无法直接获取的。
但是我们要过得修改后的值,确是有许多的方法。
一,先获取相关元素再定位,比如你可以获取父元素,然后再定位到子元素再获取他的ID值。
二,用正则匹配获取。只要变动的值的周围是固定的,就有方法获取。
请问这是什么网站