Terdapat banyak cara untuk mendapatkan nilai elemen dalam crawler Berikut adalah beberapa kaedah biasa:
import re html = "<a href='https://www.example.com'>Example</a>" links = re.findall(r"<a.*?href=['\"](.*?)['\"].*?>(.*?)</a>", html) for link in links: url = link[0] text = link[1] print("URL:", url) print("Text:", text)
from bs4 import BeautifulSoup html = "<h1>This is a title</h1>" soup = BeautifulSoup(html, 'html.parser') titles = soup.find_all('h1') for title in titles: print("Title:", title.text)
from lxml import etree html = "<p>This is a paragraph.</p>" tree = etree.HTML(html) paragraphs = tree.xpath('//p') for paragraph in paragraphs: print("Text:", paragraph.text)
Ini adalah kaedah yang biasa digunakan bergantung pada ciri tapak web yang anda crawl dan struktur data.
Atas ialah kandungan terperinci Bagaimana untuk mendapatkan nilai elemen dalam crawler dalam python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!