Wie scrape ich eine Javascript-Website mit Python?

WBOY
Freigeben: 2024-02-10 15:40:04
nach vorne
1125 Leute haben es durchsucht

如何用 Python 抓取 javascript 网站?

Frageninhalt

Ich versuche, eine Website zu crawlen. Ich habe versucht, beide Methoden zu verwenden, aber keine von beiden liefert mir den vollständigen Website-Quellcode, den ich suche. Ich versuche, Schlagzeilen aus der unten angegebenen Website-URL herauszusuchen.

Website: „https://www.todayonline.com/“

Hier sind zwei Methoden, die ich ausprobiert habe und fehlgeschlagen bin.

Methode 1: Schöne Suppe

tdy_url = "https://www.todayonline.com/"
page = requests.get(tdy_url).text
soup = beautifulsoup(page)
soup  # returns me a html with javascript text
soup.find_all('h3')

### returns me empty list []
Nach dem Login kopieren

Methode 2: Selen + beautifulsoup

tdy_url = "https://www.todayonline.com/"

options = Options()
options.headless = True

driver = webdriver.Chrome("chromedriver",options=options)

driver.get(tdy_url)
time.sleep(10)
html = driver.page_source

soup = BeautifulSoup(html)
soup.find_all('h3')

### Returns me only less than 1/4 of the 'h3' tags found in the original page source
Nach dem Login kopieren

Bitte helfen Sie. Ich habe versucht, andere Nachrichtenseiten zu crawlen, und das ist viel einfacher. Danke.


Richtige Antwort


Sie können über die API auf die Daten zugreifen (siehe Registerkarte „Netzwerk“):

Zum Beispiel

import requests
url = "https://www.todayonline.com/api/v3/news_feed/7"
data = requests.get(url).json()
Nach dem Login kopieren

Das obige ist der detaillierte Inhalt vonWie scrape ich eine Javascript-Website mit Python?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:stackoverflow.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage
Über uns Haftungsausschluss Sitemap
Chinesische PHP-Website:Online-PHP-Schulung für das Gemeinwohl,Helfen Sie PHP-Lernenden, sich schnell weiterzuentwickeln!