Von JavaScript generierte Inhalte mit Jsoup abrufen
In dieser Situation stoßen Sie bei der Verwendung von Jsoup zum Parsen von Webseiten auf eine häufige Herausforderung: die Unfähigkeit um dynamisch von JavaScript generierte Inhalte abzurufen, nachdem die Seite geladen wurde.
Jsoup ist hauptsächlich als HTML konzipiert Parser, was bedeutet, dass er nur mit der statischen HTML-Struktur einer Webseite arbeitet, wie sie zum Zeitpunkt des Parsens vorhanden ist. Im Gegensatz zu einem Webbrowser fehlt ihm die Fähigkeit, JavaScript auszuführen und die resultierenden DOM-Änderungen zu erfassen.
Der gesuchte Inhalt – der Text im
Lösung:
Um diese Einschränkung zu überwinden, müssen Sie eine eingebettete Browserkomponente verwenden, die das JavaScript rendern und ausführen kann, wodurch das Der generierte Inhalt steht zum Parsen zur Verfügung. Zu diesem Zweck stehen mehrere Java-Bibliotheken zur Verfügung, wie zum Beispiel:
Sobald Sie eine eingebettete Browserkomponente in Ihre Java-Anwendung integriert haben, Sie können die Seite mit WebDriver, Selenium oder JWebUnit analysieren, das
Das obige ist der detaillierte Inhalt vonWie kann ich mit Jsoup JavaScript-generierte Inhalte abrufen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!