Heim > Java > javaLernprogramm > Wie extrahiere ich Daten von Websites mit Java und Jsoup?

Wie extrahiere ich Daten von Websites mit Java und Jsoup?

Linda Hamilton
Freigeben: 2024-10-30 17:30:25
Original
244 Leute haben es durchsucht

How to Extract Data from Websites Using Java and Jsoup?

Website-Daten mit Java extrahieren

Um Informationen von einer Website in Ihr Java-Programm abzurufen, verwenden Sie einen HTML-Parser wie Jsoup. Die jQuery-ähnlichen CSS-Selektoren und die iterierbare Klasse von Jsoup, die eine Knotenliste (Elemente) darstellen, machen es zu einer bevorzugten Wahl.

Prozess:

  1. Erstellen Sie a Verbindung: Verwenden Sie die Methode Jsoup.connect(url), um eine Verbindung zur gewünschten Webseite herzustellen.
  2. Seite abrufen: Führen Sie die Methode get() auf der abzurufenden Verbindung aus Das HTML-Dokument der Seite.
  3. Parsen Sie das Dokument: Verwenden Sie die Methode select() von Jsoup mit geeigneten CSS-Selektoren, um die benötigten Daten zu extrahieren.

Beispiel (Abrufen von Fragen und Antworten aus Stack Overflow):

<code class="java">import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class WebsiteDataRetrieval {

    public static void main(String[] args) throws Exception {
        String url = "https://stackoverflow.com/questions/2835505";
        Document document = Jsoup.connect(url).get();

        // Extract the question
        String question = document.select("#question .post-text").text();
        System.out.println("Question: " + question);

        // Extract the answerers
        Elements answerers = document.select("#answers .user-details a");
        for (Element answerer : answerers) {
            System.out.println("Answerer: " + answerer.text());
        }
    }
}</code>
Nach dem Login kopieren

Dieses Beispiel gibt die Frage und die Liste der Antworten für die angegebene Stack Overflow-Frage aus.

Fehlerbehebung der NoSuchMethodError:

Der Fehler, der bei Jsoup auftritt, bezieht sich auf ein Problem in der von Ihnen verwendeten Version. Stellen Sie sicher, dass Sie mit einer aktuellen Version von Jsoup arbeiten, da dieses Problem dadurch behoben wurde. Stellen Sie außerdem sicher, dass sich in Ihrem Klassenpfad die Apache Commons-Bibliotheken befinden.

Das obige ist der detaillierte Inhalt vonWie extrahiere ich Daten von Websites mit Java und Jsoup?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage