Maison Java javaDidacticiel Comment utiliser la fonction JSoup pour l'analyse HTML en Java

Comment utiliser la fonction JSoup pour l'analyse HTML en Java

Jun 26, 2023 pm 01:41 PM
java jsoup html解析

HTML est la représentation de base des pages Web. Si vous souhaitez obtenir et manipuler le contenu d'un document HTML en Java, vous devez utiliser un outil d'analyse open source, tel que la fonction JSoup. JSoup est une bibliothèque Java de traitement de documents HTML. Elle fournit un moyen très simple d'extraire des données et des éléments spécifiques de documents HTML. Cet article présentera l'utilisation de JSoup en Java.

  1. Importer JSoup

Tout d'abord, vous devez importer la bibliothèque JSoup dans votre projet Java. Vous pouvez trouver et télécharger JSoup dans le référentiel central Maven. Une fois le téléchargement terminé, décompressez le fichier JSoup.jar et importez-le dans votre projet Java.

  1. Créez un objet Document de JSoup

Dans votre code Java, créez un objet Document pour lire et analyser des documents HTML. Vous pouvez utiliser la méthode connect() dans la bibliothèque JSoup pour spécifier le chemin de l'URL à analyser, et JSoup téléchargera, analysera automatiquement le document HTML et renverra un objet Document, par exemple :

String url = "https://www.example.com";
Document doc = Jsoup.connect(url).get();
Copier après la connexion
  1. Extraire les éléments HTML

Avec l'objet Document, vous pouvez extraire des éléments HTML spécifiques du document HTML. Vous pouvez utiliser la méthode select() de l'objet Document et transmettre la syntaxe du sélecteur CSS pour filtrer les éléments souhaités, par exemple :

Element elementById = doc.select("#example-id").first();
Elements elementsByClass = doc.select(".example-class");
Copier après la connexion

Le code ci-dessus obtient les éléments correspondants via l'ID et le nom de classe respectivement. Vous pouvez également utiliser d'autres sélecteurs tels que le nom de balise, la valeur d'attribut ou le nom d'attribut.

  1. Manipulation des éléments HTML

Une fois que vous avez obtenu les éléments correspondants du document HTML, vous pouvez manipuler davantage ces éléments. Vous pouvez utiliser la méthode text() de l'objet Element pour obtenir le contenu textuel de l'élément, par exemple :

String textById = elementById.text();
String textByClass = elementsByClass.text();
Copier après la connexion

Vous pouvez également utiliser la méthode attributs() de l'objet Element pour obtenir les valeurs d'attribut de l'élément .

Element element = doc.select("a").first();
String href = element.attributes().get("href");
Copier après la connexion
  1. Gestion des formulaires HTML

En plus d'obtenir des éléments HTML, JSoup fournit également des outils pratiques pour traiter les formulaires HTML. Vous pouvez utiliser des méthodes dans l'objet Document, telles que les méthodes select(), attr() et text() pour modifier les valeurs des éléments du formulaire.

Document doc = Jsoup.parse("<form action='/my-url' method='post'>"
        + "<input type='text' name='username'/>"
        + "<input type='password' name='password'/>"
        + "<input type='submit' value='Login'/>"
        + "</form>");

Element formElement = doc.select("form").first();
formElement.attr("action", "login.jsp");
formElement.select("[name=username]").attr("value", "myUsername");
formElement.select("[name=password]").attr("value", "myPassword");
Copier après la connexion
  1. Gestion des erreurs

Lorsque vous utilisez JSoup pour analyser des documents HTML, des exceptions se produisent parfois. Par conséquent, dans votre code Java, vous devez gérer les exceptions IOException et ParseException levées par JSoup. Ces exceptions peuvent être interceptées à l'aide de blocs Try-catch.

try {
    Document doc = Jsoup.connect("http://example.com").get();
} catch (IOException e) {
    e.printStackTrace();
} catch (ParseException e) {
    e.printStackTrace();
}
Copier après la connexion

Résumé

Ce qui précède explique comment utiliser la fonction JSoup pour l'analyse HTML. Grâce à JSoup, vous pouvez facilement obtenir et exploiter des documents HTML en Java. En incluant la bibliothèque JSoup dans votre projet Java et en utilisant les objets Document, les sélecteurs et les API de JSoup pour manipuler correctement les éléments, vous pouvez facilement effectuer des tâches telles que la récupération de données et la modification de formulaires HTML.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
2 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Repo: Comment relancer ses coéquipiers
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: Comment obtenir des graines géantes
4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Combien de temps faut-il pour battre Split Fiction?
3 Il y a quelques semaines By DDD

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Racine carrée en Java Racine carrée en Java Aug 30, 2024 pm 04:26 PM

Guide de la racine carrée en Java. Nous discutons ici du fonctionnement de Square Root en Java avec un exemple et son implémentation de code respectivement.

Nombre parfait en Java Nombre parfait en Java Aug 30, 2024 pm 04:28 PM

Guide du nombre parfait en Java. Nous discutons ici de la définition, comment vérifier le nombre parfait en Java ?, des exemples d'implémentation de code.

Générateur de nombres aléatoires en Java Générateur de nombres aléatoires en Java Aug 30, 2024 pm 04:27 PM

Guide du générateur de nombres aléatoires en Java. Nous discutons ici des fonctions en Java avec des exemples et de deux générateurs différents avec d'autres exemples.

Weka en Java Weka en Java Aug 30, 2024 pm 04:28 PM

Guide de Weka en Java. Nous discutons ici de l'introduction, de la façon d'utiliser Weka Java, du type de plate-forme et des avantages avec des exemples.

Numéro Armstrong en Java Numéro Armstrong en Java Aug 30, 2024 pm 04:26 PM

Guide du numéro Armstrong en Java. Nous discutons ici d'une introduction au numéro d'Armstrong en Java ainsi que d'une partie du code.

Numéro de Smith en Java Numéro de Smith en Java Aug 30, 2024 pm 04:28 PM

Guide du nombre de Smith en Java. Nous discutons ici de la définition, comment vérifier le numéro Smith en Java ? exemple avec implémentation de code.

Questions d'entretien chez Java Spring Questions d'entretien chez Java Spring Aug 30, 2024 pm 04:29 PM

Dans cet article, nous avons conservé les questions d'entretien Java Spring les plus posées avec leurs réponses détaillées. Pour que vous puissiez réussir l'interview.

Break or Return of Java 8 Stream Forach? Break or Return of Java 8 Stream Forach? Feb 07, 2025 pm 12:09 PM

Java 8 présente l'API Stream, fournissant un moyen puissant et expressif de traiter les collections de données. Cependant, une question courante lors de l'utilisation du flux est: comment se casser ou revenir d'une opération FOREAK? Les boucles traditionnelles permettent une interruption ou un retour précoce, mais la méthode Foreach de Stream ne prend pas directement en charge cette méthode. Cet article expliquera les raisons et explorera des méthodes alternatives pour la mise en œuvre de terminaison prématurée dans les systèmes de traitement de flux. Lire plus approfondie: Améliorations de l'API Java Stream Comprendre le flux Forach La méthode foreach est une opération terminale qui effectue une opération sur chaque élément du flux. Son intention de conception est

See all articles