Heim > Java > javaLernprogramm > Wie lese ich Webseiteninhalte in Java, ohne eine externe Bibliothek zu verwenden?

Wie lese ich Webseiteninhalte in Java, ohne eine externe Bibliothek zu verwenden?

王林
Freigeben: 2023-09-02 08:45:08
nach vorne
1091 Leute haben es durchsucht

Wie lese ich Webseiteninhalte in Java, ohne eine externe Bibliothek zu verwenden?

Die URL-Klasse des java.net-Pakets stellt einen Uniform Resource Locator dar, der verwendet wird, um auf eine Ressource (Datei, Verzeichnis oder Referenz) im World Wide Web zu verweisen.

Der openStream() Die -Methode dieser Klasse öffnet eine Verbindung zu der URL, die durch das aktuelle Objekt dargestellt wird, und gibt ein InputStream-Objekt zurück, mit dem Sie Daten von der URL lesen können.

Daher ist das Lesen von Daten von einer Webseite (mithilfe der URL-Klasse) −

  • Instanziieren Sie die Klasse java.net.URL, indem Sie die URL der gewünschten Webseite als Parameter an ihren Konstruktor übergeben.

  • Rufen Sie die openStream()-Methode auf und rufen Sie das InputStream-Objekt ab.

  • Instanziieren Sie den Scanner Klasse, indem Sie das oben abgerufene InputStream-Objekt als Parameter übergeben.

Beispiel

import java.io.IOException;
import java.net.URL;
import java.util.Scanner;
public class ReadingWebPage {
   public static void main(String args[]) throws IOException {
      //Instantiating the URL class
      URL url = new URL("http://www.something.com/");
      //Retrieving the contents of the specified page
      Scanner sc = new Scanner(url.openStream());
      //Instantiating the StringBuffer class to hold the result
      StringBuffer sb = new StringBuffer();
      while(sc.hasNext()) {
         sb.append(sc.next());
         //System.out.println(sc.next());
      }
      //Retrieving the String from the String Buffer object
      String result = sb.toString();
      System.out.println(result);
      //Removing the HTML tags
      result = result.replaceAll("<[^>]*>", "");
      System.out.println("Contents of the web page: "+result);
   }
}
Nach dem Login kopieren

输出

<html><body><h1>Itworks!</h1></body></html>
Contents of the web page: Itworks!
Nach dem Login kopieren

Das obige ist der detaillierte Inhalt vonWie lese ich Webseiteninhalte in Java, ohne eine externe Bibliothek zu verwenden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:tutorialspoint.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage