Rumah > Java > javaTutorial > Bagaimana untuk membaca kandungan halaman web di Java tanpa menggunakan mana-mana perpustakaan luaran?

Bagaimana untuk membaca kandungan halaman web di Java tanpa menggunakan mana-mana perpustakaan luaran?

王林
Lepaskan: 2023-09-02 08:45:08
ke hadapan
1091 orang telah melayarinya

Bagaimana untuk membaca kandungan halaman web di Java tanpa menggunakan mana-mana perpustakaan luaran?

Kelas URL pakej java.net mewakili Uniform Resource Locator yang digunakan untuk menunjukkan sumber (fail atau, direktori atau rujukan) dalam web seluruh dunia.

The openStream() kaedah kelas ini membuka sambungan ke URL yang diwakili oleh objek semasa dan mengembalikan objek InputStream yang menggunakan mana anda boleh membaca data daripada URL.

Oleh itu, untuk membaca data dari halaman web (menggunakan kelas URL) −

  • Segera kelas java.net.URL dengan menghantar URL halaman web yang diingini sebagai parameter kepada pembinanya.

  • Panggil kaedah openStream() dan dapatkan semula objek InputStream.

  • Instantia

    kelas dengan menghantar objek InputStream yang diambil di atas sebagai parameter.

Contoh

import java.io.IOException;
import java.net.URL;
import java.util.Scanner;
public class ReadingWebPage {
   public static void main(String args[]) throws IOException {
      //Instantiating the URL class
      URL url = new URL("http://www.something.com/");
      //Retrieving the contents of the specified page
      Scanner sc = new Scanner(url.openStream());
      //Instantiating the StringBuffer class to hold the result
      StringBuffer sb = new StringBuffer();
      while(sc.hasNext()) {
         sb.append(sc.next());
         //System.out.println(sc.next());
      }
      //Retrieving the String from the String Buffer object
      String result = sb.toString();
      System.out.println(result);
      //Removing the HTML tags
      result = result.replaceAll("<[^>]*>", "");
      System.out.println("Contents of the web page: "+result);
   }
}
Salin selepas log masuk

输出

<html><body><h1>Itworks!</h1></body></html>
Contents of the web page: Itworks!
Salin selepas log masuk
🎜

Atas ialah kandungan terperinci Bagaimana untuk membaca kandungan halaman web di Java tanpa menggunakan mana-mana perpustakaan luaran?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:tutorialspoint.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan