首頁 > Java > java教程 > Java中如何在不使用任何外部程式庫的情況下讀取網頁內容?

Java中如何在不使用任何外部程式庫的情況下讀取網頁內容?

王林
發布: 2023-09-02 08:45:08
轉載
1091 人瀏覽過

Java中如何在不使用任何外部程式庫的情況下讀取網頁內容?

java.net 套件的 URL 類別表示統一資源定位器,用於指向資源(檔案或目錄或引用)萬維網。

這個類別的openStream()方法開啟一個到目前物件表示的URL的連接,並傳回一個InputStream對象,使用它你可以從URL 讀取資料。

因此,要從網頁中讀取資料(使用URL 類別) −

  • 透過傳遞以下內容來實例化java.net.URL 類別所需網頁的URL 作為其建構函數的參數。

  • ##呼叫openStream() 方法並檢索InputStream 物件。

  • 實例化透過將上面檢索到的InputStream 物件作為參數傳遞來建立Scanner 類別。

  • ##範例
import java.io.IOException;
import java.net.URL;
import java.util.Scanner;
public class ReadingWebPage {
   public static void main(String args[]) throws IOException {
      //Instantiating the URL class
      URL url = new URL("http://www.something.com/");
      //Retrieving the contents of the specified page
      Scanner sc = new Scanner(url.openStream());
      //Instantiating the StringBuffer class to hold the result
      StringBuffer sb = new StringBuffer();
      while(sc.hasNext()) {
         sb.append(sc.next());
         //System.out.println(sc.next());
      }
      //Retrieving the String from the String Buffer object
      String result = sb.toString();
      System.out.println(result);
      //Removing the HTML tags
      result = result.replaceAll("<[^>]*>", "");
      System.out.println("Contents of the web page: "+result);
   }
}
登入後複製

輸出

<html><body><h1>Itworks!</h1></body></html>
Contents of the web page: Itworks!
登入後複製

以上是Java中如何在不使用任何外部程式庫的情況下讀取網頁內容?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:tutorialspoint.com
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板