Java での URLConnection のユーザー エージェントのカスタマイズ
Java で URLConnection を使用して Web コンテンツを取得する場合、多くの場合、カスタム ユーザー エージェントの設定が必要になります。正確な Web サイトのクローリングとユーザー シミュレーション。ただし、デフォルトの Java ランタイムは独自の識別子をユーザー エージェント文字列に追加します。これは、特定のシナリオでは望ましくない場合があります。
クエリ
Java 開発者が支援を求めましたランタイムによって「Java/1.5.0_19」サフィックスが追加されないユーザー エージェントを設定する場合。ユーザーは、setRequestProperty() を使用してユーザー エージェントを設定する方法を示すコード スニペットを提供しました。
解決策
幸いなことに、Java 1.6.30 以降では、 setRequestProperty("User-Agent", "") によるユーザー エージェントの設定は、追加の Java ランタイム情報を追加しなくても、問題なく機能します。これを実証するために、開発者は netcat を使用して受信 HTTP リクエストをリッスンし、カスタム ユーザー エージェントが Java サフィックスなしで正常に送信されたことを観察しました。
完全な実装
import java.io.IOException; import java.net.URL; import java.net.URLConnection; public class CustomUserAgent { public static void main(String[] args) throws IOException { URL url = new URL("http://localhost:8080/foobar"); URLConnection hc = url.openConnection(); hc.setRequestProperty("User-Agent", "Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.4; en-US; rv:1.9.2.2) Gecko/20100316 Firefox/3.6.2"); System.out.println(hc.getContentType()); } }
このアプローチを利用することで、開発者は Java 固有の不要な追加を行うことなく、Java で URLConnection のユーザー エージェントを効果的に設定でき、ユーザー エージェントの望ましい動作を保証できます。 Web スクレイピングまたはその他のコミュニケーション タスク。
以上がJava ランタイム識別子を使用せずに Java で URLConnections のカスタム ユーザー エージェントを設定する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。