设置 Java URLConnection 的用户代理
尝试使用 Java 和 URLConnection 解析网页并将用户代理设置为指定的值时,可以在末尾附加一个额外的“Java/1.5.0_19”。这是由于旧版 Java 的限制所致。
解决方案(Java 1.6.30 及更高版本)
在 Java 1.6.30 及更高版本中,此问题已解决已解决。使用 setRequestProperty("User-Agent", "Mozilla ...") 设置用户代理现在可以正常工作,无需附加 Java 版本。
验证
验证这样,您可以使用 netcat 监听端口,它会显示传入请求的原始 HTTP 标头。如果不设置用户代理,标题将显示:
GET /foobar HTTP/1.1 User-Agent: Java/1.6.0_30 Host: localhost:8080 Accept: text/html, image/gif, image/jpeg, *; q=.2, */*; q=.2 Connection: keep-alive
设置用户代理时,标题将显示:
GET /foobar HTTP/1.1 User-Agent: Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.4; en-US; rv:1.9.2.2) Gecko/20100316 Firefox/3.6.2 Host: localhost:8080 Accept: text/html, image/gif, image/jpeg, *; q=.2, */*; q=.2 Connection: keep-alive
示例代码 (Java 1.6.1) 30 )
下面的代码示例演示了如何正确设置用户代理:
import java.io.IOException; import java.net.URL; import java.net.URLConnection; public class TestUrlOpener { public static void main(String[] args) throws IOException { URL url = new URL("http://localhost:8080/foobar"); URLConnection hc = url.openConnection(); hc.setRequestProperty("User-Agent", "Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10.4; en-US; rv:1.9.2.2) Gecko/20100316 Firefox/3.6.2"); System.out.println(hc.getContentType()); } }
以上是如何正确设置Java URLConnection中的User-Agent?的详细内容。更多信息请关注PHP中文网其他相关文章!