curl爬取页面出现invalid host是什么原因?

WBOY
發布: 2016-06-06 20:24:28
原創
1743 人瀏覽過

<code><?php //$curl=curl_init('http://www.baidu.com');//爬取正常
$curl=curl_init('http://jw.dhu.edu.cn/dhu/login_wz.jsp');//invalid host

curl_exec($curl);
curl_close($curl);
?></code>
登入後複製
登入後複製

我们学校教务处的网站jw.dhu.edu.cn/dhu/login_wz.jsp这个地址通过curl爬取时,返回INVALID HOST,目前测试的其他网站都可以正常爬取,是什么原因?我怀疑是学校网站禁止了访问请求?
另,在阿里云上出现同样错误,应该不是新浪云的问题。curl爬取页面出现invalid host是什么原因?

回复内容:

<code><?php //$curl=curl_init('http://www.baidu.com');//爬取正常
$curl=curl_init('http://jw.dhu.edu.cn/dhu/login_wz.jsp');//invalid host

curl_exec($curl);
curl_close($curl);
?></code>
登入後複製
登入後複製

我们学校教务处的网站jw.dhu.edu.cn/dhu/login_wz.jsp这个地址通过curl爬取时,返回INVALID HOST,目前测试的其他网站都可以正常爬取,是什么原因?我怀疑是学校网站禁止了访问请求?
另,在阿里云上出现同样错误,应该不是新浪云的问题。curl爬取页面出现invalid host是什么原因?

无效主机名,域名解析有问题。

这个地址可能是配在dns上面的,只能你们校园网内部访问,在外网和sinaapp上面访问不了。

测试了很多次,学校网站也可以正常访问,是不是被反爬虫了?

用户名或密码不能为空!

相關標籤:
來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板