抓取1688网站内容不行,抓别的站可以。

WBOY
Freigeben: 2016-06-20 12:32:23
Original
730 Leute haben es durchsucht

测试网址
https://detail.1688.com/offer/520938481930.html?spm=a260k.635.199825914.5.MRicAH
要求能取到网页html代码即可。

我取到的始终只有一行
<script>top.location.href='/login.php';</script>
怀疑是做了防抓取的处理。


不管用什么方法,只要取得真正的商品页面html代码就行,谢谢。


回复讨论(解决方案)

看提示的意思是不是必须让登录 ?
如果用CURL模拟登录后再试呢。

curl_setopt($ch,CURLOPT_POSTFIELDS,$post_file);  ////传递一个作为HTTP "POST"操作的所有数据的字符串。
curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file);  /////把返回来的cookie信息保存在$cookie_jar文件中
curl_exec($ch);///执行
curl_close($ch);////关闭

看提示的意思是不是必须让登录 ?
如果用CURL模拟登录后再试呢。

curl_setopt($ch,CURLOPT_POSTFIELDS,$post_file);  ////传递一个作为HTTP "POST"操作的所有数据的字符串。
curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file);  /////把返回来的cookie信息保存在$cookie_jar文件中
curl_exec($ch);///执行
curl_close($ch);////关闭



你分析的有道理,可是对我并没有什么用,要能取到才行。
Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage
Über uns Haftungsausschluss Sitemap
Chinesische PHP-Website:Online-PHP-Schulung für das Gemeinwohl,Helfen Sie PHP-Lernenden, sich schnell weiterzuentwickeln!