实例解析Python如何实现爬取京东手机图片

零到壹度
发布: 2018-03-30 10:30:18
原创
2000 人浏览过

本文主要为大家分享一篇Python如何实现爬取京东手机图片的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧,希望能帮助到大家。

运行环境Python3.6.4
<span style="font-size: 14px; font-family: 微软雅黑, "Microsoft YaHei";">#爬取京东手机图片import re #导入re模块import urllib.request  #导入urllib.request模块def craw(url,page): #定义函数craw<br/>    html1 = urllib.request.urlopen(url).read() #调用urllib.request模块里的urlopen函数打开url链接,并且读取,最后赋值给html1<br/>    html1 = str(html1) #将html1网页内容变成字符串<br/>    pat1 = &#39;&#39;&#39;<p id="plist".+? <p class="page clearfix">&#39;&#39;&#39; #利用pat1正则表达式进行第一次信息过滤<br/>    result1 = re.compile(pat1).findall(html1)  #查找所有符合条件的信息<br/>    result1 = result1[0]<br/>    pat2 = &#39;&#39;&#39;<img width="220" height="220" data-img="1".+?"//(.+?\.jpg)">&#39;&#39;&#39;#".+?"组合可以匹配除换行外的任意字符,第二个正则表达式进行第二次过滤<br/>    imagelist = re.compile(pat2).findall(result1)<br/>    x = 1<br/>    for imageurl in imagelist:<br/>        imagename = "D:/Python35/myweb/part6/img1/"+"第"+str(page)+"页图"+str(x)+".jpg"<br/>        imageurl = "http://"+imageurl        try:<br/>            urllib.request.urlretrieve(imageurl,filename=imagename)        except urllib.error.URLError as e:            if hasattr(e,"code"):<br/>                x+=1<br/>            if hasattr(e,"reason"):<br/>                x+=1<br/>        x+=1for i in range(1,2):<br/>    url = "http://list.jd.com/list.html?cat=9987,653,655&page="+str(i)<br/>    craw(url,i)</span>
登录后复制

相关推荐:

python爬虫实践---爬取京东图片

京东手机图片爬取

实例爬取京东收集图片 

以上是实例解析Python如何实现爬取京东手机图片的详细内容。更多信息请关注PHP中文网其他相关文章!

相关标签:
来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!