Python は Web サイトの画像を取得し、指定されたフォルダーに配置します
コードをコピー コードは次のとおりです:
# -*-coding=utf-8 -*-
import urllib2
import urllib
importソケット
import os
import re
def Docment():
print u'ファイルをE:Python図に保存します(数字または文字を入力してください) )'
h=raw_input()
path=u'E:Python グラフ'+str(h)
os.path.exists(path) でない場合:
os.makedirs(path)
戻りパス
def getallurl(html):
reg=r"a href='(.*?.htm)'"
allurl= re.compile(reg)
allList = re.findall( allurl,html)
return allList
def getHTML(url):
url=url
req_header = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en -US; Gecko/20091201 Firefox/3.5.6'}
req_timeout = 20
html='cuowu'
try:
req = urllib2.Request (url,None ,req_header)
resp = urllib2.urlopen(req,None,req_timeout)
html = resp.read()
e:
print e.message e:
getHTML(url,fu)
return html
def getImg(html,path):
reg = r'img class=IMG_show border=0 src= としてのソケット .timeout を除く(.*? .jpg)'
imgre= re.compile(reg)
imgList = re.findall(imgre, html)
if imgList:
print 'ghasghg',path
imgList の imgurl の場合:
print imgurl
content2=urllib2.urlopen(imgurl).read()
with open(path+'/'+imgurl[-7:],'wb') コードとして:
code .write(content2)
else:
return 0
def getallurl(html):
reg=r"a href='(.*?.htm)'"
allurl= re .compile(reg)
allList = re.findall(allurl,html)
return allList
j=1
i=0
print u'URL を入力してください: '
ul =raw_input()
print u'ダウンロード開始'
print u'Page '+str(j)+u'
html=getHTML(ul)
allList=getallurl( html)
path=Docment()
getImg(html,path)
while i for lis in allList:
l=lis[i]
url=r 'http://www.umei.cc/p/gaoqing/rihan/'+lis
i=i+1
j=j+1
html=getHTML(url)
getImg( html,path)
print u'Page '+str(j)+u'
else:
print u'ダウンロード完了'