In diesem Artikel wird die Implementierungsmethode zum Herunterladen von Bildern in Python vorgestellt (supereinfach), die jetzt einen gewissen Referenzwert hat. Freunde in Not können darauf verweisen.
Der Herausgeber unten wird es erklären Hier ist ein Artikel darüber, wie man das Herunterladen von Bildern in Python implementiert (super einfach). Der Herausgeber findet es ziemlich gut, deshalb werde ich es jetzt mit Ihnen teilen und es allen als Referenz geben. Folgen wir dem Editor, um einen Blick darauf zu werfen.
Manchmal müssen wir Bilder im Internet finden und herunterladen, indem wir zum Speichern mit der rechten Maustaste klicken. Einige Bilder können nicht heruntergeladen werden, wenn Sie mit der rechten Maustaste klicken, oder es müssen viele Bilder heruntergeladen werden. In diesem Fall kann das Problem leicht gelöst werden!
1 Scraping
#coding=utf-8 import urllib def getHtml(url): page = urllib.urlopen(url) html = page.read() return html html = getHtml("https://tieba.baidu.com/p/5582243679") print html
Der Seitendatenerfassungsprozess definiert die Funktion getHtml(), deren Funktion darin besteht, eine URL an getHtml( zu übergeben ) und schließlich die gesamte Seite herunterladen.
2. Seitendatenfilterung
import re import urllib def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): reg = r'src="(.+?\.jpg)" pic_ext' imgre = re.compile(reg) imglist = re.findall(imgre,html) return imglist html = getHtml("https://tieba.baidu.com/p/5582243679") print getImg(html)
Bei der Seitendatenfilterung wird eine neue Funktion getImg definiert ( ), besteht die Funktion dieser Funktion darin, Bildadressen im JPG-Format herauszufiltern.
3. Bild-Download
#coding=utf-8 import urllib import re def getHtml(url): page = urllib.urlopen(url) html = page.read() return html def getImg(html): reg = r'src="(.+?\.jpg)" pic_ext' imgre = re.compile(reg) imglist = re.findall(imgre,html) x = 0 for imgurl in imglist: urllib.urlretrieve(imgurl,'%s.jpg' % x) x+=1 html = getHtml("https://tieba.baidu.com/p/5582243679") print getImg(html)
Erhalten Sie alle qualifizierten Bild-URLs über eine for-Schleife und verwenden Sie die URLlib Die Methode .urlretrieve() lädt die Remote-Daten auf die lokale Seite herunter und benennt sie um.
Das Folgende ist eine Ergänzung
wie folgt:
import urllib.request response = urllib.request.urlopen('http://www.jb51.net/g/500/600') cat_img = response.read() with open('cat_500_600.jpg','wb') as f: f.write(cat_img)
urlopen() Die Klammern können entweder eine Zeichenfolge oder ein Anforderungsobjekt sein. Wenn die Zeichenfolge übergeben wird, wird sie in ein Anforderungsobjekt umgewandelt. daher kann der Code
response = urllib.request.urlopen('http://www.jb51.net/g/500/600') auch als
req = urllib geschrieben werden. request .Request('http://www.jb51.net/g/500/600')
1. Antwort = urllib.request.urlopen(req)
2 , Getcode-Methode
Code mit open('cat_500_600.jpg','wb') as f:
f.write(cat_img) entspricht
1. f = open('cat_500_600.jpg','wb')
2. Versuchen Sie:
3 )
4. schließlich:
5.f.close()
Verwandte Empfehlungen:
Python ist einfaches Beispiel einer Methode zur Berechnung des Datei-MD5-Werts
Python einfache Methode zur Computersteuerung
Das obige ist der detaillierte Inhalt vonImplementierungsmethode zum Herunterladen von Bildern in Python (supereinfach). Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!