Télécharger des images avec l'urllib de Python
Le téléchargement d'images à partir du Web est une tâche courante en Python. L'un des moyens les plus simples d'y parvenir consiste à utiliser le module urllib.
Dans ce cas particulier, l'objectif est de récupérer et de stocker un webcomic dans un dossier spécifique sur le bureau de l'utilisateur. Pour ce faire, le code utilise les étapes suivantes :
import urllib import os # Determine the starting comic number based on the number of existing files comicCounter = len(os.listdir('/file')) + 1 # Define a function to download a single comic def download_comic(url, comicName): image = urllib.URLopener() image.retrieve(url, comicName)
La fonction download_comic prend une URL et un nom de fichier et télécharge l'image à cette URL, en l'enregistrant sous le nom de fichier spécifié.
Pour gérer la boucle dans les bandes dessinées avec des noms de fichiers incrémentiels, le code utilise une boucle while et une série d'instructions conditionnelles basées sur le numéro de bande dessinée actuel pour générer l'URL et le nom de fichier appropriés :
while comicCounter <= 1000: if comicCounter < 10: comicNumber = str('0000000' + str(comicCounter)) comicName = str(comicNumber + ".jpg") url = str("http://www.gunnerkrigg.com//comics/" + comicName) comicCounter += 1 download_comic(url, comicName) print(url) elif 10 <= comicCounter < 100: # Similar logic for comic numbers in the range 10 to 99 elif 100 <= comicCounter < 1000: # Similar logic for comic numbers in the range 100 to 999 else: quit
Le code gère également les erreurs 404 potentielles rencontrées lors du téléchargement de bandes dessinées, en incrémentant un nombre d'erreurs et en imprimant un message si un numéro de bande dessinée spécifique n'est pas trouvé. Une fois toutes les bandes dessinées téléchargées, le script imprime un message de fin.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!