L'émergence de l'IA dans la génération d'images se développe plus rapidement aujourd'hui. Mais l'IA a d'autres utilisations potentielles. Par exemple, vous pouvez utiliser un modèle pour haut de gamme d'images générées; L'Aurasr est pratique pour accomplir ces tâches. L'une des meilleures caractéristiques de ce modèle est sa capacité à monter à l'échelle d'une image d'une faible résolution à une résolution plus élevée sans sacrifier la qualité d'image.Arasr est un modèle de super-résolution basé sur le GAN avec une sortie plus élevée que d'autres modèles d'image à image. Nous discuterons de certains aspects importants du fonctionnement de ce modèle.
Cet article a été publié dans le cadre du Blogathon de la science des données.
Ce modèle exploite des réseaux adversaires génératifs (GAN) aux images haut de gamme. Il prend une image à basse résolution en entrée et produit une version haute résolution de la même image. Il élargit cette image à quatre fois l'original mais remplit les détails d'entrée pour garantir que la sortie ne perd pas sa qualité.
Aurasr fonctionne parfaitement avec divers types d'images et formats. Vous pouvez améliorer les images dans les formats JPG, PNG, JPEG et WebP.
Il y a trois principaux attributs de ce modèle. Bien que nous explorerons principalement la fonction de mise à l'échelle, parlons brièvement des trois capacités de ce modèle;
Un facteur important dans l'efficacité de ce modèle est son architecture GAN pour la résolution d'image. Le modèle se compose de deux composantes principales: un générateur et un discriminateur. Le générateur crée des images à haute résolution à partir d'entrées à basse résolution, tandis que le discriminateur évalue les images générées contre de vraies images à haute résolution pour affiner les performances du générateur.
Ce «processus de formation contradictoire» est ce qui rend Aurasr efficace et exécute la capacité de comprendre les détails des images haute résolution. Le framework GAN d'AutoSR offre une vitesse dans le temps de traitement tout en conservant la qualité par rapport à la diffusion et aux modèles autorégressifs, qui peuvent être intensifs en calcul.
Les performances impressionnantes d'Aurasr proviennent de sa capacité à gérer divers facteurs d'échelle sans limites de résolution prédéfinies, ce qui le rend polyvalent pour différents besoins d'amélioration de l'image. Sa vitesse est une caractéristique remarquable: il peut générer une image de 1024 px en seulement 0,25 seconde.
Ce temps de traitement plus rapide, combiné à son évolutivité, fait d'Aurasr une solution très efficace pour les applications du monde réel nécessitant une augmentation d'image rapide et flexible.
L'exécution de l'inférence sur ce modèle est simplifiée avec moins d'exigences, de bibliothèques et de packages. Le modèle nécessite une image d'entrée avec une résolution inférieure, car elle produit une image à l'échelle. Voici les étapes;
Nous devons installer le package Aurasr dans Python pour faire fonctionner ce modèle. Vous pouvez le faire avec une seule commande, qui est le «! Pip Install» comme indiqué ci-dessous:
! Pip installer Aura-Sr
L'étape suivante consiste à importer la bibliothèque nécessaire, qui, dans ce cas, n'est que la bibliothèque AURA_SR pour l'instant. Nous devons également charger le modèle pré-formé, et cette configuration vous permet d'utiliser immédiatement le modèle Aurasr pour les tâches de mise à l'échelle d'image sans avoir à former le modèle vous-même.
de Aura_Sr Import Aurasr AURA_SR = AURASR.FROM_PRÉTRAINE ("FAL / AURASR-V2")
Demandes d'importation à partir d'Io Import Bytesio à partir de l'image d'importation PIL
Ce sont les autres bibliothèques qui peuvent aider avec les tâches de traitement d'image. La «demande» est essentielle pour télécharger une image à partir d'une URL, tandis que ByteSio permet au modèle de traiter l'image comme un fichier. Le PIL est un outil incroyable pour le traitement d'image dans les environnements Python, qui serait vital dans cette tâche.
Fonction pour exécuter ce modèle
def load_image_from_url (URL): réponse = requêtes.get (URL) image_data = byTesio (réponse.content) return image.open (image_data)
La fonction ici exécute une série de commandes pour effectuer cette tâche. Le premier consiste à télécharger l'image à partir d'une URL spécifique à l'aide de la commande 'LOAD_FROM_URL' et à la préparer au traitement. Ensuite, il récupère les images de l'URL. Il utilise Byteio pour gérer les images en tant que fichier en mémoire avant de les ouvrir et de les convertir en un format approprié pour le modèle.
image = load_image_from_url ("https://mingukkang.github.io/gigagan/static/images/iguana_output.jpg") .resize ((256, 256))) upscaled_image = AURA_SR.UPSCALE_4X_OVERLAPP (Image)
Ce code télécharge l'image d'entrée d'une URL, la redimensionne à 256 × 256 pixels à l'aide de la fonction LOAD_IMAGE_FROM_URL, puis l'améliore avec le modèle Aurasr. Vous pouvez améliorer l'image redimensionnée 4x, en garantissant des résultats de haute qualité en traitant des régions qui se chevauchent pour minimiser les artefacts.
Image originale
image
Image à l'échelle
Vous pouvez simplement obtenir la sortie de votre image en utilisant «UpScaped_image», et il affiche l'entrée avec une résolution quatre fois mais les mêmes fonctionnalités que l'original.
upscaled_image
Canva Aura
Ce modèle a déjà montré un potentiel dans son utilisation dans de nombreuses applications. Voici quelques façons dont les capacités de résolution de ce modèle sont utilisées:
Aurasr est un outil puissant pour la mise à l'échelle des images. Son architecture basée sur le GAN offre une sortie haute résolution et est polyvalente et rapide dans la production de ces images. Des fonctionnalités avancées comme la manipulation de la transparence assurent l'efficacité de ce modèle. Dans le même temps, son application dans des domaines comme l'imagerie d'art numérique, la production de films et le développement de jeux établit une référence pour les technologies d'amélioration d'images modernes.
A. Ce modèle peut offrir une résolution d'image illimité aux images générées par l'AI sans modifier les détails de l'image d'origine.
Q2. Comment Aurasr gère-t-il la transparence dans les images?A. Cette fonctionnalité est essentielle pour ce modèle. Le masque de transparence et la transparence de réapplication garantissent que les régions transparentes de l'image d'entrée sont conservées dans l'image de sortie.
Q3. Quels formats de fichiers ce modèle prend-il en charge?A. Bien que le modèle ait une phase de prétraitement d'image, il peut prendre en charge quelques formats de fichiers. Les images de mise à l'échelle dans les formats PNG, JPG, JPEG et WebP ne seront pas un problème.
Les médias présentés dans cet article ne sont pas détenus par l'analytique vidhya et sont utilisés à la discrétion de l'auteur.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!