


Ce maître de l'IA qui comprend le chinois, les montagnes et la lune brillante peintes sont tellement incroyables ! Le modèle AltDiffusion bilingue chinois-anglais est open source
Récemment, la grande équipe de recherche sur les modèles de l'Institut de recherche Zhiyuan a mis en open source le dernier modèle AltDiffusion bilingue, apportant au monde chinois une forte puissance de création de textes et de graphiques IA de niveau professionnel :
Prend en charge la création avancée de beaux longs Invites chinoises ; sans traduction culturelle, de la langue chinoise originale s'adresse directement à la peinture chinoise avec à la fois la forme et l'esprit ; et elle a atteint un seuil bas au niveau de la peinture avec des effets visuels choquants originaux de niveau diffusion stable alignés en chinois et en anglais ; On peut dire qu'il est un maître de peinture IA de classe mondiale qui parle chinois.
Le modèle innovant AltCLIP est la pierre angulaire de ce travail, complétant le modèle CLIP original avec trois capacités multilingues plus fortes. Les modèles AltDiffusion et AltCLIP sont des modèles multilingues. Le bilinguisme chinois et anglais constitue la première étape du travail, et le code et les modèles sont open source.
AltDiffusion
https://github.com/FlagAI-Open/FlagAI/tree/master/examples/AltDiffusion
AltCLIP
https:// github.com/FlagAI-Open/FlagAI/examples/AltCLIP
Adresse de l'essai spatial HuggingFace
https://huggingface.co/spaces/BAAI/bilingual_stable_diffusion
Technique rapport
https://arxiv.org/abs/2211.06679
Professional Chinese AltDiffusion
——Longue peinture fine rapide + style chinois natif, satisfaisant IA Forte demande pour les maîtres créatifs
Grâce aux puissantes capacités d'alignement bilingue chinois et anglais basées sur AltCLIP, AltDiffusion a atteint un niveau d'effets visuels similaire à Stable Diffusion, notamment avec l'avantage unique d'être meilleur dans la compréhension du chinois et d'être meilleur dans la peinture chinoise , ce qui est très digne des attentes des créateurs professionnels de textes et d'images d'IA chinois.
1. Génération d'invite longue, l'effet d'image n'est pas inférieur
La longueur de l'invite est le tournant décisif pour tester la capacité du modèle à générer du texte et des images. Plus l'invite est longue, plus elle teste les trois principales capacités de compréhension du langage. , l'alignement des images et du texte et plusieurs langues.
Sous les mêmes longs ajustements de saisie en chinois et en anglais, AltDiffusion est encore plus expressif dans de nombreux cas de génération d'images : la composition des éléments est riche et passionnante, et les détails sont décrits avec délicatesse et précision.
2. Mieux comprendre le chinois et devenir meilleur en peinture chinoise
En plus de performances d'entrée similaires pour les invites chinoises et anglaises, AltDiffusion peut également compenser les lacunes du style de peinture chinois dans le monde occidental. , en utilisant des images et des textes chinois pour continuer Affiner la génération de caractéristiques chinoises, telles que le modèle de génération de style de peinture chinoise, pour produire un véritable « style chinois ».
AltDiffusion comprend mieux le chinois. Il peut décrire le sens dans le contexte culturel chinois et comprendre instantanément l'intention du créateur. Par exemple, la description de « La Grande Scène de la Dynastie Tang » évite de sortir du sujet en raison de malentendus culturels.
Surtout pour les concepts issus de la culture chinoise, nous les comprenons et les exprimons avec plus de précision, évitant ainsi la confusion ridicule entre « style japonais » et « style chinois ». Par exemple, lors de la saisie d'invites correspondant au style de caractère du costume Tang avec diffusion stable en chinois et en anglais, la différence est claire en un coup d'œil :
Dans la génération d'un style spécifique, le contexte culturel chinois sera être utilisé comme sujet d'identité pour la création de style, tel que Pour l'invite avec « bâtiments anciens » ci-dessous, les bâtiments chinois anciens seront générés par défaut. Le style créatif correspond davantage à l’identité des créateurs chinois.
3. Bilingue chinois et anglais, alignement des effets générés
AltDiffusion est basé sur Stable Diffusion, obtenu en remplaçant CLIP dans la diffusion stable d'origine par AltCLIP, et en entraînant davantage le modèle avec des graphiques et du texte en chinois et en anglais. . Grâce aux puissantes capacités d'alignement linguistique d'AltCLIP, l'effet de génération d'AltDiffusion est très proche de la diffusion stable en anglais et reflète également la cohérence des performances bilingues chinois et anglais.
Par exemple, après avoir saisi les invites chinoises et anglaises de "chiot au chapeau" dans AltDiffusion, les effets d'image générés sont fondamentalement alignés, avec une cohérence extrêmement élevée :
Ajoutez le descripteur au "garçon " image comme Après "Chinese Boy", basé sur l'image originale d'un petit garçon, il a été ajusté avec précision pour devenir un enfant "chinois" typique, montrant une excellente compréhension du langage et des résultats d'expression précis dans la génération du contrôle du langage.
Ouvrez l'écosystème original de StableDiffusion
——Des outils écologiques riches et des applications PromptsBook, une excellente jouabilité
Il convient particulièrement de mentionner que les capacités d'intégration écologique d'AltDiffusion :
Tous prennent en charge Stable Diffusion des outils tels que Stable Diffusion WebUI, DreamBooth, etc. peuvent être appliqués à notre modèle de diffusion bilingue chinois-anglais, offrant une richesse de choix pour la création d'IA chinoise :
1 Stable Diffusion WebUI
Une excellente génération de texte et d'images, texte Un outil Web pour l'édition d'images ; lorsque nous transformons l'image de la scène nocturne de l'Université de Pékin en Poudlard (invite : Poudlard), le monde magique de rêve peut être présenté en un instant
2. le modèle à travers un petit nombre d'échantillons Un outil de débogage pour générer un style spécifique ; grâce à cet outil, un style spécifique peut être généré en utilisant un petit nombre d'images chinoises sur AltDiffusion, comme le style "Havoc in Heaven".
3. Utilisez pleinement le livre d'invites stables de la communauté
Les invites sont très importantes pour générer des modèles. Les utilisateurs de la communauté ont accumulé de riches cas d'effets de génération grâce à un grand nombre de tentatives d'invites. Ces précieuses expériences d'invite sont presque toutes applicables aux utilisateurs d'AltDiffusion !
De plus, vous pouvez également mélanger le chinois et l'anglais pour faire correspondre certains styles et éléments magiques, ou continuer à explorer les invites chinoises adaptées à AltDiffusion.
4. Pratique pour les créateurs chinois à affiner
L'AltDiffusion open source fournit une base pour les modèles de génération chinois. Sur cette base, vous pouvez utiliser davantage de données chinoises dans des domaines spécifiques pour affiner le modèle afin de faciliter le travail. expression des créateurs chinois.
Basé sur le premier AltCLIP bilingue
- Améliore de manière globale les trois principales capacités multilingues, l'alignement chinois-anglais, un meilleur chinois, un seuil extrêmement bas
Compréhension de la langue, alignement des images et du texte, capacités multilingues , ce sont Trois compétences nécessaires à la recherche interlinguistique.
De nombreuses capacités de niveau professionnel d'AltDiffusion sont dérivées de l'idée innovante de changement de tour d'AltCLIP, qui est entièrement améliorée dans ces trois capacités majeures : les capacités d'alignement des langues chinoise et anglaise avec le CLIP original sont grandement améliorées, et elles peuvent être connecté de manière transparente à Stable Diffusion et à tous les autres modèles et outils écologiques construits sur le CLIP original en même temps, il dispose de solides capacités chinoises pour obtenir de meilleurs résultats en chinois sur plusieurs ensembles de données ; (Veuillez vous référer au rapport technique pour une explication détaillée)
Il convient de mentionner que cette méthode d'alignement réduit considérablement le seuil de formation de modèles de représentation multilingues et multimodaux par rapport à la refonte de la pré-formation du chinois ou. Paires d'images et de textes en anglais, seulement environ 1 % des ressources informatiques et des données image-texte sont nécessaires.
Obtenu le même effet que la version originale anglaise dans le benchmark complet CLIP
Il a surpassé la version originale
Certains ensembles de données de récupération tels que Flick euh -30K Les performances sont meilleures que le CLIP original
Le résultat zéro-shot sur ImageNet chinois est le meilleur
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

La commande de fermeture CENTOS est arrêtée et la syntaxe est la fermeture de [options] le temps [informations]. Les options incluent: -H Arrêtez immédiatement le système; -P éteignez l'alimentation après l'arrêt; -r redémarrer; -t temps d'attente. Les temps peuvent être spécifiés comme immédiats (maintenant), minutes (minutes) ou une heure spécifique (HH: mm). Des informations supplémentaires peuvent être affichées dans les messages système.

La politique de sauvegarde et de récupération de GitLab dans le système CentOS afin d'assurer la sécurité et la récupérabilité des données, Gitlab on CentOS fournit une variété de méthodes de sauvegarde. Cet article introduira plusieurs méthodes de sauvegarde courantes, paramètres de configuration et processus de récupération en détail pour vous aider à établir une stratégie complète de sauvegarde et de récupération de GitLab. 1. MANUEL BACKUP Utilisez le Gitlab-RakegitLab: Backup: Créer la commande pour exécuter la sauvegarde manuelle. Cette commande sauvegarde des informations clés telles que le référentiel Gitlab, la base de données, les utilisateurs, les groupes d'utilisateurs, les clés et les autorisations. Le fichier de sauvegarde par défaut est stocké dans le répertoire / var / opt / gitlab / backups. Vous pouvez modifier / etc / gitlab

Guide complet pour vérifier la configuration HDFS dans les systèmes CentOS Cet article vous guidera comment vérifier efficacement la configuration et l'état de l'exécution des HDF sur les systèmes CentOS. Les étapes suivantes vous aideront à bien comprendre la configuration et le fonctionnement des HDF. Vérifiez la variable d'environnement Hadoop: Tout d'abord, assurez-vous que la variable d'environnement Hadoop est correctement définie. Dans le terminal, exécutez la commande suivante pour vérifier que Hadoop est installé et configuré correctement: HadoopVersion Check HDFS Fichier de configuration: Le fichier de configuration de base de HDFS est situé dans le répertoire / etc / hadoop / conf / le répertoire, où Core-site.xml et hdfs-site.xml sont cruciaux. utiliser

Activer l'accélération du GPU Pytorch sur le système CentOS nécessite l'installation de versions CUDA, CUDNN et GPU de Pytorch. Les étapes suivantes vous guideront tout au long du processus: CUDA et CUDNN Installation détermineront la compatibilité de la version CUDA: utilisez la commande NVIDIA-SMI pour afficher la version CUDA prise en charge par votre carte graphique NVIDIA. Par exemple, votre carte graphique MX450 peut prendre en charge CUDA11.1 ou plus. Téléchargez et installez Cudatoolkit: visitez le site officiel de Nvidiacudatoolkit et téléchargez et installez la version correspondante selon la version CUDA la plus élevée prise en charge par votre carte graphique. Installez la bibliothèque CUDNN:

L'installation de MySQL sur CENTOS implique les étapes suivantes: Ajout de la source MySQL YUM appropriée. Exécutez la commande YUM Install MySQL-Server pour installer le serveur MySQL. Utilisez la commande mysql_secure_installation pour créer des paramètres de sécurité, tels que la définition du mot de passe de l'utilisateur racine. Personnalisez le fichier de configuration MySQL selon les besoins. Écoutez les paramètres MySQL et optimisez les bases de données pour les performances.

Docker utilise les fonctionnalités du noyau Linux pour fournir un environnement de fonctionnement d'application efficace et isolé. Son principe de travail est le suivant: 1. Le miroir est utilisé comme modèle en lecture seule, qui contient tout ce dont vous avez besoin pour exécuter l'application; 2. Le Système de fichiers Union (UnionFS) empile plusieurs systèmes de fichiers, ne stockant que les différences, l'économie d'espace et l'accélération; 3. Le démon gère les miroirs et les conteneurs, et le client les utilise pour l'interaction; 4. Les espaces de noms et les CGROUP implémentent l'isolement des conteneurs et les limitations de ressources; 5. Modes de réseau multiples prennent en charge l'interconnexion du conteneur. Ce n'est qu'en comprenant ces concepts principaux que vous pouvez mieux utiliser Docker.

La commande pour redémarrer le service SSH est: SystemCTL Redémarrer SSHD. Étapes détaillées: 1. Accédez au terminal et connectez-vous au serveur; 2. Entrez la commande: SystemCTL Restart SSHD; 3. Vérifiez l'état du service: SystemCTL Status Sshd.

La formation distribuée par Pytorch sur le système CentOS nécessite les étapes suivantes: Installation de Pytorch: La prémisse est que Python et PIP sont installés dans le système CentOS. Selon votre version CUDA, obtenez la commande d'installation appropriée sur le site officiel de Pytorch. Pour la formation du processeur uniquement, vous pouvez utiliser la commande suivante: pipinstalltorchtorchVisionTorChaudio Si vous avez besoin d'une prise en charge du GPU, assurez-vous que la version correspondante de CUDA et CUDNN est installée et utilise la version Pytorch correspondante pour l'installation. Configuration de l'environnement distribué: la formation distribuée nécessite généralement plusieurs machines ou des GPU multiples uniques. Lieu
