Ce maître de l'IA qui comprend le chinois, les montagnes et la lune brillante peintes sont tellement incroyables ! Le modèle AltDiffusion bilingue chinois-anglais est open source-IA-php.cn

Table des matières

1. Génération d'invite longue, l'effet d'image n'est pas inférieur

2. Mieux comprendre le chinois et devenir meilleur en peinture chinoise

3. Bilingue chinois et anglais, alignement des effets générés

Ouvrez l'écosystème original de StableDiffusion

2. le modèle à travers un petit nombre d'échantillons Un outil de débogage pour générer un style spécifique ; grâce à cet outil, un style spécifique peut être généré en utilisant un petit nombre d'images chinoises sur AltDiffusion, comme le style "Havoc in Heaven".

3. Utilisez pleinement le livre d'invites stables de la communauté

4. Pratique pour les créateurs chinois à affiner

Basé sur le premier AltCLIP bilingue

Maison

Périphériques technologiques

Ce maître de l'IA qui comprend le chinois, les montagnes et la lune brillante peintes sont tellement incroyables ! Le modèle AltDiffusion bilingue chinois-anglais est open source

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 14, 2023 pm 02:58 PM

ai 模型

Récemment, la grande équipe de recherche sur les modèles de l'Institut de recherche Zhiyuan a mis en open source le dernier modèle AltDiffusion bilingue, apportant au monde chinois une forte puissance de création de textes et de graphiques IA de niveau professionnel :

Prend en charge la création avancée de beaux longs Invites chinoises ; sans traduction culturelle, de la langue chinoise originale s'adresse directement à la peinture chinoise avec à la fois la forme et l'esprit ; et elle a atteint un seuil bas au niveau de la peinture avec des effets visuels choquants originaux de niveau diffusion stable alignés en chinois et en anglais ; On peut dire qu'il est un maître de peinture IA de classe mondiale qui parle chinois.

Le modèle innovant AltCLIP est la pierre angulaire de ce travail, complétant le modèle CLIP original avec trois capacités multilingues plus fortes. Les modèles AltDiffusion et AltCLIP sont des modèles multilingues. Le bilinguisme chinois et anglais constitue la première étape du travail, et le code et les modèles sont open source.

AltDiffusion

https://github.com/FlagAI-Open/FlagAI/tree/master/examples/AltDiffusion

AltCLIP

https:// github.com/FlagAI-Open/FlagAI/examples/AltCLIP

Adresse de l'essai spatial HuggingFace

https://huggingface.co/spaces/BAAI/bilingual_stable_diffusion

Technique rapport

Ce maître de lIA qui comprend le chinois, les montagnes et la lune brillante peintes sont tellement incroyables ! Le modèle AltDiffusion bilingue chinois-anglais est open source

https://arxiv.org/abs/2211.06679

Professional Chinese AltDiffusion

——Longue peinture fine rapide + style chinois natif, satisfaisant IA Forte demande pour les maîtres créatifs

Grâce aux puissantes capacités d'alignement bilingue chinois et anglais basées sur AltCLIP, AltDiffusion a atteint un niveau d'effets visuels similaire à Stable Diffusion, notamment avec l'avantage unique d'être meilleur dans la compréhension du chinois et d'être meilleur dans la peinture chinoise , ce qui est très digne des attentes des créateurs professionnels de textes et d'images d'IA chinois.

1. Génération d'invite longue, l'effet d'image n'est pas inférieur

La longueur de l'invite est le tournant décisif pour tester la capacité du modèle à générer du texte et des images. Plus l'invite est longue, plus elle teste les trois principales capacités de compréhension du langage. , l'alignement des images et du texte et plusieurs langues.

Sous les mêmes longs ajustements de saisie en chinois et en anglais, AltDiffusion est encore plus expressif dans de nombreux cas de génération d'images : la composition des éléments est riche et passionnante, et les détails sont décrits avec délicatesse et précision.

Ce maître de lIA qui comprend le chinois, les montagnes et la lune brillante peintes sont tellement incroyables ! Le modèle AltDiffusion bilingue chinois-anglais est open source

2. Mieux comprendre le chinois et devenir meilleur en peinture chinoise

En plus de performances d'entrée similaires pour les invites chinoises et anglaises, AltDiffusion peut également compenser les lacunes du style de peinture chinois dans le monde occidental. , en utilisant des images et des textes chinois pour continuer Affiner la génération de caractéristiques chinoises, telles que le modèle de génération de style de peinture chinoise, pour produire un véritable « style chinois ».

Ce maître de lIA qui comprend le chinois, les montagnes et la lune brillante peintes sont tellement incroyables ! Le modèle AltDiffusion bilingue chinois-anglais est open source

AltDiffusion comprend mieux le chinois. Il peut décrire le sens dans le contexte culturel chinois et comprendre instantanément l'intention du créateur. Par exemple, la description de « La Grande Scène de la Dynastie Tang » évite de sortir du sujet en raison de malentendus culturels.

Ce maître de lIA qui comprend le chinois, les montagnes et la lune brillante peintes sont tellement incroyables ! Le modèle AltDiffusion bilingue chinois-anglais est open source

Surtout pour les concepts issus de la culture chinoise, nous les comprenons et les exprimons avec plus de précision, évitant ainsi la confusion ridicule entre « style japonais » et « style chinois ». Par exemple, lors de la saisie d'invites correspondant au style de caractère du costume Tang avec diffusion stable en chinois et en anglais, la différence est claire en un coup d'œil :

Ce maître de lIA qui comprend le chinois, les montagnes et la lune brillante peintes sont tellement incroyables ! Le modèle AltDiffusion bilingue chinois-anglais est open source

Dans la génération d'un style spécifique, le contexte culturel chinois sera être utilisé comme sujet d'identité pour la création de style, tel que Pour l'invite avec « bâtiments anciens » ci-dessous, les bâtiments chinois anciens seront générés par défaut. Le style créatif correspond davantage à l’identité des créateurs chinois.

Ce maître de lIA qui comprend le chinois, les montagnes et la lune brillante peintes sont tellement incroyables ! Le modèle AltDiffusion bilingue chinois-anglais est open source

3. Bilingue chinois et anglais, alignement des effets générés

AltDiffusion est basé sur Stable Diffusion, obtenu en remplaçant CLIP dans la diffusion stable d'origine par AltCLIP, et en entraînant davantage le modèle avec des graphiques et du texte en chinois et en anglais. . Grâce aux puissantes capacités d'alignement linguistique d'AltCLIP, l'effet de génération d'AltDiffusion est très proche de la diffusion stable en anglais et reflète également la cohérence des performances bilingues chinois et anglais.

Par exemple, après avoir saisi les invites chinoises et anglaises de "chiot au chapeau" dans AltDiffusion, les effets d'image générés sont fondamentalement alignés, avec une cohérence extrêmement élevée :

Ce maître de lIA qui comprend le chinois, les montagnes et la lune brillante peintes sont tellement incroyables ! Le modèle AltDiffusion bilingue chinois-anglais est open source

Ajoutez le descripteur au "garçon " image comme Après "Chinese Boy", basé sur l'image originale d'un petit garçon, il a été ajusté avec précision pour devenir un enfant "chinois" typique, montrant une excellente compréhension du langage et des résultats d'expression précis dans la génération du contrôle du langage.

Ce maître de lIA qui comprend le chinois, les montagnes et la lune brillante peintes sont tellement incroyables ! Le modèle AltDiffusion bilingue chinois-anglais est open source

Ouvrez l'écosystème original de StableDiffusion

——Des outils écologiques riches et des applications PromptsBook, une excellente jouabilité

Il convient particulièrement de mentionner que les capacités d'intégration écologique d'AltDiffusion :

Tous prennent en charge Stable Diffusion des outils tels que Stable Diffusion WebUI, DreamBooth, etc. peuvent être appliqués à notre modèle de diffusion bilingue chinois-anglais, offrant une richesse de choix pour la création d'IA chinoise :

1 Stable Diffusion WebUI

Une excellente génération de texte et d'images, texte Un outil Web pour l'édition d'images ; lorsque nous transformons l'image de la scène nocturne de l'Université de Pékin en Poudlard (invite : Poudlard), le monde magique de rêve peut être présenté en un instant

Ce maître de lIA qui comprend le chinois, les montagnes et la lune brillante peintes sont tellement incroyables ! Le modèle AltDiffusion bilingue chinois-anglais est open source

2. le modèle à travers un petit nombre d'échantillons Un outil de débogage pour générer un style spécifique ; grâce à cet outil, un style spécifique peut être généré en utilisant un petit nombre d'images chinoises sur AltDiffusion, comme le style "Havoc in Heaven".

Ce maître de lIA qui comprend le chinois, les montagnes et la lune brillante peintes sont tellement incroyables ! Le modèle AltDiffusion bilingue chinois-anglais est open source

3. Utilisez pleinement le livre d'invites stables de la communauté

Les invites sont très importantes pour générer des modèles. Les utilisateurs de la communauté ont accumulé de riches cas d'effets de génération grâce à un grand nombre de tentatives d'invites. Ces précieuses expériences d'invite sont presque toutes applicables aux utilisateurs d'AltDiffusion !

De plus, vous pouvez également mélanger le chinois et l'anglais pour faire correspondre certains styles et éléments magiques, ou continuer à explorer les invites chinoises adaptées à AltDiffusion.

4. Pratique pour les créateurs chinois à affiner

L'AltDiffusion open source fournit une base pour les modèles de génération chinois. Sur cette base, vous pouvez utiliser davantage de données chinoises dans des domaines spécifiques pour affiner le modèle afin de faciliter le travail. expression des créateurs chinois.

Basé sur le premier AltCLIP bilingue

- Améliore de manière globale les trois principales capacités multilingues, l'alignement chinois-anglais, un meilleur chinois, un seuil extrêmement bas

Compréhension de la langue, alignement des images et du texte, capacités multilingues , ce sont Trois compétences nécessaires à la recherche interlinguistique.

De nombreuses capacités de niveau professionnel d'AltDiffusion sont dérivées de l'idée innovante de changement de tour d'AltCLIP, qui est entièrement améliorée dans ces trois capacités majeures : les capacités d'alignement des langues chinoise et anglaise avec le CLIP original sont grandement améliorées, et elles peuvent être connecté de manière transparente à Stable Diffusion et à tous les autres modèles et outils écologiques construits sur le CLIP original en même temps, il dispose de solides capacités chinoises pour obtenir de meilleurs résultats en chinois sur plusieurs ensembles de données ; (Veuillez vous référer au rapport technique pour une explication détaillée)

Il convient de mentionner que cette méthode d'alignement réduit considérablement le seuil de formation de modèles de représentation multilingues et multimodaux par rapport à la refonte de la pré-formation du chinois ou. Paires d'images et de textes en anglais, seulement environ 1 % des ressources informatiques et des données image-texte sont nécessaires.

Obtenu le même effet que la version originale anglaise dans le benchmark complet CLIP

Il a surpassé la version originale

Ce maître de lIA qui comprend le chinois, les montagnes et la lune brillante peintes sont tellement incroyables ! Le modèle AltDiffusion bilingue chinois-anglais est open source

Certains ensembles de données de récupération tels que Flick euh -30K Les performances sont meilleures que le CLIP original

Ce maître de lIA qui comprend le chinois, les montagnes et la lune brillante peintes sont tellement incroyables ! Le modèle AltDiffusion bilingue chinois-anglais est open source

Le résultat zéro-shot sur ImageNet chinois est le meilleur

Ce maître de lIA qui comprend le chinois, les montagnes et la lune brillante peintes sont tellement incroyables ! Le modèle AltDiffusion bilingue chinois-anglais est open source

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

3 Il y a quelques semaines By DDD

Quoi de neuf dans Windows 11 KB5054979 et comment résoudre les problèmes de mise à jour

2 Il y a quelques semaines By DDD

Will R.E.P.O. Vous avez un jeu croisé?

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7555

Tutoriel CakePHP

1384

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Ligne de commande de l'arrêt CentOS Apr 14, 2025 pm 09:12 PM

La commande de fermeture CENTOS est arrêtée et la syntaxe est la fermeture de [options] le temps [informations]. Les options incluent: -H Arrêtez immédiatement le système; -P éteignez l'alimentation après l'arrêt; -r redémarrer; -t temps d'attente. Les temps peuvent être spécifiés comme immédiats (maintenant), minutes (minutes) ou une heure spécifique (HH: mm). Des informations supplémentaires peuvent être affichées dans les messages système.

Quelles sont les méthodes de sauvegarde pour Gitlab sur Centos Apr 14, 2025 pm 05:33 PM

La politique de sauvegarde et de récupération de GitLab dans le système CentOS afin d'assurer la sécurité et la récupérabilité des données, Gitlab on CentOS fournit une variété de méthodes de sauvegarde. Cet article introduira plusieurs méthodes de sauvegarde courantes, paramètres de configuration et processus de récupération en détail pour vous aider à établir une stratégie complète de sauvegarde et de récupération de GitLab. 1. MANUEL BACKUP Utilisez le Gitlab-RakegitLab: Backup: Créer la commande pour exécuter la sauvegarde manuelle. Cette commande sauvegarde des informations clés telles que le référentiel Gitlab, la base de données, les utilisateurs, les groupes d'utilisateurs, les clés et les autorisations. Le fichier de sauvegarde par défaut est stocké dans le répertoire / var / opt / gitlab / backups. Vous pouvez modifier / etc / gitlab

Comment vérifier la configuration de CentOS HDFS Apr 14, 2025 pm 07:21 PM

Guide complet pour vérifier la configuration HDFS dans les systèmes CentOS Cet article vous guidera comment vérifier efficacement la configuration et l'état de l'exécution des HDF sur les systèmes CentOS. Les étapes suivantes vous aideront à bien comprendre la configuration et le fonctionnement des HDF. Vérifiez la variable d'environnement Hadoop: Tout d'abord, assurez-vous que la variable d'environnement Hadoop est correctement définie. Dans le terminal, exécutez la commande suivante pour vérifier que Hadoop est installé et configuré correctement: HadoopVersion Check HDFS Fichier de configuration: Le fichier de configuration de base de HDFS est situé dans le répertoire / etc / hadoop / conf / le répertoire, où Core-site.xml et hdfs-site.xml sont cruciaux. utiliser

Comment est la prise en charge du GPU pour Pytorch sur Centos Apr 14, 2025 pm 06:48 PM

Activer l'accélération du GPU Pytorch sur le système CentOS nécessite l'installation de versions CUDA, CUDNN et GPU de Pytorch. Les étapes suivantes vous guideront tout au long du processus: CUDA et CUDNN Installation détermineront la compatibilité de la version CUDA: utilisez la commande NVIDIA-SMI pour afficher la version CUDA prise en charge par votre carte graphique NVIDIA. Par exemple, votre carte graphique MX450 peut prendre en charge CUDA11.1 ou plus. Téléchargez et installez Cudatoolkit: visitez le site officiel de Nvidiacudatoolkit et téléchargez et installez la version correspondante selon la version CUDA la plus élevée prise en charge par votre carte graphique. Installez la bibliothèque CUDNN:

CentOS installe MySQL Apr 14, 2025 pm 08:09 PM

L'installation de MySQL sur CENTOS implique les étapes suivantes: Ajout de la source MySQL YUM appropriée. Exécutez la commande YUM Install MySQL-Server pour installer le serveur MySQL. Utilisez la commande mysql_secure_installation pour créer des paramètres de sécurité, tels que la définition du mot de passe de l'utilisateur racine. Personnalisez le fichier de configuration MySQL selon les besoins. Écoutez les paramètres MySQL et optimisez les bases de données pour les performances.

Explication détaillée du principe docker Apr 14, 2025 pm 11:57 PM

Docker utilise les fonctionnalités du noyau Linux pour fournir un environnement de fonctionnement d'application efficace et isolé. Son principe de travail est le suivant: 1. Le miroir est utilisé comme modèle en lecture seule, qui contient tout ce dont vous avez besoin pour exécuter l'application; 2. Le Système de fichiers Union (UnionFS) empile plusieurs systèmes de fichiers, ne stockant que les différences, l'économie d'espace et l'accélération; 3. Le démon gère les miroirs et les conteneurs, et le client les utilise pour l'interaction; 4. Les espaces de noms et les CGROUP implémentent l'isolement des conteneurs et les limitations de ressources; 5. Modes de réseau multiples prennent en charge l'interconnexion du conteneur. Ce n'est qu'en comprenant ces concepts principaux que vous pouvez mieux utiliser Docker.

CentOS8 redémarre SSH Apr 14, 2025 pm 09:00 PM

La commande pour redémarrer le service SSH est: SystemCTL Redémarrer SSHD. Étapes détaillées: 1. Accédez au terminal et connectez-vous au serveur; 2. Entrez la commande: SystemCTL Restart SSHD; 3. Vérifiez l'état du service: SystemCTL Status Sshd.

Comment faire fonctionner la formation distribuée de Pytorch sur CentOS Apr 14, 2025 pm 06:36 PM

La formation distribuée par Pytorch sur le système CentOS nécessite les étapes suivantes: Installation de Pytorch: La prémisse est que Python et PIP sont installés dans le système CentOS. Selon votre version CUDA, obtenez la commande d'installation appropriée sur le site officiel de Pytorch. Pour la formation du processeur uniquement, vous pouvez utiliser la commande suivante: pipinstalltorchtorchVisionTorChaudio Si vous avez besoin d'une prise en charge du GPU, assurez-vous que la version correspondante de CUDA et CUDNN est installée et utilise la version Pytorch correspondante pour l'installation. Configuration de l'environnement distribué: la formation distribuée nécessite généralement plusieurs machines ou des GPU multiples uniques. Lieu

See all articles