Table des matières
La combinaison du Wenlan et des modèles génératifs
Résultats de l'évaluation du modèle de peinture Wenlan
Résumé
Maison Périphériques technologiques IA Un modèle de peinture IA avec une forte compréhension de la culture traditionnelle chinoise. Les peintures sont tangibles et spirituelles, véhiculant le confucianisme, le bouddhisme et le taoïsme.

Un modèle de peinture IA avec une forte compréhension de la culture traditionnelle chinoise. Les peintures sont tangibles et spirituelles, véhiculant le confucianisme, le bouddhisme et le taoïsme.

Apr 13, 2023 pm 07:07 PM
ai 模型

Récemment, la peinture IA est devenue très populaire. Il y a eu une vague d'engouement pour la peinture IA au pays et à l'étranger. Diverses images générées par des modèles de peinture IA sont courantes sur divers médias sociaux. Le mois dernier, le travail d'un concepteur de jeux "Space Opera" créé à l'aide de l'outil de dessin d'IA Midjourney a remporté la médaille d'or au concours d'art Colorado State Fair.

Inspirée par cela, L'équipe du professeur Lu Zhiwu de l'Université Renmin de Chine a combiné de manière innovante le modèle de pré-formation multimodal auto-développé Wenlan avec la dernière technologie de génération d'images pour créer une peinture IA qui comprend le mieux la culture traditionnelle chinoise. Générez le modèle .

Le modèle Wenlan est un modèle chinois de pré-formation multimodal à grande échelle dirigé par le professeur Wen Jirong, doyen exécutif de la Hillhouse School of Artificial Intelligence, Renmin University of China, le professeur Lu Zhiwu et le professeur associé permanent Song Ruihua. . Le modèle Wenlan a été pré-entraîné par 650 millions de paires image-texte chinoises faiblement liées, et a acquis des capacités uniques de compréhension sémantique chinoise et peut bien relier la sémantique chinoise aux informations visuelles. Caractères chinois. Certains ont une sémantique implicite et des concepts abstraits dans les images.

En juin de cette année, les résultats de la recherche pertinente « Vers une intelligence générale artificielle via un modèle de fondation multimodal » ont été publiés dans Nature Communications.

Un modèle de peinture IA avec une forte compréhension de la culture traditionnelle chinoise. Les peintures sont tangibles et spirituelles, véhiculant le confucianisme, le bouddhisme et le taoïsme.

Lien papier : https://www.nature.com/articles/s41467-022-30761-2

La combinaison du Wenlan et des modèles génératifs

L'équipe de recherche En exploitant le potentiel du modèle Wenlan, en le combinant de manière innovante avec la technologie de dernière génération, en intégrant les capacités de compréhension sémantique abstraite de Wenlan et les puissantes capacités de génération du modèle génératif, nous garantissons que le modèle résultant peut parfaitement interpréter la sémantique du texte d'entrée et Générez des images avec la sémantique correspondante. L'

équipe se concentre sur l'exploration du potentiel du Wenlan dans la culture traditionnelle chinoise, en empruntant la dernière architecture de modèle génératif et en s'entraînant sur les ensembles de données de peinture chinoise collectés. Le modèle résultant peut générer des styles correspondants en fonction du texte saisi. Photos . Le schéma d’architecture détaillé est présenté ci-dessous.

Un modèle de peinture IA avec une forte compréhension de la culture traditionnelle chinoise. Les peintures sont tangibles et spirituelles, véhiculant le confucianisme, le bouddhisme et le taoïsme.

Plus précisément, l'équipe a formé un modèle de génération inconditionnelle sur l'ensemble de données de peinture chinoise et a utilisé le modèle Wenlan pour guider le processus de génération à travers une génération itérative.

Cette méthode initialise d'abord de manière aléatoire une image de bruit. A chaque étape de génération, le modèle ajustera le contenu de l'image générée dans une direction proche du texte d'entrée, de sorte que le contenu de l'image générée à chaque étape et le texte d'entrée tendent à être cohérents dans l'espace latent du Modèle Wenlan. Cette étape peut être décrite comme :

Un modèle de peinture IA avec une forte compréhension de la culture traditionnelle chinoise. Les peintures sont tangibles et spirituelles, véhiculant le confucianisme, le bouddhisme et le taoïsme.

où x et y représentent respectivement les images et le texte, IE et TE représentent respectivement l'encodeur d'image et l'encodeur de texte de Wenlan. Grâce à une itération continue, ce modèle peut remplir la fonction de générer des images de symboles de haute qualité basées sur la sémantique du texte.

Résultats de l'évaluation du modèle de peinture Wenlan

En raison des caractéristiques du modèle Wenlan lui-même, le modèle de peinture Wenlan peut générer des images correspondantes basées sur les poèmes chinois anciens saisis. Comme le montrent les exemples ci-dessous, les images générées par le modèle sont très cohérentes avec le contenu et la conception artistique des poèmes anciens.

Dans le même temps, l’équipe a également découvert que Le modèle de peinture de Wenlan a même une interprétation unique du confucianisme, du bouddhisme et du taoïsme obscurs.

Afin de mieux démontrer les caractéristiques des modèles de peinture Wenlan dans l'interprétation du confucianisme, du bouddhisme et du taoïsme, l'équipe a sélectionné les modèles de peinture IA les plus populaires au pays et à l'étranger pour une analyse comparative, notamment Dream Stealer, Wenxin, Disco Diffusion, Midjourney et Stable. Diffusion. Pour Disco Diffusion, Midjourney et Stable Diffusion, le texte chinois doit d'abord être traduit par Baidu.

À en juger par les résultats générés dans la figure ci-dessous, Dream Stealer, Disco Diffusion, Midjourney et Stable Diffusion ont tendance à générer des objets concrets dans les phrases ou à générer des images avec de meilleures images mais le contenu a peu de rapport avec les phrases. Wenxin a tendance à générer des images avec des personnages, et correspond même directement à la lumière des bougies allumées.

Le modèle de peinture Wenlan peut mieux lire le sens de la phrase entière et la pensée confucéenne qu'elle contient, générant ainsi des images plus conformes à cette pensée.

Deuxièmement, pour la saisie de texte contenant des pensées bouddhistes, les modèles de génération de peinture les plus populaires ne peuvent capturer que certains des objets concrets et effectuer une génération ciblée, et certains modèles de peinture peuvent même mal les comprendre.

Comme le montrent les résultats générés dans la figure ci-dessous, Wen Xin a compris "Si vous voyez le Tao et oubliez les montagnes, le monde sera seul, et si vous voyez les montagnes et oubliez le Tao, les montagnes seront bruyant" comme une pensée taoïste (générant l'image d'un prêtre taoïste). Le modèle de peinture Wenlan peut bien interpréter les pensées bouddhistes du texte saisi et les refléter dans les images générées.

Enfin, en termes de Pensée taoïste, l'équipe a sélectionné les trois phrases les plus fondamentales du Tao Te Ching. Comparé à Dream Stealer, Disco Diffusion, Midjourney et Stable Diffusion, Wen Xin a une meilleure capacité à interpréter le Tao Te Ching.

Mais dans l'ensemble, le modèle de peinture Wenlan interprète la pensée taoïste avec plus de précision et les images générées ont une conception artistique plus taoïste.

Résumé

L'équipe Wenlan combine la technologie de génération de peinture IA récemment populaire avec le modèle chinois de pré-formation multimodal Wenlan, explorant en profondeur le potentiel du modèle Wenlan dans la culture traditionnelle chinoise et utilisant des images à travers le modèle généré Il est présenté sous une forme qui permet au grand public d’avoir une compréhension plus intuitive de certaines profondes pensées culturelles traditionnelles chinoises.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

WEB3 Trading Platform Ranking_Web3 Global Exchanges Top Ten Résumé WEB3 Trading Platform Ranking_Web3 Global Exchanges Top Ten Résumé Apr 21, 2025 am 10:45 AM

Binance est le suzerain de l'écosystème mondial de trading d'actifs numériques, et ses caractéristiques comprennent: 1. Le volume de négociation quotidien moyen dépasse 150 milliards de dollars, prend en charge 500 paires de négociation, couvrant 98% des monnaies grand public; 2. La matrice d'innovation couvre le marché des dérivés, la mise en page Web3 et le système éducatif; 3. Les avantages techniques sont des moteurs de correspondance d'une milliseconde, avec des volumes de traitement de pointe de 1,4 million de transactions par seconde; 4. Conformité Progress détient des licences de 15 pays et établit des entités conformes en Europe et aux États-Unis.

Comment éviter les pertes après la mise à niveau de l'ETH Comment éviter les pertes après la mise à niveau de l'ETH Apr 21, 2025 am 10:03 AM

Après la mise à niveau de l'ETH, les novices devraient adopter les stratégies suivantes pour éviter les pertes: 1. Faites leurs devoirs et comprenez les connaissances de base et la mise à niveau du contenu de l'ETH; 2. Contrôler les positions, tester les eaux en petites quantités et diversifier l'investissement; 3. Faire un plan de négociation, clarifier les objectifs et fixer des points de perte d'arrêt; 4. Profilement rationnellement et éviter la prise de décision émotionnelle; 5. Choisissez une plate-forme de trading formelle et fiable; 6. Considérons la tenue à long terme pour éviter l'impact des fluctuations à court terme.

Top 10 plates-formes d'échange de crypto-monnaie La plus grande liste de changes numériques au monde Top 10 plates-formes d'échange de crypto-monnaie La plus grande liste de changes numériques au monde Apr 21, 2025 pm 07:15 PM

Les échanges jouent un rôle essentiel sur le marché des crypto-monnaies d'aujourd'hui. Ce ne sont pas seulement des plateformes pour les investisseurs pour négocier, mais aussi des sources importantes de liquidité du marché et la découverte des prix. Les plus grands échanges de devises virtuels au monde se classent parmi les dix premiers, et ces échanges sont non seulement bien en avance dans le volume des échanges, mais présentent également leurs propres avantages dans l'expérience utilisateur, la sécurité et les services innovants. Les échanges qui dépassent la liste ont généralement une grande base d'utilisateurs et une influence approfondie du marché, et leur volume de trading et leurs types d'actifs sont souvent difficiles à atteindre par d'autres échanges.

Que signifie la transaction transversale? Quelles sont les transactions transversales? Que signifie la transaction transversale? Quelles sont les transactions transversales? Apr 21, 2025 pm 11:39 PM

Échanges qui prennent en charge les transactions transversales: 1. Binance, 2. UniSwap, 3. Sushiswap, 4. Curve Finance, 5. Thorchain, 6. 1inch Exchange, 7. DLN Trade, ces plateformes prennent en charge les transactions d'actifs multi-chaînes via diverses technologies.

Quelles sont les dix principales plates-formes du cercle d'échange de devises? Quelles sont les dix principales plates-formes du cercle d'échange de devises? Apr 21, 2025 pm 12:21 PM

Les principaux échanges comprennent: 1. Binance, le plus grand volume de trading au monde, prend en charge 600 devises et les frais de gestion des points sont de 0,1%; 2. Okx, une plate-forme équilibrée, prend en charge 708 paires de trading, et les frais de traitement des contrats perpétuels sont de 0,05%; 3. Gate.io, couvre 2700 petites monnaies, et les frais de traitement des points sont de 0,1% à 0,3%; 4. Coinbase, la référence de conformité américaine, les frais de traitement des points sont de 0,5%; 5. Kraken, la haute sécurité et l'audit de réserve régulière.

Pourquoi la hausse ou la baisse des prix de monnaie virtuelle? Pourquoi la hausse ou la baisse des prix de monnaie virtuelle? Pourquoi la hausse ou la baisse des prix de monnaie virtuelle? Pourquoi la hausse ou la baisse des prix de monnaie virtuelle? Apr 21, 2025 am 08:57 AM

Les facteurs de la hausse des prix des devises virtuels comprennent: 1. Une augmentation de la demande du marché, 2. Daisser l'offre, 3. Stimulé de nouvelles positives, 4. Sentiment du marché optimiste, 5. Environnement macroéconomique; Les facteurs de déclin comprennent: 1. Daissement de la demande du marché, 2. AUGMENT DE L'OFFICATION, 3. Strike of Negative News, 4. Pespimiste Market Sentiment, 5. Environnement macroéconomique.

'Black Monday Sell' est une journée difficile pour l'industrie de la crypto-monnaie 'Black Monday Sell' est une journée difficile pour l'industrie de la crypto-monnaie Apr 21, 2025 pm 02:48 PM

Le plongeon sur le marché des crypto-monnaies a provoqué la panique parmi les investisseurs, et Dogecoin (Doge) est devenu l'une des zones les plus difficiles. Son prix a fortement chuté et le verrouillage de la valeur totale de la finance décentralisée (DEFI) (TVL) a également connu une baisse significative. La vague de vente de "Black Monday" a balayé le marché des crypto-monnaies, et Dogecoin a été le premier à être touché. Son Defitvl a chuté aux niveaux de 2023 et le prix de la devise a chuté de 23,78% au cours du dernier mois. Le Defitvl de Dogecoin est tombé à un minimum de 2,72 millions de dollars, principalement en raison d'une baisse de 26,37% de l'indice de valeur SOSO. D'autres plates-formes de Defi majeures, telles que le Dao et Thorchain ennuyeux, TVL ont également chuté de 24,04% et 20, respectivement.

Classement des échanges à effet de levier dans le cercle des devises Les dernières recommandations des dix premiers échanges à effet de levier dans le cercle des devises Classement des échanges à effet de levier dans le cercle des devises Les dernières recommandations des dix premiers échanges à effet de levier dans le cercle des devises Apr 21, 2025 pm 11:24 PM

Les plates-formes qui ont des performances exceptionnelles dans le commerce, la sécurité et l'expérience utilisateur en effet de levier en 2025 sont: 1. OKX, adaptés aux traders à haute fréquence, fournissant jusqu'à 100 fois l'effet de levier; 2. Binance, adaptée aux commerçants multi-monnaies du monde entier, offrant un effet de levier 125 fois élevé; 3. Gate.io, adapté aux joueurs de dérivés professionnels, fournissant 100 fois l'effet de levier; 4. Bitget, adapté aux novices et aux commerçants sociaux, fournissant jusqu'à 100 fois l'effet de levier; 5. Kraken, adapté aux investisseurs stables, fournissant 5 fois l'effet de levier; 6. BUTBIT, adapté aux explorateurs Altcoin, fournissant 20 fois l'effet de levier; 7. Kucoin, adapté aux commerçants à faible coût, fournissant 10 fois l'effet de levier; 8. Bitfinex, adapté au jeu senior

See all articles