Inhaltsverzeichnis
Die Kombination von Wenlan und generativen Modellen
Bewertungsergebnisse des Wenlan-Malmodells
Zusammenfassung
Heim Technologie-Peripheriegeräte KI Ein KI-Malmodell mit einem starken Verständnis der traditionellen chinesischen Kultur. Die Gemälde sind greifbar und spirituell und vermitteln Konfuzianismus, Buddhismus und Taoismus.

Ein KI-Malmodell mit einem starken Verständnis der traditionellen chinesischen Kultur. Die Gemälde sind greifbar und spirituell und vermitteln Konfuzianismus, Buddhismus und Taoismus.

Apr 13, 2023 pm 07:07 PM
ai 模型

In letzter Zeit erfreut sich die KI-Malerei großer Beliebtheit im In- und Ausland. Verschiedene von KI-Malmodellen generierte Bilder sind in verschiedenen sozialen Medien verbreitet. Letzten Monat gewann die Arbeit eines Spieledesigners „Space Opera“, die mit dem KI-Zeichentool Midjourney erstellt wurde, die Goldmedaille beim Kunstwettbewerb der Colorado State Fair.

Davon inspiriert Das Team von Professor Lu Zhiwu an der Renmin-Universität von China kombinierte auf innovative Weise das selbst entwickelte multimodale Pre-Training-Modell Wenlan mit der neuesten Bilderzeugungstechnologie, um ein KI-Gemälde zu schaffen, das die traditionelle chinesische Kultur am besten versteht Modell generieren .

Das Wenlan-Modell ist ein groß angelegtes chinesisches multimodales Pre-Training-Modell unter der Leitung von Professor Wen Jirong, Executive Dean der Hillhouse School of Artificial Intelligence der Renmin University of China, Professor Lu Zhiwu und dem ständigen außerordentlichen Professor Song Ruihua . Das Wenlan-Modell wurde durch 650 Millionen schwach verwandte chinesische Bild-Text-Paare vorab trainiert und hat einzigartige chinesische semantische Verständnisfähigkeiten erlernt und kann chinesische Semantik gut mit visuellen Informationen verbinden. Es ist besonders gut im Lesen einzigartiger Chinesische Schriftzeichen haben in den Bildern eine implizite Semantik und abstrakte Konzepte.

Im Juni dieses Jahres wurden die entsprechenden Forschungsergebnisse „Towards Artificial General Intelligence via a Multimodal Foundation Model“ in Nature Communications veröffentlicht.

Ein KI-Malmodell mit einem starken Verständnis der traditionellen chinesischen Kultur. Die Gemälde sind greifbar und spirituell und vermitteln Konfuzianismus, Buddhismus und Taoismus.

Link zum Papier: https://www.nature.com/articles/s41467-022-30761-2

Die Kombination von Wenlan und generativen Modellen

Das Forschungsteam Durch die Nutzung des Potenzials des Wenlan-Modells, die innovative Kombination mit der Technologie der neuesten Generation, die Integration der abstrakten semantischen Verständnisfähigkeiten von Wenlan und der leistungsstarken Generierungsfähigkeiten des generativen Modells stellen wir sicher, dass das resultierende Modell die Semantik des Eingabetextes hervorragend interpretieren kann Generieren Sie Bilder mit entsprechender Semantik. Das

-Team konzentriert sich auf die Erforschung des Potenzials von Wenlan in der traditionellen chinesischen Kultur, das Ausleihen der neuesten generativen Modellarchitektur und das Training anhand der gesammelten chinesischen Malereidatensätze. Das resultierende Modell kann basierend auf dem Eingabetext entsprechende Stile generieren. Bilder . Das detaillierte Architekturdiagramm ist unten dargestellt.

Ein KI-Malmodell mit einem starken Verständnis der traditionellen chinesischen Kultur. Die Gemälde sind greifbar und spirituell und vermitteln Konfuzianismus, Buddhismus und Taoismus.

Konkret trainierte das Team ein bedingungsloses Generierungsmodell auf dem chinesischen Maldatensatz und nutzte das Wenlan-Modell, um den Generierungsprozess durch iterative Generierung zu steuern.

Diese Methode initialisiert zunächst zufällig ein Rauschbild. In jedem Generierungsschritt passt das Modell den Inhalt des generierten Bildes in eine Richtung an, die dem Eingabetext nahe kommt, sodass der Inhalt des in jedem Schritt generierten Bildes und der Eingabetext im latenten Raum des generierten Bildes tendenziell konsistent sind Wenlan-Modell. Dieser Schritt kann wie folgt beschrieben werden:

Ein KI-Malmodell mit einem starken Verständnis der traditionellen chinesischen Kultur. Die Gemälde sind greifbar und spirituell und vermitteln Konfuzianismus, Buddhismus und Taoismus.

wobei x und y Bilder bzw. Text darstellen, IE und TE jeweils Wenlans Bild-Encoder und Text-Encoder darstellen. Durch kontinuierliche Iteration kann dieses Modell die Funktion erfüllen, hochwertige Symbolbilder basierend auf der Textsemantik zu generieren.

Bewertungsergebnisse des Wenlan-Malmodells

Aufgrund der Eigenschaften des Wenlan-Modells selbst kann das Wenlan-Malmodell entsprechende Bilder basierend auf den eingegebenen alten chinesischen Gedichten generieren. Wie aus den folgenden Beispielen hervorgeht, stimmen die vom Modell generierten Bilder sehr gut mit dem Inhalt und der künstlerischen Konzeption antiker Gedichte überein.

Gleichzeitig entdeckte das Team auch, dass Wenlans Malmodell sogar eine einzigartige Interpretation des obskuren Konfuzianismus, Buddhismus und Taoismus enthält.

Um die Merkmale von Wenlans Malmodell bei der Interpretation von Konfuzianismus, Buddhismus und Taoismus besser zu demonstrieren, wählte das Team die beliebtesten KI-Malmodelle im In- und Ausland für eine vergleichende Analyse aus, darunter Dream Stealer, Wen Xin , Disco-Diffusion, Midjourney und stabile Diffusion. Für Disco Diffusion, Midjourney und Stable Diffusion muss der chinesische Text zunächst von Baidu übersetzt werden.

Den in der folgenden Abbildung generierten Ergebnissen nach zu urteilen, neigen Dream Stealer, Disco Diffusion, Midjourney und Stable Diffusion dazu, einige konkrete Objekte in Sätzen oder einige Bilder zu generieren, die es sind Relativ komplex. Gute Bilder, aber der Inhalt hat nicht viel mit dem Satz zu tun. Wenxin tendiert dazu, Bilder mit Charakteren zu erzeugen und entspricht sogar direkt dem Licht einer brennenden Kerze.

Das Wenlan-Malmodell kann die Bedeutung des gesamten Satzes und des darin enthaltenen konfuzianischen Gedankens besser lesen und so Bilder erzeugen, die diesem Gedanken besser entsprechen.

Zweitens für Texteingabe mit buddhistischen Gedanken sind derzeit nur die beliebtesten Modelle der Malgeneration Manche der konkreten Objekte lassen sich gezielt erfassen und generieren, bei manchen Malmodellen kann es sein, dass die Ideen sogar missverstanden werden.

Wie in den generierten Ergebnissen in der Abbildung unten gezeigt, verstand Wen Xin: „Wer das Tao sieht und die Berge vergisst, wird einsam auf der Welt sein, und diejenigen, die das tun.“ Sehen Sie die Berge und vergessen Sie, dass das Tao auch in den Bergen laut sein wird“ als taoistischer Konzeptgedanke (der das Bild eines taoistischen Priesters erzeugt). Das Wenlan-Malmodell kann die buddhistischen Gedanken des Eingabetextes gut interpretieren und in den generierten Bildern widerspiegeln.

Schließlich wählte das Team in Bezug auf Taoistisches Denken die drei wichtigsten Sätze aus Tao Te Ching. Im Vergleich zu Dream Stealer, Disco Diffusion, Midjourney und Stable Diffusion verfügt Wen Xin über eine bessere Fähigkeit, das Tao Te Ching zu interpretieren.

Aber insgesamt interpretiert das Wenlan-Malmodell das taoistische Denken genauer und die erzeugten Bilder haben eine eher taoistische künstlerische Konzeption.

Zusammenfassung

Das Wenlan-Team kombiniert die kürzlich beliebte AI-Gemäldegenerierungstechnologie mit dem chinesischen multimodalen Pre-Training-Modell Wenlan, in- Tiefe Das Potenzial des Wenlan-Modells in der traditionellen chinesischen Kultur wird durch das generative Modell erforscht und in Form von Bildern dargestellt, damit die breite Öffentlichkeit ein intuitiveres Verständnis einiger tiefgreifender traditioneller chinesischer Kulturideen erlangen kann.

Das obige ist der detaillierte Inhalt vonEin KI-Malmodell mit einem starken Verständnis der traditionellen chinesischen Kultur. Die Gemälde sind greifbar und spirituell und vermitteln Konfuzianismus, Buddhismus und Taoismus.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Web3 Trading Platform Ranking_Web3 Globale Top Ten Summary Top Ten Summary Web3 Trading Platform Ranking_Web3 Globale Top Ten Summary Top Ten Summary Apr 21, 2025 am 10:45 AM

Binance ist der Overlord des Global Digital Asset Trading -Ökosystems, und seine Merkmale umfassen: 1. Das durchschnittliche tägliche Handelsvolumen übersteigt 150 Milliarden US -Dollar, unterstützt 500 Handelspaare, die 98% der Mainstream -Währungen abdecken. 2. Die Innovationsmatrix deckt den Markt für Derivate, das Web3 -Layout und den Bildungssystem ab; 3. Die technischen Vorteile sind Millisekunden -Matching -Engines mit Spitzenvolumina von 1,4 Millionen Transaktionen pro Sekunde. 4. Compliance Progress hält 15 Länderlizenzen und legt konforme Einheiten in Europa und den Vereinigten Staaten ein.

Top 10 Cryptocurrency Exchange -Plattformen Die weltweit größte Liste der digitalen Währung Top 10 Cryptocurrency Exchange -Plattformen Die weltweit größte Liste der digitalen Währung Apr 21, 2025 pm 07:15 PM

Börsen spielen eine wichtige Rolle auf dem heutigen Kryptowährungsmarkt. Sie sind nicht nur Plattformen, an denen Investoren handeln, sondern auch wichtige Quellen für Marktliquidität und Preisentdeckung. Der weltweit größte virtuelle Währungsbörsen gehören zu den Top Ten, und diese Börsen sind nicht nur im Handelsvolumen weit voraus, sondern haben auch ihre eigenen Vorteile in Bezug auf Benutzererfahrung, Sicherheit und innovative Dienste. Börsen, die über die Liste stehen, haben normalerweise eine große Benutzerbasis und einen umfangreichen Markteinfluss, und deren Handelsvolumen und Vermögenstypen sind häufig mit anderen Börsen schwer zu erreichen.

Wie man Verluste nach dem ETH -Upgrade vermeidet Wie man Verluste nach dem ETH -Upgrade vermeidet Apr 21, 2025 am 10:03 AM

Nach dem ETH -Upgrade sollten Anfänger die folgenden Strategien anwenden, um Verluste zu vermeiden: 1. Machen Sie ihre Hausaufgaben und verstehen Sie das Grundwissen und aktualisieren Sie Inhalte von ETH; 2. Kontrollpositionen, testen Sie die Gewässer in kleinen Mengen und diversifizieren Investitionen; 3. Machen Sie einen Handelsplan, klären Sie die Ziele und setzen Sie Stop -Loss -Punkte. 4. Profile rational und vermeiden emotionale Entscheidungen; 5. Wählen Sie eine formelle und zuverlässige Handelsplattform; 6. Betrachten Sie die langfristige Beteiligung, um die Auswirkungen kurzfristiger Schwankungen zu vermeiden.

Was sind die zehn besten Plattformen im Währungsaustauschkreis? Was sind die zehn besten Plattformen im Währungsaustauschkreis? Apr 21, 2025 pm 12:21 PM

Zu den Top -Börsen gehören: 1. Binance, das weltweit größte Handelsvolumen, unterstützt 600 Währungen und die Spot -Handhabungsgebühr beträgt 0,1%. 2. OKX, eine ausgewogene Plattform, unterstützt 708 Handelspaare, und die dauerhafte Vertragsabwicklungsgebühr beträgt 0,05%. 3. Gate.io deckt 2700 kleine Währungen ab, und die Gebühr für die Spot-Handhabung beträgt 0,1%-0,3%; 4. Coinbase, der US -Konformitäts -Benchmark, die Spot -Handhabungsgebühr beträgt 0,5%; 5. Kraken, die Top -Sicherheit und regelmäßige Reserveprüfung.

Was bedeutet Cross-Chain-Transaktion? Was sind die Cross-Chain-Transaktionen? Was bedeutet Cross-Chain-Transaktion? Was sind die Cross-Chain-Transaktionen? Apr 21, 2025 pm 11:39 PM

Börsen, die Cross-Chain-Transaktionen unterstützen: 1. Binance, 2. Uniswap, 3. Sushiswap, 4. Kurvenfinanzierung, 5. Thorchain, 6. 1inch Exchange, 7. DLN-Handel, diese Plattformen unterstützen Multi-Chain-Asset-Transaktionen durch verschiedene Technologien.

Warum ist der Anstieg oder Abfall der virtuellen Währungspreise? Warum ist der Anstieg oder Abfall der virtuellen Währungspreise? Warum ist der Anstieg oder Abfall der virtuellen Währungspreise? Warum ist der Anstieg oder Abfall der virtuellen Währungspreise? Apr 21, 2025 am 08:57 AM

Faktoren der steigenden Preise für virtuelle Währung sind: 1. Erhöhte Marktnachfrage, 2. Verringertes Angebot, 3.. Rückgangsfaktoren umfassen: 1. Verringerte Marktnachfrage, 2. Erhöhtes Angebot, 3. Streik der negativen Nachrichten, 4. Pessimistische Marktstimmung, 5. makroökonomisches Umfeld.

Worldcoin (WLD) Preisprognose 2025-2031: Wird WLD bis 2031 $ erreichen? Worldcoin (WLD) Preisprognose 2025-2031: Wird WLD bis 2031 $ erreichen? Apr 21, 2025 pm 02:42 PM

Worldcoin (WLD) fällt auf dem Kryptowährungsmarkt mit seinen einzigartigen biometrischen Überprüfungs- und Datenschutzschutzmechanismen auf, die die Aufmerksamkeit vieler Investoren auf sich ziehen. WLD hat mit seinen innovativen Technologien, insbesondere in Kombination mit OpenAI -Technologie für künstliche Intelligenz, außerdem unter Altcoins gespielt. Aber wie werden sich die digitalen Vermögenswerte in den nächsten Jahren verhalten? Lassen Sie uns den zukünftigen Preis von WLD zusammen vorhersagen. Die Preisprognose von 2025 WLD wird voraussichtlich im Jahr 2025 ein signifikantes Wachstum in WLD erzielen. Die Marktanalyse zeigt, dass der durchschnittliche WLD -Preis 1,31 USD mit maximal 1,36 USD erreichen kann. In einem Bärenmarkt kann der Preis jedoch auf rund 0,55 US -Dollar fallen. Diese Wachstumserwartung ist hauptsächlich auf Worldcoin2 zurückzuführen.

Rangliste der Hebelbörsen im Währungskreis Die neuesten Empfehlungen der zehn meistgezogenen Börsen im Währungskreis Rangliste der Hebelbörsen im Währungskreis Die neuesten Empfehlungen der zehn meistgezogenen Börsen im Währungskreis Apr 21, 2025 pm 11:24 PM

Die Plattformen, die im Jahr 2025 im Leveraged Trading, Security und Benutzererfahrung hervorragende Leistung haben, sind: 1. OKX, geeignet für Hochfrequenzhändler und bieten bis zu 100-fache Hebelwirkung; 2. Binance, geeignet für Mehrwährungshändler auf der ganzen Welt und bietet 125-mal hohe Hebelwirkung; 3. Gate.io, geeignet für professionelle Derivate Spieler, die 100 -fache Hebelwirkung bietet; 4. Bitget, geeignet für Anfänger und Sozialhändler, die bis zu 100 -fache Hebelwirkung bieten; 5. Kraken, geeignet für stetige Anleger, die fünfmal Hebelwirkung liefert; 6. Bybit, geeignet für Altcoin -Entdecker, die 20 -fache Hebelwirkung bietet; 7. Kucoin, geeignet für kostengünstige Händler, die 10-fache Hebelwirkung bietet; 8. Bitfinex, geeignet für das Seniorenspiel

See all articles