


Dieser KI-Meister, der Chinesisch versteht, die Berge und der helle gemalte Mond sind so erstaunlich! Das zweisprachige AltDiffusion-Modell Chinesisch-Englisch ist Open Source
Kürzlich hat das große Modellforschungsteam des Zhiyuan Research Institute das neueste zweisprachige AltDiffusion-Modell als Open-Source-Version veröffentlicht und damit der chinesischen Welt eine leistungsstarke KI-Text- und Grafikerstellung auf professionellem Niveau zugänglich gemacht:
Unterstützt die erweiterte Erstellung feiner Langformate Chinesische Aufforderungen; ohne kulturelle Übersetzung, aus der ursprünglichen chinesischen Sprache, die sowohl mit der Form als auch mit dem Geist direkt mit der chinesischen Malerei spricht, und die schockierende visuelle Wirkung auf Chinesisch und Englisch auf einem niedrigen Niveau erreicht hat Man kann sagen, dass er ein Weltklasse-KI-Malmeister ist, der Chinesisch spricht.
Das innovative Modell AltCLIP ist der Eckpfeiler dieser Arbeit und ergänzt das ursprüngliche CLIP-Modell um drei stärkere sprachübergreifende Funktionen. Sowohl die AltDiffusion- als auch die AltCLIP-Modelle sind mehrsprachige Modelle. Die Zweisprachigkeit in Chinesisch und Englisch ist die erste Stufe der Arbeit, und der Code und die Modelle sind Open Source.
AltDiffusion
https://github.com/FlagAI-Open/FlagAI/tree/master/examples/AltDiffusion
AltCLIP
https:// github.com/FlagAI-Open/FlagAI/examples/AltCLIP
HuggingFace-Weltraumversuchsadresse:
https://huggingface.co/spaces/BAAI/bilingual_stable_diffusion
Technisch Bericht
https://arxiv.org/abs/2211.06679
Professionelle chinesische AltDiffusion
——Lange, schnelle, feine Malerei + muttersprachlicher chinesischer Stil, zufriedenstellend Chinesische KI Hohe Nachfrage für kreative Meister
Dank der leistungsstarken zweisprachigen Ausrichtungsfunktionen für Chinesisch und Englisch auf Basis von AltCLIP hat AltDiffusion ein ähnliches visuelles Effektniveau wie Stable Diffusion erreicht, insbesondere mit dem einzigartigen Vorteil, dass es Chinesisch besser versteht und besser in chinesischer Malerei ist . , was den Erwartungen professioneller chinesischer KI-Text- und Bildersteller sehr gerecht wird.
1. Lange Eingabeaufforderungen, der Bildeffekt ist nicht minderwertig.
Die Eingabeaufforderungslänge ist der Wendepunkt, um die Fähigkeit des Modells zu testen, Text und Bilder zu generieren , Bild- und Textausrichtung und sprachübergreifend.
Unter den gleichen langen Eingabeaufforderungsanpassungen für Chinesisch und Englisch ist AltDiffusion in vielen Fällen der Bilderzeugung noch ausdrucksvoller: Die Elementzusammensetzung ist reichhaltig und aufregend, und die Details werden feinfühlig und genau beschrieben.
2. Verstehen Sie Chinesisch besser und beherrschen Sie die chinesische Malerei.
Zusätzlich zur ähnlichen Eingabeleistung chinesischer und englischer Eingabeaufforderungen kann AltDiffusion auch die Mängel des chinesischen Malstils in der westlichen Welt ausgleichen , unter Verwendung chinesischer Bilder und Texte, um fortzufahren. Feinabstimmung der Generierung chinesischer Merkmale, wie z. B. des chinesischen Malstil-Generierungsmodells, um einen echten „chinesischen Stil“ zu erzeugen.
AltDiffusion versteht Chinesisch besser. Es kann die Bedeutung im chinesischen Kulturkontext beschreiben und die Absicht des Schöpfers sofort verstehen. Beispielsweise vermeidet die Beschreibung von „Die große Szene der Tang-Dynastie“, aufgrund kultureller Missverständnisse vom Thema abzuweichen.
Vor allem Konzepte, die aus der chinesischen Kultur stammen, verstehen und drücken wir sie genauer aus und vermeiden so die lächerliche Verwechslung zwischen „japanischem Stil“ und „chinesischem Stil“. Wenn beispielsweise Eingabeaufforderungen entsprechend dem Tang-Anzug-Zeichenstil mit stabiler Diffusion in Chinesisch und Englisch eingegeben werden, ist der Unterschied auf einen Blick klar:
Bei der Generierung eines bestimmten Stils wird der chinesische Kulturkontext berücksichtigt als Identitätssubjekt für die Stilerstellung verwendet werden, z. B. Für die Eingabeaufforderung mit „alten Gebäuden“ unten werden standardmäßig alte chinesische Gebäude generiert. Der kreative Stil entspricht eher der Identität chinesischer Schöpfer. 3. Zweisprachige, generierte Effektausrichtung für Chinesisch und Englisch . Dank der leistungsstarken Sprachausrichtungsfunktionen von AltCLIP kommt der Generierungseffekt von AltDiffusion der stabilen Diffusion in Englisch sehr nahe und spiegelt auch die Konsistenz der zweisprachigen Leistung in Chinesisch und Englisch wider.
Nachdem Sie beispielsweise die chinesischen und englischen Eingabeaufforderungen „Welpe mit Hut“ in AltDiffusion eingegeben haben, werden die generierten Bildeffekte grundsätzlich mit extrem hoher Konsistenz ausgerichtet:
Fügen Sie den Deskriptor zum „Jungen“ hinzu „Bild als Nach „Chinese Boy“, basierend auf dem Originalbild eines kleinen Jungen, wurde er genau in ein typisches „chinesisches“ Kind umgewandelt und zeigte ein hervorragendes Sprachverständnis und genaue Ausdrucksergebnisse bei der Sprachkontrollerzeugung.
Öffnen Sie das ursprüngliche Ökosystem von StableDiffusion
——Umfassende ökologische Tools und PromptsBook-Anwendungen, hervorragende Spielbarkeit
Besonders erwähnenswert ist, dass die ökologischen Integrationsfähigkeiten von AltDiffusion:
Prompts sind sehr wichtig für die Generierung von Modellen. Community-Benutzer haben durch eine große Anzahl von Prompt-Versuchen umfangreiche Generierungseffekte gesammelt. Diese wertvollen Eingabeaufforderungserfahrungen gelten fast alle für AltDiffusion-Benutzer! Darüber hinaus können Sie auch Chinesisch und Englisch kombinieren, um sie an einige magische Stile und Elemente anzupassen, oder weiterhin chinesische Eingabeaufforderungen erkunden, die für AltDiffusion geeignet sind. Die Open-Source-AltDiffusion bietet eine Grundlage für chinesische Generierungsmodelle. Auf dieser Grundlage können Sie mehr chinesische Daten in bestimmten Bereichen verwenden, um das Modell zu optimieren Ausdruck chinesischer Schöpfer. - Umfassende Verbesserung der drei wichtigsten sprachübergreifenden Funktionen: Chinesisch-Englisch-Ausrichtung, Chinesisch besser, extrem niedrige Schwelle Sprachverständnis, Bild- und Textausrichtung, sprachübergreifende Funktionen Es handelt sich um drei Kompetenzen, die für die sprachübergreifende Forschung erforderlich sind. Viele professionelle Funktionen von AltDiffusion basieren auf der innovativen Idee des Turmwechsels von AltCLIP, die in diesen drei Hauptfunktionen vollständig verbessert wurde: Die Sprachausrichtungsfunktionen für Chinesisch und Englisch mit dem Original-CLIP wurden erheblich verbessert, und das ist möglich Es ist nahtlos mit Stable Diffusion und anderen auf dem ursprünglichen CLIP basierenden Modellen und ökologischen Tools verbunden und verfügt gleichzeitig über starke chinesische Fähigkeiten, um bei mehreren Datensätzen bessere Ergebnisse auf Chinesisch zu erzielen. (Ausführliche Erläuterungen finden Sie im technischen Bericht.) Es ist erwähnenswert, dass diese Ausrichtungsmethode die Schwelle für das Training mehrsprachiger und multimodaler Darstellungsmodelle im Vergleich zum erneuten Vortraining von Chinesisch oder Chinesisch erheblich verringert Für englische Bild- und Textpaare werden nur etwa 1 % der Rechenressourcen und Bild-Text-Daten benötigt. Erzielte den gleichen Effekt wie die englische Originalversion im umfassenden CLIP-Benchmark Es übertraf die Originalversion Flicker-30K bei einigen Abrufdatensätzen wie zum Beispiel Flimmern -30K Die Leistung ist besser als beim Original-CLIP. Das Null-Schuss-Ergebnis auf Chinese ImageNet ist das beste3. Nutzen Sie das Community Stable Prompts Book voll aus.
4. Praktisch für chinesische Entwickler zur Feinabstimmung
Basierend auf dem ersten zweisprachigen AltCLIP
Das obige ist der detaillierte Inhalt vonDieser KI-Meister, der Chinesisch versteht, die Berge und der helle gemalte Mond sind so erstaunlich! Das zweisprachige AltDiffusion-Modell Chinesisch-Englisch ist Open Source. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Das Char -Array speichert Zeichensequenzen in der C -Sprache und wird als char Array_name [Größe] deklariert. Das Zugriffselement wird durch den Einweisoperator weitergeleitet, und das Element endet mit dem Null -Terminator '\ 0', der den Endpunkt der Zeichenfolge darstellt. Die C -Sprache bietet eine Vielzahl von String -Manipulationsfunktionen wie Strlen (), Strcpy (), Strcat () und strcmp ().

Eine Strategie zur Vermeidung von Fehlern, die in C -Switch -Anweisungen standardmäßig verursacht wurden: Verwenden Sie die Umgebungen anstelle von Konstanten, wodurch der Wert der Fallerklärung auf ein gültiges Mitglied des Enum beschränkt wird. Verwenden Sie in der letzten Fallanweisung Falsch, um das Programm weiterhin den folgenden Code auszuführen. Fügen Sie für Switch -Anweisungen ohne Falle immer eine Standardanweisung für die Fehlerbehandlung hinzu oder geben Sie das Standardverhalten an.

Es gibt keine integrierte Summenfunktion in der C-Sprache, daher muss sie selbst geschrieben werden. Die Summe kann erreicht werden, indem das Array durchquert und Elemente akkumulieren: Schleifenversion: Die Summe wird für die Schleifen- und Arraylänge berechnet. Zeigerversion: Verwenden Sie Zeiger, um auf Array-Elemente zu verweisen, und eine effiziente Summierung wird durch Selbststillstandszeiger erzielt. Dynamisch Array -Array -Version zuweisen: Zuordnen Sie Arrays dynamisch und verwalten Sie selbst den Speicher selbst, um sicherzustellen, dass der zugewiesene Speicher befreit wird, um Speicherlecks zu verhindern.

In der C -Sprache können Sie verwenden !! x, aber es verwendet nur zwei boolesche Conversions, und es ist prägnanter und effizienter, X direkt zu verwenden.

Die Standardanweisung ist in der Switch -Fallanweisung von entscheidender Bedeutung, da sie einen Standardverarbeitungspfad enthält, der sicherstellt, dass ein Codeblock ausgeführt wird, wenn der variable Wert an keine Fallanweisung übereinstimmt. Dies verhindert unerwartetes Verhalten oder Fehler und verbessert die Robustheit des Codes.

Das statische Schlüsselwort wirkt sich auf den Umfang und den Lebenszyklus der Kennung aus: Globale Variable: begrenzt auf die Quelldatei, nur in der aktuellen Datei sichtbar und vermeiden Konflikte. Funktion: Auf die Quelldatei begrenzt ist sie nur in der aktuellen Datei sichtbar, wodurch Implementierungsdetails versteckt und die Kapselung verbessert werden. Lokale Variablen: Der Lebenszyklus wird auf das gesamte Programm ausgedehnt, wobei die Werte zwischen Funktionsaufrufen beibehalten werden, und kann verwendet werden, um Zustände aufzuzeichnen, aber auf das Speicherverwaltungsrisiken zu achten.

Das externe Schlüsselwort wird in der C -Sprache verwendet, um externe Variablen und Funktionen zu deklarieren. Es teilt dem Compiler mit, dass die Variable oder Funktion an anderer Stelle definiert wird, wodurch der Compiler angewiesen wird, während der Verknüpfung nach ihrer Definition zu suchen. Wenn extern externe Variablen deklariert werden, wird der Speicherplatz nicht zugewiesen und seine Definition in anderen Dateien durchgeführt. Wenn die externe externe Funktionen erklärt, enthält sie keine Funktionsimplementierungen, und seine Implementierung wird auch in anderen Dateien durchgeführt. Die Verwendung von externen Schlüsselwörtern wird normalerweise mit Header -Dateien kombiniert, was der Codeverwaltung förderlich ist und wiederholte Deklarationen vermeidet. Es ist sehr wichtig, den Umgang mit Extern mit Multi-File-Zusammenstellung und Namenskonflikten zu verstehen, und es spielt eine Schlüsselrolle beim Verknüpfungsprozess.

Der logische Nichtoperator (!) Hat die Priorität neben Klammern, was bedeutet, dass er den meisten anderen Betreibern in Ausdrücken vorausgeht. Das Verständnis der Priorität erfordert nicht nur ein Auswendiglernen, sondern auch das Verständnis der Logik und der potenziellen Fallstricke, um nicht nachweisbare Fehler in komplexen Ausdrücken zu vermeiden. Das Hinzufügen von Klammern kann die Ausdrucksabsicht klären, die Klarheit und Wartbarkeit der Code verbessern und unerwartetes Verhalten verhindern.
