Vor zwei Jahren gewann beim Kunstwettbewerb der Colorado State Fair ein Werk namens „Space Opera“ den ersten Platz.
Dieses Gemälde ist majestätisch, hell und dunkel und erinnert stark an den französischen symbolistischen Maler Gustave Moreau. Es wurde jedoch nicht von einem Menschen gezeichnet, sondern von einem Teilnehmer ohne Zeichenkenntnisse, der ein KI-Zeichenwerkzeug verwendete.
Drehen wir die Zeit zurück ins Jahr 2018. Damals wurde ein KI-Gemälde namens „Portrait of Edmund Bellamy“ im Auktionshaus Christie’s in New York für mehr als 400.000 US-Dollar verkauft. Dies ist das erste Werk der künstlichen Intelligenz, das versteigert wird, was auch den Beginn der Anerkennung von KI-Kunstwerken durch den Markt markiert.
Heutzutage ist KI-Malerei alltäglich geworden, und KI-Spieler im In- und Ausland verlassen nacheinander das Feld und lassen diese Spur in Rauch aufgehen.
Zum Beispiel liefern sich die bekannten ausländischen KI-Fotogenerierungsanwendungen Midjourney, Stable Diffusion und DALL-E ständig Kämpfe mit Göttern; auch inländische Unternehmen wie Byte, Alibaba und Tencent bringen hin und wieder neue Produkte und Funktionen auf den Markt Dann.
Es gibt jedoch verschiedene KI-Malanwendungen. Wie kann man für KI-Enthusiasten eine stärkere Bild-Text-Übereinstimmung erreichen? Wie lassen sich ästhetisch ansprechendere Bilder erzeugen? Wie kann das Vincent-Diagrammmodell effizient eingesetzt werden?
Die sechste Folge von „AIGC Experience School“ wird sich mit diesem Thema befassen.
Das Videoprogramm „AIGC Experience Party“ wird gemeinsam von Volcano Engine, NVIDIA, dieser Website und CMO CLUB ins Leben gerufen und bringt viele Fachleute aus dem Marketingbereich zusammen, um die Anwendung, Denkweise und Praxis der AIGC-Technologie zu diskutieren.
In dieser Folge werden zwei hochrangige Gäste aus der Branche die technischen Zusammenhänge hinter hochästhetischen Textbildern eingehend analysieren und allen zeigen, wie man eine stärkere Bild-Text-Übereinstimmung erreicht.
Live-Übertragungszeit: 6. August 19:00-19:40 Uhr
Live-Übertragungsthema: Fantasy-Bildgebung, die technische Verbindung hinter den wunderschönen vinzentinischen Bildern
Sechstes In der Folge der Sendung waren zwei wichtige Gäste eingeladen, nämlich Zhang Liang, technischer Experte von Doubao Wenshengtu, und Zhao Yijia, NVIDIA-Lösungsarchitekt.
Benutzer müssen nur ein paar einfache Aufforderungswörter eingeben, und die KI kann automatisch realistische und filigrane Gemälde erstellen. Ob es sich um die zarte Textur der klassischen Ölgemälde, den freien Ausdruck moderner abstrakter Kunst oder die tiefgründige künstlerische Konzeption der orientalischen Tuschemalerei handelt, es lässt sich mit Leichtigkeit schaffen. Es kann nicht nur die Stile berühmter Maler der Geschichte erlernen und nachahmen, sondern auch neue Kunstgenres schaffen und den Benutzern beispiellose kreative und interaktive Erlebnisse bieten.
Heutzutage hat sich die KI-Malerei zu einem „anspruchsvollen“ Zustand entwickelt, sogar bis zu dem Punkt, an dem es schwierig ist, zwischen wahr und falsch zu unterscheiden.
Zum Beispiel so:
oder so:
Gerade wegen seiner einzigartigen Kreativität und seinem immersiven interaktiven Erlebnis ist AI Wenshengtu zum „Duft“ geworden, um den große KI-Hersteller konkurrieren . Kuchen".
Byte hat beispielsweise KI-Produkte wie Jiuying, Xinghui und Jimeng auf einmal auf den Markt gebracht. Sie alle verfügen ausnahmslos über Wenshengtu-Funktionen und sind untrennbar mit dem Doubao Wenshengtu Large-Modell von Byte verbunden.
Für das vinzentinische Diagrammmodell gibt es nichts weiter als drei Dinge, um die „Gunst“ der Benutzer zu gewinnen: eine stärkere Bild-Text-Übereinstimmung, schönere Bildeffekte und ein schnelleres Generierungserlebnis.
Wie erreicht das Doubao Wensheng Picture Model eine stärkere Bild-Text-Übereinstimmung, um den Designvorstellungen des Benutzers gerecht zu werden? Wie lassen sich ästhetischere Bilder generieren, um ein ultimativeres Benutzererlebnis zu bieten? Wie können Diagramme schneller erstellt werden, um extrem große Serviceeinsätze zu bewältigen?
Die Antworten auf diese Fragen gibt es in der sechsten Ausgabe der „AIGC Experience Party“.
Kommen Sie am 6. August um 19:00 Uhr in den Live-Übertragungsraum, um „Fantasy Imaging, die technische Verbindung hinter hochschönen vinzentinischen Bildern“ anzusehen. Scannen Sie den QR-Code, um direkt zum Live-Übertragungsraum zu gelangen .
Rückblick auf die letzte Ausgabe
In der fünften Live-Übertragung der „AIGC Experience Party“ sprechen Zhang Jianyang, Leiter Inhaltssicherheit und Risikokontrolle bei Volcano Engine, und He Kun, Senior Manager der NVIDIA Enterprise Developer Community , gab eine ausführliche Analyse von AIGC im Marketingbereich, Innovations- und Sicherheitsfragen, und erläuterte, wie man angesichts von Veränderungen nachhaltiges Wachstum und eine stetige Geschäftsentwicklung erreichen kann.
Wie wir alle wissen, entwickelt sich die AIGC-Technologie nach und nach zu einem innovativen Werkzeug für das Unternehmensmarketing. Es kann Marketingfachleuten dabei helfen, in beispielloser Geschwindigkeit einfallsreiche Marketingmaterialien zu erstellen. Durch die einfache Eingabe einiger Schlüsselwörter oder Schlagworte können in kurzer Zeit automatisch attraktive Marketingtexte, Bilder und Marketingvideos erstellt werden.
Allerdings verbessert AIGC wie jede technologische Innovation zwar die Marketingkreativität und -effizienz, bringt aber auch viele Sicherheitsprobleme mit sich.
Zhang Jianyang, Leiter für Inhaltssicherheit und Risikokontrolle bei Volcano Engine, demonstrierte anhand realer Fälle, wie die KI-Technologie von Volcano Engine Vermarkter „schützen“ kann.
Zhang Jianyang sagte, dass die Illusion großer Modelle dazu führt, dass die Ausgabeergebnisse nicht vollständig kontrollierbar sind, was zu verschiedenen potenziellen Inhaltsrisiken bei Marketinginhalten führt. Beispielsweise enthält die von der AIGC-Technologie erstellte Marketingkopie „absolute“ Begriffe wie „Beste“, „Erste“, „Weltklasse“, „Erste im gesamten Netzwerk“ usw., und die generierten Marketingbilder oder -videos können beispielsweise „absolute“ Begriffe enthalten Wenn schlechte Inhalte in der Werbung erscheinen, schaden sie nicht nur dem Image der Marke, sondern lösen auch Abscheu in der Öffentlichkeit aus.
In diesem Zusammenhang bietet Volcano Engine einen kompletten Satz gezielter Content-Risikoerkennungs-Engines. Durch seine multimodale Content-Unterstützung, diversifizierte Risikomodelle und Echtzeit-Risikobewertungsfunktionen schafft es eine umfassende und effiziente Risikomanagementlösung .
Um das Problem der Risikovielfalt in Marketingmaterialien anzugehen, verfügt die Erkennungsmaschine unter anderem über integrierte Hunderte von Risikomodellen. Beispielsweise kann das für Marketingtexte geeignete Erkennungsmodell für Werbeterminologie genau bestimmen, ob der Text absolute Begriffe, falsche Propaganda und illegale Inhalte enthält, die zum Konsum anregen, während das für Marketingvideos geeignete Erkennungsmodell für Bildqualität und Urheberrecht feststellen kann, ob der Text Folgendes enthält: absolute Begriffe, falsche Propaganda und illegale Inhalte, die zum Konsum anregen, ob sie schlechte Bilder und minderwertige Inhalte enthalten und ob die Möglichkeit eines Verstoßes besteht.
Um Zielbenutzer effektiv zu konvertieren, investieren Unternehmen außerdem häufig stark in verschiedene Marketingaktivitäten, wie z. B. Neulingsprämien, Aufgabenbelohnungen usw., um die Bindung der Benutzer zu erhöhen. Allerdings können diese verlockenden Belohnungsmechanismen in den Augen illegaler Unternehmen auch zu „fettem Fleisch“ werden. Sie nutzen Schlupflöcher, um zu betrügen und die Marketinggelder des Unternehmens an sich zu reißen.
Als beispielsweise ein Automobilhersteller Online-Marketing-Aktivitäten durchführte, stieß er auf zwei heikle Probleme: falsche Hilfestellungen und falsche Probefahrten. Nach dem Zugriff auf das intelligente Risikokontrollprodukt Volcano Engine identifizierten sie in nur zwei Monaten effektiv 1,08 Millionen abnormale Verhaltensweisen, mehr als 30.000 abnormale Konten und mehr als 20.000 abnormale Geräte, und der direkte Stop-Loss-Betrag erreichte 500.000 Yuan Reduzieren Sie effektiv die Verschwendung von Marketingausgaben und verbessern Sie auch die Geschäftskonversionsrate erheblich.
He Kun, Senior Manager der NVIDIA Enterprise Developer Community, stellte ein supercooles Tool vor – NeMo Guardrails, das wie ein „Leibwächter“ für große Sprachmodelle ist, um sie daran zu hindern, Unsinn zu reden.
Laut He Kun ist NeMo Guardrails eine Open-Source-Toolbibliothek, die die Ausgabe großer Sprachmodelle durch das Hinzufügen programmierbarer Leitplanken steuert, um sensible Themen, unangemessene Bemerkungen und böswillige Angriffe zu verhindern. Es umfasst drei wichtige Leitplanken: Themenbeschränkung, Konversationssicherheit und Angriffsabwehr. Es unterstützt benutzerdefinierte Konversationslogik und stellt sicher, dass die Reaktion des Konversationsroboters spezifischen Anforderungen und vordefinierter Logik entspricht.
Der Arbeitsablauf von NeMo Guardrails umfasst den Empfang von Benutzereingaben, den Abgleich generierter Leitplanken, die Ausführung des Konversationslogikflusses und die Generierung von Bot-Antworten. Es definiert die Konversationslogik mithilfe von Colang, einer Sprache für die Konversations-KI-Modellierung, die gut lesbar und skalierbar ist. Darüber hinaus können NeMo Guardrails in Verbindung mit LangChain verwendet werden, um mehrere große Sprachmodell-Dialog-Engines zu unterstützen und so eine sicherere Ausgabe des Dialogsystems zu erreichen.
Adresse für die Betrachtung der Rezension zur fünften Ausgabe: https://vtizr.xetlk.com/s/7CjTy (oder identifizieren Sie den QR-Code unten).
Das obige ist der detaillierte Inhalt vonKI hilft menschlichen Malern, bei Kunstwettbewerben den ersten Platz zu gewinnen. Was ist das Geheimnis dahinter?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!