Bald wurde Stable Diffusion für einen neuen Zweck entdeckt –
Die wichtigste „Kombination von Form und Bedeutung“ beim Entwerfen eines LOGOs wird dadurch klar erfasst. Ich sah, wie Cat sofort einen Katzenkopf zeichnete:
Yoga shop YOGA Die Buchstaben werden in die menschliche Form umgewandelt und der Stil stimmt völlig:
Es ist kein Problem, nur einen der Buchstaben zu entwerfen, z Zeichne zum Beispiel das D für Hund. Werde ein Hund:
Es ist wahr, prägnant und ausdrucksstark, nicht wahr?
Selbst angesichts chinesischer Schriftarten kann die KI die Bedeutung sehr gut verstehen und schnell das LOGO-Bild zeichnen, das Partei A vermitteln möchte:
Wenn Sie ein Geschäft eröffnen und dieses nutzen, warum sollten Sie dann Geld ausgeben? Dutzende Dollar? Hundert Yuan, um ein Logo zu entwerfen? (Doge)
Obwohl es schon viele KIs gab, die Logos entworfen haben, ist es, gemessen an der diesmal erzeugten Wirkung, wirklich etwas anders.
Tatsächlich gab es vor dieser Studie bereits viele Studien darüber, wie KI zum Entwerfen von Logos eingesetzt werden kann.
Aus Sicht der Wirkung kann es hauptsächlich in drei Kategorien unterteilt werden:
Die erste besteht darin, die Schriftart als Formbeschränkung für die Übertragung des Bildstils zu verwenden (Abbildung AB); die zweite besteht darin, den Bildstil als zu verwenden die Basis, um die Schriftart auf das Bild zu übertragen (Abbildung D); die dritte besteht darin, die Formen und Schriftarten verschiedener Bilder zu verknüpfen, um ein farbiges oder schwarz-weißes Logo-Design im „Bildspleiß“-Stil zu erzeugen (Abbildung CE).
Verglichen mit dem von Menschenhand entworfenen LOGO unten kann der Effekt des KI-Designs oben jedoch nicht als unansehnlich bezeichnet werden, aber er scheint etwas weniger interessant zu sein:
Nach einer Nach gründlicher Untersuchung stellten die Autoren fest, dass das von Menschenhand entworfene Logo nicht „im Rampenlicht steht“.
Menschliche Designer behalten die ursprünglichen Schriftmerkmale bei, damit die Leute das Wort auf einen Blick erkennen können, und fügen dann einige Neuerungen hinzu, wie zum Beispiel die Änderung des J in Jazz in ein Musikinstrument, aber andere Leute können „JAZZ“ immer noch auf einen Blick erkennen Blick „Die Form der Schriftart.
Im Allgemeinen geht es darum, einen Teil des „Geschmacks“ der Schriftart beizubehalten und gleichzeitig einen gewissen Sinn für Design hinzuzufügen.
Zum Beispiel ist dies das von Stable Diffusion generierte „FROG“-Design. FRO hat immer noch die Form der Originalschrift, nur G wird zu einem kleinen herausspringenden Frosch:
Wenn Sie Stable Diffusion 2 verwenden für die weitere Nachbearbeitung. Bei der Bearbeitung kann die Farbfunktion weiter implementiert werden, um es lebendiger zu machen:
Der Stil des generierten LOGOs kann sich auch mit der Änderung der ursprünglichen Designschriftart ändern.
Zum Beispiel handelt es sich hierbei um verschiedene Yoga-LOGOs, die unter 8 Schriftarten generiert werden. Jeder Stil ist anders:
Im Gegensatz dazu behalten andere KI-Modelle beim Generieren von Schriftarten lieber ihre eigenen Stile bei (manuell Dog Head):
Also, wie hat diese magische Schriftdesign-KI sie geschaffen?
Um den Stil der Originalschrift bis zu einem gewissen Grad beizubehalten und nur bestimmte Buchstaben im Wort zu ändern, haben die Autoren eine Methode zur „Feinabstimmung“ der Buchstabenform entwickelt ——
Damit soll die KI lernen, mithilfe von Bezier-Kurven Buchstaben in verschiedenen Schriftarten leicht zu verformen.
(Freunde, die den „Stift“ in PS verwendet haben, sollten mit Bezier-Kurven vertraut sein. Verwenden Sie ihn, um die Maus zu steuern und einige magische Kurven zu zeichnen)
Die spezifische Anzahl der Kontrollpunkte wird entsprechend der Komplexität der Buchstaben und des Schriftstils iterativ transformiert, bis die entworfenen Buchstaben den Anforderungen entsprechen. Orange ist der Anfangspunkt und Blau sind die nachfolgenden hinzugefügten Kontrollpunkte:
Kontrollpunkte Wie viel Einfluss hat die Menge auf den Erzeugungseffekt?
Dies ist beispielsweise der Effekt der Verwendung einer unterschiedlichen Anzahl von Kontrollpunkten zur Erzeugung von Buchstaben. Wenn die Anzahl zu klein ist, wird die entworfene Bildform unklar sein, wenn die Anzahl jedoch zu groß ist, wird die ursprüngliche Form leicht verzerrt der Schriftart:
Basierend auf diesem Kern Für Designideen kombinierten die Autoren Stable Diffusion und CLIP, um ein vollständiges Schriftartendesign-KI-Modell zu entwerfen:
Darunter der ACAP-Verlust (so konform wie möglich). Die Funktion basiert auf dem Delaunay-Triangulationsalgorithmus, der die Buchstabenform weiter verfeinert.
Dies ist zum Beispiel die Form von PANTS (Hosen) vor und nach der Verformung. Sie können sehen, dass ACAP die Schriftform beibehält, während die Hosenform erhalten bleibt:
Gleichzeitig, um die Form weiter zu erhalten Die Autoren verwendeten einen Tiefpassfilter, um sicherzustellen, dass die angepassten Buchstaben nicht zu stark von den Originalbuchstaben abwichen. Dies ist zum Beispiel die angepasste Form von B in Bear:
Bei Anwendung dieser Modellreihe ist auch die Geschwindigkeit der Generierung jedes Buchstabens ziemlich gut.
Auf einer RTX 2080-GPU dauert es etwa 5 Minuten, um ein Logo-Design mit einem einzelnen Buchstaben zu erstellen.
Obwohl die von den Autoren auf der Projekthomepage veröffentlichten Beiträge anonym sind:
Auf arXiv wurden die Namen der Autoren jedoch veröffentlicht. Sie stammen von der Universität Tel Aviv, Israel , und Reichman University (Leichman University) und Goldsmiths, University of London:
Co-Autor Shir Iluz, Master of Science in Elektronik und Elektrotechnik von der Universität Tel Aviv KI, und seine Interessengebiete sind Deep Learning und Computer Vision.
Co-Autorin Yael Vinker, Doktorandin im Bereich Computer Vision an der Universität Tel Aviv, erhielt ihren Bachelor- und Master-Abschluss in Informatik von der Hebräischen Universität Israel. Seine aktuelle Forschungsrichtung liegt ebenfalls im Bereich Deep Learning und Computer Vision .
Es scheint, dass die 2 Millionen Yuan, die Lei Jun für die Gestaltung des Xiaomi-LOGO ausgegeben hat, zu früh ausgegeben wurden
Papieradresse: https://arxiv.org/abs/2303.01818
Projektadresse: https:// wordasimage.github .io/Word-As-Image-Page/
Das obige ist der detaillierte Inhalt vonDie Wirkung des kostenlosen KI-LOGO-Designs ist erstaunlich, Lei Jun hat 2 Millionen zu früh ausgegeben. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!