Machine Power Report
Herausgeber: Sia
Großes Modell ersetzt den Redaktionsassistenten und ist zuverlässiger als Laufen Sie als Fahrer. Viel mehr .
Es heißt, dass Selbstmedien Fotos von Trumps Ermordung als Illustrationen verwenden und 2.100 Yuan pro Bild verlangen!
Die Zeiten, in denen man nur ein Foto machte, um einen Artikel zu illustrieren, sind für immer vorbei.
Damit waren die Probleme der Macher jedoch noch nicht beendet.
Nachdem ich einen Artikel über die öffentliche Meinung geschrieben habe, sind die nächsten zehn Minuten die verwirrendsten:
Titelgeschäft, erstklassige Lage, jeder Zentimeter Land ist wertvoll. Sie müssen nicht nur die Highlights des Inhalts hervorheben, sondern auch sicherstellen, dass der Titel attraktiv genug ist, um darauf zu klicken. Das ist viel schwieriger als das Schreiben eines Artikels!
Was? Der Duft von Wein hat keine Angst vor der tiefen Gasse?
Im öffentlichen Kontokreis von Red Sea funktioniert das nicht.
Lassen Sie sich auch nicht entmutigen! Nach einer Weile haben wir festgestellt, dass das große Modell diese beiden täglichen Herausforderungen recht effektiv lösen kann.
-1-
Erstellen Sie in kürzester Zeit einen qualifizierten Titel
Um das Chatten zu erleichtern, nehmen wir diesen Berichtüber das neue Roboter-Basismodellunternehmen Skild AI als Beispiel.
Wenn Sie die Highlights kennen, die im Artikel hervorgehoben werden müssen, Sie aber einfach nicht wissen, wie Sie eine attraktive Permutation und Kombination erstellen, können Sie es dem großen Modell genauso gut sagen:
1 Dies ist ein Artikel für ein offizielles WeChat-Konto und braucht einen attraktiven Titel ;
2. Der Titel sollte die Datenvorteile, den Finanzierungsbetrag und den Roboter-GPT hervorheben
Das ist die Idee von Claude 3.5, nicht schlecht!
Können Sie nicht einmal herausfinden, was die Highlights sind?
Dann lassen Sie sich zunächst vom großen Model bei der Suche helfen und fokussieren Sie dann die gefundenen Highlights auf den Titel.
Die Fähigkeit des Sonetts Claude 3.5, zusammenzufassen, ist sehr gut.
Machen Sie sich nicht einmal die Mühe, an die Highlights zu denken? Dann folgen Sie einfach dem Beispiel!
Manche Leute sagen, dass ihnen der Titel im Stil „Diese Seite“ gefällt. Moment, wie riecht das? Wir haben es noch nicht wirklich gezählt.
Lassen Sie es vom großen Modell analysieren: Technologie und großes geistiges Eigentum sollten prominent und auffällig sein ...
Hmm, es sieht so aus.
gab den neuen Berichten mehrere ähnliche Titel. Es hat wirklich einen inneren Geschmack und die ersten drei können fast direkt verwendet werden, außer dass sie etwas lang sind.
Was ist, wenn Sie Titel im Weibo-Hot-Search-Stil bevorzugen?
Wir nehmen die Hot Search-Titel zu einem bestimmten Zeitpunkt am 15. Juli als Eingabe und lassen das große Modell die Eigenschaften dieser Hot Search-Titel analysieren.
Geben Sie diesem Artikel als Nächstes einen Titel im Stil einer heißen Suche. Ist es ok? Zumindest haben wir einen grundlegenden Plan zur weiteren Verbesserung (am Anfang ist alles schwierig):
Sie können auch nach weiteren Alternativen fragen:
Manche Leute mögen den professionellen und seriösen Stil von Schlagzeilen in Finanzmedien, bitte arrangieren Sie ihn .
Wir haben die Schlagzeilen der Caixin Weekly-Coverberichte aus drei Jahren gesammelt und sie von Claude 3.5 Sonett analysieren lassen.
Kurz, Wortspiel, großes Thema, problemorientiert ..., mehrere Kernpunkte wurden festgehalten:
Das sind mehrere Titel, die das große Vorbild für unseren Bericht erstellt hat.
Was ist drin? Sind die Stile der ersten drei Titel tatsächlich einigermaßen ähnlich?
-2-
Bilder imitieren, KI konzentriert sich auf eine Provinz
Um Urheberrechtsstreitigkeiten zu vermeiden, beginnen immer mehr Menschen, KI zur Erstellung des Cover von Artikeln zu verwenden.
Anstatt die KI ahnungslos und einfallsreich sein zu lassen, ziehen wir es in vielen Fällen vor, dass sie einige vorgefertigte Bilder direkt imitiert.
Im Allgemeinen lassen wir das große Modell zuerst Bilder betrachten und sprechen, geben Aufforderungswörter und geben diese Aufforderungswörter dann an den Bildgenerator weiter.
Dies ist die wahre Erfahrung eines Kollegen:
Wenn Sie feststellen, dass die Aufforderungswörter nicht einfach zu verwenden sind, können Sie das große Modell (Claude 3,5 Sonett) bitten, „die Details und den Inhalt des Bildes sorgfältig zu beschreiben“. ":
Dann verwenden Sie diese Beschreibung, die an den Bildgenerator geworfen wird:
Dieses Bild zeigt eine einzigartige und kontrastreiche Szene:
Hintergrund: Der Hintergrund des Bildes ist eine graue Betonwand, die rau, fleckig und rau aussieht strukturiert.
Sitz: In der Bildmitte steht eine einfache schwarze Bank oder Plattform, die ebenfalls aus Beton oder einem harten Material zu bestehen scheint.
Charakter: Ein junger Mann sitzt auf der rechten Seite der Bank. Er trug einen dunklen Anzug, einen Rollkragenpullover und eine Brille mit schwarzem Rand. Seine Haltung ist entspannt, die Hände liegen auf den Beinen.
Roboter: Auf der linken Seite der Bank sitzt ein kleiner weißer Roboter. Der Roboter hat einen runden Kopf mit roten, augenähnlichen Lichtern. Auf seinem Gehäuse befinden sich einige farbenfrohe Verzierungen, die wie ein Bedienfeld aussehen.
Licht: Das Licht auf dem Bild ist sehr markant. Es kommt von der rechten Seite und wirft Schatten von Menschen und Robotern auf die Wand und den Boden. Dieser Licht- und Schatteneffekt verleiht dem Bild Dramatik und Tiefe.
Ambiente: Die gesamte Szene vermittelt eine futuristische und technologische Atmosphäre. Menschen und Roboter sitzen Seite an Seite und scheinen auf eine Zukunft hinzuweisen, in der Menschen und Maschinen koexistieren.
Komposition: Die Komposition des Bildes ist einfach und kraftvoll, symmetrisch von links nach rechts, mit einer Leerstelle in der Mitte, was den Kontrast und die Verbindung zwischen Menschen und Robotern verstärkt.
Dieses Bild verdeutlicht das Thema der Koexistenz von Menschen und künstlicher Intelligenz durch eine einfache und aussagekräftige Szenerie und regt zum Nachdenken über die zukünftige Entwicklung von Wissenschaft und Technologie an.
Of course, you can also use Kuaishou The large model of the self-developed Wensheng diagram is available, and it is now available for free for a limited time. The reputation is also good.
However, the large graphable model is not like DALL-E-3 and cannot digest the large amount of description content generated by Claude 3.5 sonnet.
Therefore, when entering the "Creative Overview", it must be shortened and modified:
A simple black bench, with a young man sitting on the right side of the bench. He was wearing a dark suit and turtleneck sweater, and black-rimmed glasses, with his hands on his legs. To the left of the bench, sat a small white robot with a round head with red eye-like lights. . There are some colorful decorations on its body that look like a control panel. The light in the picture is very distinctive, coming from the right, casting shadows of people and robots on the wall and ground.
Then "pad the image", adjust the degree of similarity, and generate the result:
However, for this picture, the effect is very poor.
In addition to the sudden increase in people and machines, if you look closely at one of the characters, you can see that the character has a Lego-like face.
Recently, technology media The verge reported on the first generative biographical film, the protagonist is Brian Eno, the music producer of David Bowie, U2, Coldplay and others.
Every time this movie is played, the movie materials will be recombined according to a special algorithm, so what you see is different every time.
This collage-style cover design caters well to the theme of the movie and also shows the versatility of a biographical figure.
We first let Claude 3.5 sonnet describe the image carefully, and then threw its description to DALL-E-3 to generate the image.
How to say? It feels neat and a bit dull.
We reduced the description of Claude 3.5 sonnet to one sentence, threw it to the large model, and put the picture on it.
This time, the effect of Ketu is obviously better.
We also tried to imitate the creative and unique cover of The Economist.
This time, the visual effect of Tutu (lower right) is better than that of DALL-E-3 (upper right). However, poor spelling ruined the result.
We used DALL-E-3 to generate a similar Styled pictures that express LLM pose a threat to personal privacy and data.
-3-
Text and fingers
are still the weakness of the picture generator
The previous cases have told us:
If the picture must contain words and text, it will be difficult for TA to do it!
You see, Ketu still misspells OpenAI, and DALL-E-3 often does the same.
It is very difficult to correctly display "Siemens" in the picture of DALL-E-3, whether in English or Chinese.
Generate a picture about Siemens Industrial Copilot, the two key words are also wrong.
Although I knew earlier that it involves finger details, the image generator is still prone to problems.
But I never expected that even a picture like a flower picking its nose would be difficult to succeed.
This is the work of DALL-E-3, it is really "amazing".
Throwing it to Ketu, TA was in a difficult position, and he was too embarrassed to put his fingers in front of his nostrils:
As for the gun in his hand, well, it only had six fingers:
This is not surprising.
Image generators usually use diffusion models to reconstruct images from noise and learn patterns that cover more pixels. Naturally, they perform poorly in generating details such as text and fingers.
Of course, this does not mean that text generators must be spelling masters. Although the underlying technologies behind image and text generators are different, they have similar difficulties in spelling and other details.
After all, we still lack basic common sense of the physical world and the language world.
Das obige ist der detaillierte Inhalt vonTrumps Attentatsfoto kostet 2.100 Yuan? ! Artikeltitel, begleitende Bilder, AI stellt Ihnen ein Dutzend kostenlos zur Verfügung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!