Machine Power Report
Editeur : Sia
un chauffeur. Beaucoup plus .
On dit que les médias utilisent des photos de l'assassinat de Trump comme illustrations et facturent 2 100 yuans par photo !
L’époque où l’on prenait simplement une photo pour illustrer un article est révolue à jamais.
Cependant, les ennuis des créateurs ne se sont pas arrêtés là.
Après avoir écrit un article de compte public, les dix minutes suivantes sont les plus casse-tête :
Titre boutique, emplacement privilégié, chaque centimètre carré de terrain a de la valeur. En plus de mettre en valeur les points forts du contenu, vous devez également vous assurer que le titre est suffisamment attractif pour qu’on puisse cliquer dessus. C’est bien plus difficile que d’écrire un article !
Quoi ? L'arôme du vin n'a pas peur des ruelles profondes ?
Dans le cercle des comptes publics de la Mer Rouge, cela ne fonctionne pas.
Ne vous découragez pas non plus ! Après un certain temps d'essai, nous avons constaté que le grand modèle est assez efficace pour résoudre ces deux défis quotidiens.
-1-
Créez un titre qualifié dans les plus brefs délais
Pour faciliter le chat, prenons comme exemple ce rapportsur la nouvelle société de modèles de base de robot Skild AI.
Si vous connaissez les points forts qui doivent être mis en avant dans l'article, mais que vous ne savez tout simplement pas comment créer une permutation et une combinaison attrayantes, autant dire au grand modèle :
1. pour un compte officiel WeChat et a besoin d'un titre attractif ;
2 Le titre doit mettre en avant les avantages des données, le montant du financement et le robot GPT
C'est l'idée de Claude 3.5 sonnet, pas mal !
Vous n'arrivez même pas à comprendre quels sont les points forts ?
Ensuite, laissez le grand modèle vous aider à le trouver en premier, puis laissez-le concentrer les points forts trouvés sur le titre.
La capacité de synthèse du sonnet de Claude 3.5 est très bonne.
Vous ne prenez même pas la peine de penser aux moments forts ? Alors suivez simplement l’exemple !
Certaines personnes disent aimer le titre du style "Ce site". Attends, ça sent quoi ? Nous ne l’avons pas encore vraiment compté.
Laissez le grand modèle l'analyser : la technologie et la grande propriété intellectuelle doivent être proéminentes et accrocheuses...
Hmm, cela ressemble à ça.
a donné plusieurs titres similaires aux nouveaux rapports. Il a vraiment une saveur interne, et les trois premiers peuvent être utilisés presque directement, sauf qu'ils sont un peu longs.
Et si vous préférez les titres de style de recherche dynamique de Weibo ?
Nous prenons comme entrée les recherches à chaud à une certaine heure le 15 juillet et laissons le grand modèle analyser les caractéristiques de ces titres de recherche à chaud.
Ensuite, donnez à cet article un titre de style recherche dynamique. C'est OK? Au moins, nous avons un plan de base pour une amélioration ultérieure (tout est difficile au début) :
Vous pouvez également demander plus d'alternatives :
Certaines personnes aiment le style professionnel et sérieux des gros titres des médias financiers, veuillez arranger cela .
Nous avons collecté les titres des couvertures de l'hebdomadaire Caixin sur trois ans et avons laissé Claude 3.5 sonnet les analyser.
Court, jeu de mots, grand sujet, orienté problématique..., plusieurs points clés ont été captés :
Ce sont plusieurs titres créés par le grand modèle pour notre reportage.
Qu’est-ce qu’il y a dedans ? Les styles des trois premiers titres sont-ils effectivement quelque peu similaires ?
-2-
Imitez les images, l'IA se concentre sur une seule province
Afin d'éviter les conflits de droits d'auteur, de plus en plus de personnes commencent à utiliser l'IA pour générer la couverture d'articles.
Dans de nombreux cas, plutôt que de laisser l'IAêtre désemparée et imaginative, nous préférons qu'elle imite directement des images toutes faites.
En général, nous laisserons d'abord le grand modèle regarder des images et parler, donner des mots d'invite, puis envoyer ces mots d'invite au générateur d'images.
C'est la véritable expérience d'un collègue :
Si vous trouvez que les mots rapides ne sont pas faciles à utiliser, vous pouvez demander au grand modèle (sonnet Claude 3.5) de « décrire soigneusement les détails et le contenu de l'image » " :
Ensuite, utilisez ces Description lancée au générateur d'images :
Cette image montre une scène unique et contrastée :
Fond : Le fond de l'image est un mur de béton gris qui semble rugueux, marbré et texturé.
Siège : Il y a un simple banc ou une plate-forme noire au centre de l'image, qui semble également être faite de béton ou d'une sorte de matériau dur.
Personnage : Un jeune homme est assis du côté droit du banc. Il portait un costume sombre, un pull à col roulé et des lunettes à monture noire. Sa posture est détendue, les mains sur les jambes.
Robot : Sur le côté gauche du banc, est assis un petit robot blanc. Le robot a une tête ronde avec des lumières rouges ressemblant à des yeux. Il y a des décorations colorées sur son corps qui ressemblent à un panneau de commande.
Lumière : La lumière sur l'image est très distinctive. Elle vient du côté droit, projetant des ombres de personnes et de robots sur le mur et le sol. Cet effet d’ombre et de lumière ajoute du drame et de la profondeur à l’image.
Ambiance : L'ensemble de la scène donne une atmosphère futuriste et technologique. Les humains et les robots sont assis côte à côte, semblant faire allusion à un avenir où les humains et les machines coexisteront.
Composition : La composition de l'image est simple et puissante, symétrique de gauche à droite, avec un espace vide au milieu, qui améliore le contraste et la connexion entre les humains et les robots.
Cette image montre intelligemment le thème de la coexistence des humains et de l'intelligence artificielle à travers une mise en scène simple et significative, déclenchant une réflexion sur le développement futur de la science et de la technologie.
.
Du kannst natürlich auch verwenden Kuaishou Das große Modell des selbst entwickelten Wensheng-Diagramms ist jetzt für eine begrenzte Zeit kostenlos erhältlich. Der Ruf ist auch gut.
Eine einfache schwarze Bank, auf deren rechter Seite ein junger Mann sitzt. Er trug einen dunklen Anzug, einen Rollkragenpullover und eine Brille mit schwarzem Rand, die Hände auf den Beinen. Links von der Bank saß ein kleiner weißer Roboter mit einem runden Kopf und roten, augenähnlichen Lichtern. Auf seinem Gehäuse befinden sich einige farbenfrohe Verzierungen, die wie ein Bedienfeld aussehen. Das Licht im Bild ist sehr markant, es kommt von rechts und wirft Schatten von Menschen und Robotern auf die Wand und den Boden.Dann „füllen Sie das Bild auf“, passen Sie den Grad der Ähnlichkeit an und generieren Sie das Ergebnis:
Bei diesem Bild ist der Effekt jedoch sehr dürftig.
Kürzlich berichteten die Technologiemedien The Verge über den ersten generativen biografischen Film, dessen Protagonist Brian Eno ist, der Musikproduzent von David Bowie, U2, Coldplay und anderen.
Wir ließen zunächst Claude 3.5 Sonett das Bild sorgfältig beschreiben und übergaben dann seine Beschreibung an DALL-E-3, um das Bild zu generieren.
Wir haben die Beschreibung des Sonetts Claude 3.5 in einem Satz vereinfacht, auf das große Modell übertragen und das Bild darauf platziert.
Dieses Mal ist die Wirkung von Ketu offensichtlich besser.
Wir haben auch versucht, das kreative und einzigartige Cover von The Economist nachzuahmen.
Diesmal ist der visuelle Effekt des Bildes (unten rechts) besser als der von DALL-E-3 (oben rechts). Allerdings hat eine schlechte Rechtschreibung das Ergebnis ruiniert.
Wir haben DALL-E-3 verwendet, um einen ähnlichen Stil zu generieren Bilder, die LLM zum Ausdruck bringen, stellen eine Bedrohung für die Privatsphäre und Daten dar.
.
-3-
Text und Finger
sind immer noch die Schwäche des Bildgenerators
Die vorherigen Fälle haben uns gezeigt:
Wenn das Bild Wörter und Text enthalten muss, wird es für TA schwierig sein Tu es!
Sehen Sie, Ketu schreibt OpenAI immer noch falsch, und DALL-E-3 macht oft dasselbe.
Es ist sehr schwierig, „Siemens“ auf dem Bild von DALL-E-3 korrekt anzuzeigen, egal ob auf Englisch oder Chinesisch.
Generieren Sie ein Bild über Siemens Industrial Copilot, die beiden Schlüsselwörter sind auch falsch.
Obwohl ich schon früher wusste, dass es sich um Fingerdetails handelt, ist der Bildgenerator immer noch anfällig für Probleme.
Aber ich hätte nie erwartet, dass selbst ein Bild wie eine Blume, die ihre Nase pflückt, schwierig sein würde.
Das ist die Arbeit von DALL-E-3, sie ist wirklich „erstaunlich“.
Als TA sie Ketu zuwarf, befand er sich in einem Dilemma, und es war ihm zu peinlich, die Finger vor seine Nasenlöcher zu legen:
Was die Waffe in seiner Hand anging, nun ja, sie hatte nur sechs Finger:
Das ist nicht überraschend.
Bildgeneratoren verwenden normalerweise Diffusionsmodelle, um Bilder aus Rauschen zu rekonstruieren und Muster zu lernen, die mehr Pixel abdecken. Natürlich sind sie bei der Generierung von Details wie Text und Fingern schlecht.
Das bedeutet natürlich nicht, dass Textgeneratoren Meister der Rechtschreibung sein müssen. Obwohl die zugrunde liegenden Technologien hinter Bild- und Textgeneratoren unterschiedlich sind, weisen sie ähnliche Schwierigkeiten bei der Rechtschreibung und anderen Details auf.
Schließlich fehlt uns immer noch ein grundlegender gesunder Menschenverstand für die physische Welt und die Sprachwelt.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!