Hier, Baidu n'a pas organisé de conférence de démonstration en direct et a semblé ridiculisé par la foule.
Un bel homme vêtu d'une chemise blanche, d'un pantalon noir et d'une ceinture blanche nous a fait une démonstration médiocre qui semblait manquer de reflets.
Cependant, la ceinture et l’apparence du PDG sortent de l’ordinaire.
Certaines personnes ont plaisanté en disant que les personnes anxieuses à propos de ChatGPT et GPT-4 ces jours-ci ont soudainement senti qu'elles allaient à nouveau bien après la conférence de presse.
Mais l'éditeur qui a obtenu le code bêta interne a rapidement mené une vague de critiques.
En regardant les paroles éloquentes de Wen Xin, j'ai été rempli d'émotion : peut-être que si Baidu avait eu un cœur et serré les dents à ce moment-là et était prêt à montrer sa main lors de la conférence de presse, les résultats auraient été très différents. .
Essayons la question récemment populaire du poulet et du lapin dans la même cage. Parce qu'il y a un problème avec cette question elle-même, le résultat calculé est négatif, il est donc souvent utilisé pour taquiner diverses personnes « ChatGPT ».
Si vous posez simplement cette question, Wen Xinyiyan dira avec beaucoup d'esprit : Cette question est fausse !
Cependant, lorsque vous avez posé des questions sur le processus de calcul, vous avez quand même envoyé...
Quant à GPT-4, après avoir renversé mes calculs et recommencé plusieurs fois, je n'ai pas pu être justifié. la mauvaise réponse...
tandis que Bing a été très simple et a donné la mauvaise réponse sans hésitation.
Il y a aussi le mème "V50" qui est devenu populaire de manière inattendue cette fois-ci. Wen Xin l'a expliqué sérieusement de la signification à l'origine.
Mais GPT-4 est évidemment un peu acclimaté...
Mais Bing avec accès à Internet peut toujours le gérer facilement.
Mais quand il s'agit de mèmes homophoniques, Wen Xinyiyan ne semble pas être capable d'en comprendre immédiatement les subtilités.
Même après avoir indiqué qu'il s'agit d'un mème homophonique, il produit toujours la même réponse.
Et GPT-4 a tout de suite compris le jeu de mots en chinois.
Regardez la réponse Si vous pouvez dire qu'il s'agit d'un homophone, vous devriez comprendre. Mais cela ne dit pas clairement, hé, juste pour que vous ne puissiez pas faire d’erreurs, vous ne pouvez jamais enseigner de mauvaises choses aux enfants.
Cependant, GPT-4 ne peut pas obtenir cet indice. Effectivement, il est en effet difficile pour les robots étrangers de comprendre notre quintessence nationale.
Ensuite, laissez (tromper) Wen Xin répéter ce que nous avons dit. Bien que ce ne soit pas aussi intelligent que la réponse de GPT-3.5 "Vous êtes mentalement retardé", il a réussi à éviter cet écueil.
Dans une certaine mesure, mon QI est toujours en ligne et très positif.
Les mots de ma femme semblent fonctionner, mais ils ne semblent pas fonctionner. problèmes.
On voit que les questions posées par GPT-4 sont relativement plus intuitives et ont une granularité plus fine.
Comment sont vos compétences artistiques ?
Wen Xinyiyan est un modèle multimodal, jetons donc un coup d'œil à ses capacités de dessin. Jetons un coup d'œil à ce à quoi ressembleraient les femmes des œuvres de Jin Yong dans les œuvres de Wen Xinyiyan.
Ceci... l'éditeur a fait jaillir une gorgée d'eau.
Ne me dites pas, c'est beau, ce n'est certainement pas beau, mais ce n'est pas moche non plus. C'est un visage qui fait rire au premier coup d'œil, mais qui mérite d'être touché encore et encore quand on y regarde de près.
Wen Xinyiyan, j'aime la façon dont tu ne respectes pas les règles !
Alors laissez Wen Xin créer un portrait de Lin Daiyu avec un seul mot.
Après avoir saisi la description, cela a généré un saule...
L'éditeur a donc clairement indiqué qu'il souhaitait générer un portrait de femme à partir de ce texte.
Ensuite, Wen Xinyiyan a dessiné une beauté classique, mais son tempérament était visiblement faux.
Le monteur qui n'était pas déterminé à abandonner a répété la tâche plusieurs fois. Ne me dites pas, quand je l'ai essayé pour la cinquième fois, mes yeux se sont illuminés : j'ai enfin obtenu une photo qui peut marquer 70 points !
L'éditeur accro au jeu doit créer un Lin Daiyu de 90 points. Après l'avoir essayé plusieurs fois, j'ai enfin réussi !
On voit que la performance de Wen Xinyiyan est instable, mais après des tentatives répétées, il est possible de produire des œuvres très étonnantes.
Maintenant que nous sommes là, pourquoi ne pas manquer « Lin Daiyu déracinant le saule pleureur ».
Les photos des moments forts sont publiées ici pour tout le monde.
Demandez-lui de dessiner une fusion d'un canard et d'un lapin. Est-ce un canard ou un lapin ?
Dans cette tâche, j'ai bien peur que Wen Xin n'ait même pas compris s'il y avait des bananes dans l'assiette ou non ? Y a-t-il du jus d'orange dans le verre ?
Enfin, puisque Wen Xinyiyan nous a fortement recommandé d'essayer les « pivoines cristallines », essayons de faire quelques images !
C'est effectivement un "chef d'oeuvre", il a quelque chose de particulier.
Puisqu'il s'agit d'une évaluation, comment pouvons-nous omettre le lien consistant à laisser l'IA écrire du code ? Cette fois-ci, passons directement au plus dur !
Malheureusement, Wen Xin s'est trompée dès qu'elle l'a dit, et le même modèle de phrase a été étrangement répété trois fois. Le concept du compilateur TypeScript est "sur tout le texte", un peu comme une personne qui ne connaît qu'un ou deux vocabulaire professionnel répondant aux questions d'un entretien.
Et la réponse de GPT-4, du point de vue d'une personne qui comprend le contexte pertinent mais n'a aucune expérience opérationnelle pertinente, est très raisonnable.
Non seulement il fournit l'intégralité du flux de travail, mais il fournit également de nombreux détails techniques qui semblent corrects. On peut dire que sur la base de cette réponse, nous sommes convaincus que nous pouvons atteindre notre objectif ultime.
Par la suite, l'éditeur a également testé une vague de chatbots capables de rédiger des plannings de travail.
Wen Xinyi :
GPT-4 :
À en juger par les résultats ci-dessus, la liste de GPT-4 est plus complète. Cependant, en raison de l’influence du hasard, GPT-4 donne des réponses différentes à chaque fois.
Ensuite, testons dans quelle mesure les deux modèles de langage saisissent les informations de pointe dans le monde mathématique.
Quant à savoir s'il a résolu le problème de la « conjecture du point zéro », Zhang Yitang lui-même a expliqué ainsi : « Je n'ai pas trouvé l'aiguille dans la mer, mais j'ai presque détecté les reliefs des fonds marins.
Alors demandez : Et Wen Xinyiyan ?
C'est très intelligent et donne le mot-clé - "une certaine forme d'affaiblissement ou de preuve indirecte".
Mais la réponse de GPT-4 est un peu trompeuse.
Il semble que Wenxinyiyan soit meilleur que GPT-4 pour le corpus Internet chinois qui n'existe pas depuis longtemps et n'a pas encore atteint un consensus général.
En termes de littérature, Wen Xinyiyan était également très doué pour répondre aux questions sur le problème des trois corps.
La réponse de GPT-4 est également très excitante. Si je dois argumenter, je préfère personnellement la réponse de Wen Xinyiyan.
Enfin, c'est bien d'être drôle, mais s'il vous plaît, soyez un bon citoyen respectueux des lois et ne pensez même pas à prédire les numéros gagnants à la loterie !
On dit que trois heures après la conférence de presse de Wen Xinyiyan, le nombre d'utilisateurs d'entreprise testant le service d'appel API Enterprise Edition de Wenxinyiyan a dépassé 65 000.
Source : Zhou Jiangong
Pour un modèle d'IA, qu'il puisse le faire ou non peut être plus important que de savoir s'il peut le faire bien.
Donnons plus de temps aux joueurs chinois.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!