Auteur | Xu Jiecheng
Depuis la sortie de ChatGPT en décembre de l'année dernière, les sujets concernant les grands modèles de langage (LLM) et les chatbots ont presque dominé tout Internet. Les grands géants de la technologie ont vite compris les opportunités commerciales illimitées que cela pouvait apporter.
Microsoft a été le premier à agir en investissant 10 milliards de dollars supplémentaires pour intégrer ChatGPT dans son propre moteur de recherche Bing ; Google, un peu plus prudent, a lancé son robot de chat auto-développé Bard après avoir consacré un certain temps et l'énergie ; ne sera pas loin derrière. Le géant national de la technologie Baidu a également récemment annoncé qu'il participerait à cette mêlée avec son chatbot Wenxinyiyan en mars de cette année.
Mais un géant de la technologie qui a toujours été agressif dans le passé semble prêt à abandonner cette « bataille ChatGPT ». Il s'agit de Meta, dirigée par Zuckerberg. Étonnamment, Meta est peut-être le seul géant de la technologie qui n’a pas encore sauté dans le train des chatbots.
Un examen plus approfondi des raisons des performances anormales de Meta est probablement dû à de nombreuses tentatives infructueuses dans le passé - en fait, dès le début. en juin 2022, Meta a open source son modèle de langage à grande échelle auto-développé OPT-66B et a publié le robot de chat BlenderBot3 basé sur OPT-66B en août de la même année, trois mois plus tôt que ChatGPT. fait partie des premiers groupes à s'impliquer.
Bien que BlenderBot3 ne soit sorti qu'aux États-Unis à cette époque, la sensation qu'il a provoquée à l'époque n'était pas moindre que celle de ChatGPT aujourd'hui. Quelques heures seulement après sa sortie, Twitter et Reddit regorgent déjà de captures d'écran de personnes ayant des conversations intéressantes avec BlenderBot3.
Cependant, très vite, ce chatbot « à succès » s'est transformé en désastre. Un grand nombre d'utilisateurs ont constaté que BlenderBot3 publierait des remarques vicieuses et de fausses informations, et ont même remis en question la stratégie commerciale de Zuckerberg, la qualifiant de « contraire à l'éthique ». Cela a amené un grand nombre d'utilisateurs à perdre progressivement confiance dans BlenderBot3. En fin de compte, Meta a vu, impuissant, le "gros bébé" pour lequel il avait dépensé beaucoup d'argent décliner progressivement.
Bien sûr, un échec n’a pas éteint l’enthousiasme de Meta pour le LLM. Après le regroupement, Meta s'est associé à Papers with Code en novembre 2022 pour lancer un autre robot, Galactica, basé sur un grand modèle de langage. Par rapport au BlenderBot3 précédemment échoué, Galactica a un domaine d'application plus spécifique : les articles d'écriture fantôme.
Selon l'introduction officielle, Galactica est formé à partir de 48 millions d'articles, manuels et autres matériaux, qu'il s'agisse de résumés sur papier, d'introductions, de formules ou même de références. De plus, en plus de la génération de texte, Galactica peut également effectuer des tâches multimodales impliquant des formules chimiques et des séquences protéiques.
Mais cette fois, Meta n'a toujours pas réussi à résoudre le problème de l'exactitude de la génération LLM. Bien que la force du livre de Galactica semble être très forte, il y a beaucoup d'erreurs et même du contenu falsifié dans les articles qu'il écrit. Afin d'éviter que l'impact ne se propage davantage, Meta a dû retirer à la hâte Galactica des étagères, trois jours seulement après sa sortie.
Les échecs successifs semblent avoir ébranlé la confiance du timonier de Meta AI Yann LeCun, lauréat du prix Turing et scientifique en chef de l'IA de Meta, en LLM. Les récentes nouvelles des erreurs ChatGPT et Google Bard semblent avoir apporté un certain soutien à LeCun.
Que ce soit pour protéger son propre visage, ou qu'il ait vraiment réalisé le défaut fatal du robot LLM suite à deux échecs, LeCun est aujourd'hui passé d'un défenseur original du LLM à un critique du LLM.
Alors que les sujets connexes continuent de devenir de plus en plus populaires, LeCun a également commencé à exposer activement les lacunes des grands modèles de langage et des robots de discussion via divers canaux. Lors d'une récente discussion en ligne organisée par Collective Forecast, LeCun a déclaré que même s'ils sont révolutionnaires aux yeux du public, en termes de technologie sous-jacente, les chatbots d'aujourd'hui ne constituent pas une grande innovation.
De plus, LeCun a exprimé à plusieurs reprises son mépris pour ChatGPT sur Twitter : il ne peut pas évoluer et ne sera jamais la bonne voie vers une intelligence artificielle forte. L’expansion du LLM autorégressif ne peut tout simplement pas amener les chatbots à une intelligence de niveau humain. Je ne pense pas que ChatGPT fasse plus que corriger la grammaire, compléter des phrases ou résumer des articles.
LeCun estime que les petites entreprises comme OpenAI n'ont rien à perdre et qu'elles peuvent certainement utiliser des technologies et des produits immatures pour se créer du battage médiatique. Mais il est évidemment très imprudent pour les grandes entreprises de choisir de se lancer dans cette eau boueuse, surtout après que tout le monde a vu la tentative ratée qui a coûté 100 milliards de dollars à Google.
En fait, l'investissement de Meta dans le domaine de l'intelligence artificielle a toujours été à l'avant-garde des grandes entreprises technologiques depuis longtemps. sont entrés dans leur activité publicitaire, jusqu'à présent, ils travaillent toujours dur pour transformer les modèles et les algorithmes d'intelligence artificielle qu'ils ont eux-mêmes développés en produits susceptibles de générer des bénéfices.
LeCun a souligné que Meta a longtemps été critiquée pour avoir diffusé de fausses informations en raison d'erreurs de BlenderBot et Galactica. Aujourd'hui, Meta espère contrôler plus strictement les outils et les contenus qu'ils publient, plutôt que d'utiliser aveuglément des chatbots pour se faufiler dans « l'engouement pour l'intelligence artificielle » actuel et refaire les mêmes erreurs.
Que ce soit à cause de la douleur provoquée par des échecs antérieurs ou du changement de conception du leader, Meta évite effectivement cette bataille mondialement observée. Dans une interview sur l'intelligence artificielle générative, LeCun a déclaré : Le rêve à long terme de Zuckerberg sur le métaverse est toujours en cours, et il est également d'accord avec le fait que l'intelligence artificielle générative pourrait être la meilleure dans la réalisation du métaverse. En ce qui concerne les modèles de langage et les chatbots à grande échelle, ils semblent désormais plus disposés à s'asseoir sur la montagne et à regarder les tigres se battre à distance, à rechercher activement les erreurs commises par Google, Microsoft ou OpenAI et à acquérir suffisamment d'expérience. eux.
https://analyticsindiamag.com/meet-the-ai-genius-who-is-obsessed-with-llms/
http://www.myzaker.com/article/63e3902e8e9f094fe76b7af7 /
https://analyticsindiamag.com/why-meta-took-down-its-hallucinating-ai-model-galactica/
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!