


Meta lance un chatbot avec 175 milliards de paramètres qui peut tout aussi bien communiquer avec les humains ! Cela peut éviter le problème d'un mauvais jeu.
Récemment, Meta a fait un autre grand pas.
Ils ont publié le dernier chatbot développé - BlenderBot3, et ont collecté publiquement les données d'utilisation des utilisateurs en guise de commentaires.
On dit que vous pouvez discuter de tout avec BlenderBot3, c'est un chatbot de niveau SOTA.
Est-ce vraiment si intelligent ?
L'image ci-dessus est un enregistrement de discussion entre un internaute et BlenderBot. Comme vous pouvez le voir, il ne s’agit en réalité que de discuter.
L'utilisateur a dit qu'il allait pratiquer le yoga et a demandé à BlenderBot ce qu'il voulait faire. Le robot dit qu'il est en train d'écrire le neuvième livre.
L'incroyable BlenderBot 3
Ce dernier chatbot a été créé par le laboratoire de recherche en intelligence artificielle de Meta et est également le premier robot à paramètres 175B de Meta. Toutes les parties du modèle, code, ensembles de données, etc., sont toutes ouvertes et accessibles à tous.
Meta a déclaré que sur BlenderBot3, les utilisateurs peuvent discuter de n'importe quel sujet sur Internet.
BlenderBot3 applique les deux dernières technologies d'apprentissage automatique développées par Meta - SeeKeR et Director, et les utilise pour établir un modèle de dialogue qui permet au robot d'apprendre de l'interaction et des commentaires.
Kurt Shuste, un ingénieur de recherche qui a participé au développement de BlenderBot3, a déclaré : "Meta s'engage à publier publiquement toutes les données que nous avons collectées lors de la démonstration de ce chatbot, dans l'espoir que nous puissions améliorer l'intelligence artificielle conversationnelle du point de vue du contenu." vue, BlenderBot3 n'est pas nouveau. Son modèle sous-jacent est toujours un grand modèle de langage et LLMS, qui est un logiciel de génération de texte très puissant (bien qu'il présente quelques défauts).
Comme tous les logiciels de génération de texte, BlenderBot3 a été initialement formé sur d'énormes ensembles de données textuelles, BlenderBot peut exploiter divers modèles statistiques puis générer du langage.
Tout comme le mauvais GPT-3, nous l'avons dit.
En plus de ce qui est mentionné ci-dessus, BlenderBot3 présente également quelques points forts.
Contrairement aux chatbots précédents, lorsqu'ils discutent avec BlenderBot, les utilisateurs peuvent cliquer sur la réponse donnée par le robot pour visualiser la source de la phrase sur Internet. En d’autres termes, BlenderBot3 peut citer des sources.
Cependant, il y a ici un problème très critique. Autrement dit, une fois qu’un chatbot est rendu public, cela signifie que n’importe qui peut interagir avec lui. Une fois que le nombre de personnes qui le testeront augmentera, il y aura certainement une vague de personnes qui voudront le « gâcher ».
C’est aussi l’objet des prochaines recherches de l’équipe Meta.
Il n’est pas rare que les chatbots soient corrompus.
En 2016, Microsoft a publié un chatbot appelé Tay sur Twitter. Quiconque a suivi Tay doit encore être impressionné.
Après le début de la version bêta publique, Tay a commencé à apprendre des interactions avec les utilisateurs. Sans surprise, il n’a pas fallu longtemps pour que Tay, sous l’influence d’un petit groupe de fauteurs de troubles, commence à émettre une série de remarques liées au racisme, à l’antisémitisme et à la misogynie.
Microsoft a constaté que la situation n'était pas bonne et a mis Tay hors ligne en moins de 24 heures.
Meta a déclaré que depuis que Tay a rencontré Waterloo, le monde de l'IA s'est considérablement développé. BlenderBot dispose de diverses garanties de sécurité qui devraient empêcher Meta de suivre le chemin de Microsoft.
Les premières expériences montrent qu'à mesure que de plus en plus de personnes peuvent participer à l'interaction avec le modèle, le robot peut apprendre davantage de l'expérience de conversation. Au fil du temps, BlenderBot3 deviendra de plus en plus sécurisé.
Il semble que Meta fasse du très bon travail à cet égard.
Mary Williamson, responsable de l'ingénierie de recherche chez Facebook Artificial Intelligence Research (FAIR), a déclaré : « La différence la plus importante entre Tay et BlenderBot3 est que Tay est conçu pour apprendre en temps réel à partir des interactions des utilisateurs, tandis que BlenderBot est un modèle statique. »
Cela signifie que BlenderBot est capable de se souvenir de ce que l'utilisateur a dit pendant la conversation (il conservera même ces informations via les cookies du navigateur si l'utilisateur quitte le programme et y revient plus tard), mais ces données ne sont utilisées que pour poursuivre améliorer le système.
Williamson a déclaré : « La grande majorité des chatbots d'aujourd'hui sont axés sur les tâches. Prenez par exemple les robots de service client les plus simples. Ils ont l'air intelligents, mais ce ne sont en réalité que des arbres de dialogue programmés les uns après les autres, réduisant lentement le nombre d'utilisateurs. La véritable avancée est de permettre aux robots de parler librement comme les humains. C'est exactement ce que Meta veut faire. En plus de mettre BlenderBot 3 en ligne, Meta a également publié le code sous-jacent, les ensembles de données de formation et des variantes de modèles plus petites. Les chercheurs peuvent demander l'accès via le formulaire ici .
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Avec une capacité d'imitation de l'IA aussi puissante, il est vraiment impossible de l'empêcher. Le développement de l’IA a-t-il atteint ce niveau aujourd’hui ? Votre pied avant fait voler les traits de votre visage, et sur votre pied arrière, la même expression est reproduite. Regarder fixement, lever les sourcils, faire la moue, aussi exagérée que soit l'expression, tout est parfaitement imité. Augmentez la difficulté, haussez les sourcils, ouvrez plus grand les yeux, et même la forme de la bouche est tordue, et l'avatar du personnage virtuel peut parfaitement reproduire l'expression. Lorsque vous ajustez les paramètres à gauche, l'avatar virtuel à droite modifiera également ses mouvements en conséquence pour donner un gros plan de la bouche et des yeux. On ne peut pas dire que l'imitation soit exactement la même, seule l'expression est exactement la même. idem (extrême droite). La recherche provient d'institutions telles que l'Université technique de Munich, qui propose GaussianAvatars, qui

L'événement Meta Connect 2024 est prévu du 25 au 26 septembre et lors de cet événement, la société devrait dévoiler un nouveau casque de réalité virtuelle abordable. Selon la rumeur, il s'agirait du Meta Quest 3S, le casque VR serait apparemment apparu sur la liste FCC. Cela suggère

Xiaohongshu s'efforce d'enrichir ses produits en ajoutant davantage de fonctionnalités d'intelligence artificielle. Selon les médias nationaux, Xiaohongshu teste en interne une application d'IA appelée « Davinci » dans son application principale. Il est rapporté que l'application peut fournir aux utilisateurs des services de chat IA tels que des questions et réponses intelligentes, notamment des guides de voyage, des guides gastronomiques, des connaissances géographiques et culturelles, des compétences de vie, une croissance personnelle et une construction psychologique, etc. Selon les rapports, "Davinci" utilise le modèle LLAMA sous le produit Meta A pour la formation, le produit est testé depuis septembre de cette année. Il y a des rumeurs selon lesquelles Xiaohongshu effectuait également un test interne d'une fonction de conversation de groupe par l'IA. Grâce à cette fonction, les utilisateurs peuvent créer ou introduire des personnages IA dans des discussions de groupe, et avoir des conversations et des interactions avec eux. Source de l'image : T.

Préparez votre GPU ! Llama3.1 est finalement apparu, mais la source n'est pas officielle de Meta. Aujourd'hui, la nouvelle divulguée du nouveau grand modèle Llama est devenue virale sur Reddit. En plus du modèle de base, elle comprend également des résultats de référence de 8B, 70B et le paramètre maximum de 405B. La figure ci-dessous montre les résultats de comparaison de chaque version de Llama3.1 avec OpenAIGPT-4o et Llama38B/70B. On peut voir que même la version 70B dépasse GPT-4o sur plusieurs benchmarks. Source de l'image : https://x.com/mattshumer_/status/1815444612414087294 Évidemment, version 3.1 de 8B et 70

Hier soir, Meta a publié les modèles Llama38B et 70B. Le modèle optimisé pour les instructions Llama3 est affiné et optimisé pour les cas d'utilisation de dialogue/chat et surpasse de nombreux modèles de chat open source existants dans les benchmarks courants. Par exemple, Gemma7B et Mistral7B. Le modèle Llama+3 améliore les données et l'échelle et atteint de nouveaux sommets. Il a été formé sur plus de 15 000 jetons de données sur deux clusters GPU 24 000 personnalisés récemment publiés par Meta. Cet ensemble de données de formation est 7 fois plus grand que Llama2 et contient 4 fois plus de code. Cela porte la capacité du modèle Llama au niveau le plus élevé actuel, qui prend en charge des longueurs de texte supérieures à 8 Ko, soit le double de celle de Llama2. sous

Tout à l'heure, le très attendu Llama 3.1 est officiellement sorti ! Meta a officiellement déclaré que "l'open source mène une nouvelle ère". Sur le blog officiel, Meta a déclaré : « Jusqu'à aujourd'hui, les grands modèles de langage open source étaient pour la plupart à la traîne des modèles fermés en termes de fonctionnalités et de performances. Nous inaugurons désormais une nouvelle ère dirigée par l'open source. Nous avons rendu public MetaLlama3.1405B. , qui, selon nous, est le modèle de base open source le plus grand et le plus puissant au monde, à ce jour, le nombre total de téléchargements de toutes les versions de Llama a dépassé les 300 millions de fois, et nous venons de commencer, le fondateur et PDG de Meta, Zuckerberg. article long "OpenSourceAIIsthePathForward",

Llama3 est là ! Tout à l'heure, le site officiel de Meta a été mis à jour et le responsable a annoncé les versions de Llama à 38 milliards et 70 milliards de paramètres. Et c'est un SOTA open source après son lancement : les métadonnées officielles montrent que les versions Llama38B et 70B surpassent tous les adversaires dans leurs échelles de paramètres respectives. Le modèle 8B surpasse Gemma7B et Mistral7BInstruct sur de nombreux benchmarks tels que MMLU, GPQA et HumanEval. Le modèle 70B a surpassé le populaire poulet frit Claude3Sonnet et a fait des allers-retours avec le GeminiPro1.5 de Google. Dès que le lien Huggingface est sorti, la communauté open source est redevenue enthousiasmée. Les étudiants aveugles aux yeux perçants ont également découvert immédiatement

Le magazine "ComputerWorld" a écrit un article disant que "la programmation disparaîtra d'ici 1960" parce qu'IBM a développé un nouveau langage FORTRAN, qui permet aux ingénieurs d'écrire les formules mathématiques dont ils ont besoin, puis de les soumettre à l'ordinateur pour que la programmation se termine. Picture Quelques années plus tard, nous avons entendu un nouveau dicton : tout homme d'affaires peut utiliser des termes commerciaux pour décrire ses problèmes et dire à l'ordinateur quoi faire. Grâce à ce langage de programmation appelé COBOL, les entreprises n'ont plus besoin de programmeurs. Plus tard, il est dit qu'IBM a développé un nouveau langage de programmation appelé RPG qui permet aux employés de remplir des formulaires et de générer des rapports, de sorte que la plupart des besoins de programmation de l'entreprise puissent être satisfaits grâce à lui.
