Récemment, le chatbot d'intelligence artificielle ChatGPT a pris d'assaut Internet, et les internautes se précipitent pour apprécier son intelligence émotionnelle très élevée et son énorme pouvoir. Passer l'examen d'entrée à l'université, modifier le code, concevoir des romans... Il continue de se percer sous la « suggestion » de la majorité des internautes, et peut même utiliser un programme entier pour assembler un chiot pour vous. Ces compétences sont uniquement développées sur la base de GPT-3.5. Le 15 mars, le monde de l'IA a été à nouveau mis à jour et la dernière version de GPT-4 a également été publiée par OpenAI.
Par rapport à avant, GPT-4 démontre non seulement des capacités de compréhension du langage plus puissantes, mais peut également traiter le contenu des images, et son score à l'examen peut même dépasser 90 % des humains. Alors, quelles autres capacités possède un GPT-4 aussi « défiant » ? Comment est-il fabriqué ?
Après la sortie de GPT-4, le site officiel d'OpenAI a été temporairement encombré et de nombreux utilisateurs ont exprimé sur les réseaux sociaux qu'ils s'étaient immédiatement abonnés au service Plus. Après la sortie de GPT-4, le terme « GPT-4 » est rapidement apparu sur les listes chaudes aux États-Unis, au Japon et dans d'autres régions, ainsi que sur la liste de recherche chaude nationale Weibo, la liste sociale chaude Douyin, etc.
Selon l'introduction officielle d'OpenAI, GPT-4 est un grand modèle multimodal qui peut recevoir des images et du texte en entrée et en sortie de texte. Bien qu’il soit moins performant que les humains dans de nombreux scénarios du monde réel, il démontre des performances au niveau humain sur une variété de critères professionnels et académiques. Par exemple, GPT-4 peut réussir le SAT (American Scholastic Aptitude Test) simulé et atteindre les 10 % supérieurs, tandis que GPT-3.5 peut atteindre les 10 % inférieurs.
Nous avons vu que dans la vidéo de démonstration officielle, le président et co-fondateur d'Open AI, Greg Brockman, a également donné aux utilisateurs un aperçu des capacités de reconnaissance d'images de la dernière version du système, qui n'a pas encore été rendue publique et est uniquement développé par une société appelée Be My Eyes company testing. Cette fonctionnalité permettra à GPT-4 d'analyser et de répondre aux images soumises avec des invites et de répondre aux questions ou d'effectuer des tâches basées sur ces images. "GPT-4 n'est pas seulement un modèle de langage, c'est un modèle de vision", a déclaré Brockman. "Il a la flexibilité d'accepter des entrées arbitrairement entrecoupées d'images et de texte, un peu comme un document
Dans un autre moment." Lors de la démo, Greg Brockman a soumis une photo d'un dessin à la main et un croquis préliminaire du site Web à GPT-4, et le système a créé un site Web fonctionnel basé sur le dessin.
L'industrie estime que ChatGPT-4 est 571 fois plus puissant que GPT-3. Les trois principales professions qui bénéficient le plus de cette dernière réalisation sont les écrivains, les spécialistes du marketing et les entrepreneurs. Sur la base de la comparaison entre les deux, les initiés de l'industrie ont également souligné que GPT-4 présente d'autres avantages, tels que davantage de données de formation, des réponses plus diversifiées et plus créatives et un temps de réponse plus court d'une seconde.
Nous pensons que l'une des principales tendances reflétées dans cette mise à niveau est la multimodalité. Le modèle est devenu plus complexe et plus volumineux. Différents types de données peuvent être intégrés dans le même modèle pour faire des prédictions plus précises sur notre environnement. l'environnement et le monde réel.
De plus, GPT-4 montre également sa supériorité en termes de multi-langue. Parmi les 26 langues testées, GPT-4 a obtenu de meilleurs résultats que les performances en anglais d'autres grands modèles linguistiques tels que GPT-3.5 dans 24 langues, y compris certaines langues à faibles ressources telles que le letton et le gallois. Dans le contexte chinois, GPT-4 est capable d’atteindre une précision de 80,1 %.
Cependant, OpenAI a également répertorié les lacunes de GPT-4 sur le site officiel. Il présente encore des limites connues, notamment les préjugés sociaux, la fabrication de faits et la génération de confrontations. OpenAI a déclaré qu'à mesure que la société accepte les modèles d'IA, elle augmentera la transparence, encouragera et promouvra l'éducation des utilisateurs et une culture plus large de l'intelligence artificielle, et s'efforcera d'élargir les canaux de contribution des gens dans la culture des modèles d'IA.
Avec le développement de GPT-4, nous avons constaté que même si ses capacités sont inférieures à celles des humains dans de nombreux scénarios du monde réel, il a montré des performances comparables à celles des humains dans divers référentiels professionnels et académiques. niveau, ce qui signifie également que GPT-4 a effectivement franchi une étape plus loin dans la commercialisation.
Auparavant, les performances du GPT-3 dans le domaine professionnel étaient considérées comme insatisfaisantes. Lors de l'examen uniforme du barreau (MBE+MEE+MPT) aux États-Unis, le GPT-3.5 ne peut se classer que dans les 10 % inférieurs, tandis que le GPT. - Un score de 4 se classerait déjà dans le top 10 %. Les capacités de GPT-4 dans les domaines professionnels ont été considérablement améliorées. Dans certains domaines professionnels, il s'est progressivement rapproché, voire dépassé, des humains, ce qui offre à GPT-4 plus de possibilités dans de nombreux domaines d'activité ToB.
Par exemple, dans des domaines tels que les outils auxiliaires de compétences professionnelles, les applications de récupération de connaissances, l'enseignement et la formation professionnels, etc., les capacités apportées par GPT-4 peuvent être révolutionnaires.
Après la sortie de GPT-4, Microsoft a immédiatement déclaré : « Si vous avez utilisé la nouvelle version préliminaire de Bing à tout moment au cours des cinq dernières semaines, vous avez déjà compris à l'avance les puissantes fonctionnalités du dernier modèle d'OpenAI. Cela signifie que New Bing a déjà utilisé GPT-4 Au cours des dernières semaines, de nombreuses personnes ont expérimenté Bing qui a été amélioré par GPT-4 et n'a ouvert que l'utilisation des fonctionnalités de texte. Bien que Microsoft n'ait pas utilisé le mot « première mondiale » pour le décrire, après tout, Microsoft a investi 13 milliards de dollars américains (environ 90 milliards de RMB) dans OpenAPI, et le traitement en échange est raisonnable.
En plus du nouveau Bing de Microsoft, de nombreuses entreprises intègrent actuellement GPT-4 dans leurs produits, notamment le logiciel d'apprentissage des langues Duolingo, le logiciel pour aider les utilisateurs malvoyants BeMyEyes, et la société de paiement mobile Stripe, la société internationale de services financiers Morgan Stanley, etc. .
Mais nous devons admettre que même si GPT-4 a considérablement élargi les scénarios de commercialisation dans lesquels de grands modèles peuvent être mis en œuvre, la puissance de calcul et les coûts de R&D sont encore considérés par beaucoup comme des obstacles difficiles à surmonter dans la mise en œuvre de grands modèles. Après tout, les dépenses en R&D et en puissance de calcul pour les grands modèles semblent actuellement effrayantes. Auparavant, les dépenses de formation et de fonctionnement quotidiennes divulguées par ChatGPT s'élevaient à des millions de dollars. Il peut être difficile de contrôler les coûts pour une utilisation commerciale à court terme. terme.
Comme nous le savons tous, ChatGPT est un modèle de traitement du langage naturel à grande échelle développé par OpenAI, mais beaucoup de gens ne savent pas que son historique de développement remonte à 2015. En 2015, OpenAI a été cofondée par Musk, Sam Altman de Tesla et d'autres investisseurs, dans le but de promouvoir le développement du domaine de l'intelligence artificielle grâce à une technologie avancée d'intelligence artificielle. Musk a quitté l'entreprise en 2018 en raison de divergences dans l'orientation du développement de l'entreprise.
Auparavant, OpenAI était célèbre pour avoir lancé la série GPT de modèles de traitement du langage naturel. Depuis 2018, OpenAI a commencé à publier le modèle de langage génératif pré-entraîné GPT (Generative Pre-trained Transformer), qui peut être utilisé pour générer divers contenus tels que des articles, des codes, des traductions automatiques et des questions-réponses.
Le nombre de paramètres de chaque génération de modèles GPT a explosé. Le nombre de paramètres de GPT-2 publié en février 2019 était de 1,5 milliard. En mai 2020, lorsque OpenAI a publié GPT-3, c'était déjà le modèle le plus avancé du marché. le monde. GPT-3 possède 175 milliards de paramètres.
Lorsque GPT-3 est apparu, en tant que modèle non supervisé (maintenant souvent appelé modèle auto-supervisé), il peut presque accomplir la plupart des tâches de traitement du langage naturel, telles que la recherche orientée problème, la compréhension écrite, l'inférence sémantique et la traduction automatique. , génération d'articles et questions/réponses automatiques, etc.
De plus, le modèle fonctionne bien sur de nombreuses tâches, comme atteindre le niveau de pointe actuel sur les tâches de traduction automatique français-anglais et allemand-anglais. Les articles générés automatiquement sont presque impossibles à distinguer des humains aux machines, ce qui est vrai. est encore plus surprenant. De plus, il peut atteindre une précision de près de 100 % sur les tâches d'addition et de soustraction à deux chiffres, et il peut même générer automatiquement du code basé sur la description de la tâche. Un modèle non supervisé a de multiples fonctions et de bons effets, et il semble donner aux gens l'espoir d'une intelligence artificielle générale. C'est peut-être la principale raison pour laquelle GPT-3 a un si grand impact.
En 2021, OpenAI a annoncé qu'elle lancerait un nouveau nom appelé « DALL-E », une technologie d'intelligence artificielle capable de générer des images. Dans le même temps, OpenAI développe également une technologie de traitement du langage naturel plus avancée.
Je crois que tout le monde connaît l'histoire après cela. Fin 2022, ChatGPT basé sur GPT-3.5 a balayé le monde à la vitesse de la lumière et est devenu la plus grande « panne technique » au monde jusqu'à présent, la sortie de GPT-4. a été sur la liste de recherche chaude dans de nombreux pays.
Qu'en est-il de l'avenir de GPT ? Il est prévisible qu'avec l'avancement continu de la technologie des algorithmes et de la technologie de puissance de calcul, ChatGPT évoluera vers une version plus avancée avec des fonctions plus puissantes, sera appliqué dans de plus en plus de domaines et générera des conversations plus nombreuses et de meilleure qualité pour les êtres humains et le contenu.
Peut-être que GPT est encore loin de l'actuelle « IA », mais autant le considérer comme un point de départ, le point de départ d'une nouvelle ère « IA ».
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!