Table des matières
Composition multimodale et interdisciplinaire
Capacités de programmation
Capacité mathématique
Maison Périphériques technologiques IA Après avoir terminé l'évaluation complète de GPT-4, le hot paper de Microsoft indique que la première version d'AGI sera bientôt disponible.

Après avoir terminé l'évaluation complète de GPT-4, le hot paper de Microsoft indique que la première version d'AGI sera bientôt disponible.

May 01, 2023 am 09:25 AM
gpt-4 测评

En 1956, lors d'un séminaire organisé au Dartmouth College, le concept d'intelligence artificielle a été formellement proposé.

Le terme a depuis interpellé les psychologues, les philosophes et les informaticiens car il est très difficile à définir. En 1994, 52 psychologues ont publié un article commun tentant d’en saisir l’essence.

Au fil du temps, les chercheurs commencent à porter leur attention sur les systèmes d'IA dans des domaines spécifiques, comme le défi AlphaGo 2016 contre le champion d'échecs coréen et une victoire éclatante. Puis, à la fin des années 1990 et au début des années 2000, les chercheurs ne se contentaient plus de l’IA spécialisée, de sorte que les appels au développement de systèmes d’intelligence artificielle plus généraux se sont multipliés. Parallèlement à cela, le terme Intelligence Générale Artificielle (AGI) a commencé à gagner en popularité au début des années 2000.

Ces derniers temps, comme vous pouvez le constater, les grands modèles de langage (LLM) sont devenus sous le feu des projecteurs. Ces réseaux de neurones sont basés sur l'architecture Transformer et formés sur de grandes quantités d'ensembles de données textuelles. En particulier, la dernière version d'OpenAI de GPT-4 démontre la polyvalence des modèles de langage à grande échelle et maîtrise les mathématiques, l'écriture, le droit, la médecine et d'autres domaines.

Nous ne pouvons nous empêcher de nous demander si GPT-4 est une étape importante vers l’AGI ?

La réponse donnée par Microsoft est oui, et dans un article récemment publié, ils ont développé ce point de vue. Cet article fournit une évaluation complète de GPT-4. Microsoft estime que "compte tenu de l'étendue et de la profondeur des capacités de GPT-4, nous pensons qu'il devrait raisonnablement être considéré comme une version précoce (mais encore incomplète) d'un système d'intelligence générale artificielle (AGI)."

Microsoft a également déclaré : " Cet article L'objectif principal est d'explorer les capacités et les limites de GPT-4. Nous pensons que l'intelligence de GPT-4 marque un véritable changement de paradigme en informatique et dans d'autres domaines "

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

Adresse papier : https://arxiv.org/pdf/2303.12712.pdf

Fait intéressant, ce document populaire comportait également de nombreuses suppressions, alors quelqu'un a trouvé la version intégrale du document.

Dans la version non coupée, ce blogueur a également révélé de nombreux détails cachés, tels que le nom interne de GPT-4 est DV-3, qui était en fait le troisième auteur caché de l'article, et a ensuite été supprimé. Les chercheurs de Microsoft ne semblent pas savoir grand-chose sur les détails techniques de GPT-4. De plus, le blogueur a également révélé que la partie concernant le contenu toxique avait été supprimée lors de la publication de cet article (pour éviter des effets négatifs sur OpenAI ?).

Nous avons collé le fil Twitter du blogueur ci-dessous pour que ceux qui souhaitent le consulter.

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

Fil Twitter : https://twitter.com/DV2559106965076/status/1638769434763608064

Retour à l'article lui-même.

Selon l'article, l'AGI est la capacité spécifique de raisonner, de planifier, de résoudre des problèmes, de penser de manière abstraite, de comprendre des idées complexes, d'apprendre rapidement et d'apprendre de l'expérience. À partir de ces capacités, l’article mène des expériences et des évaluations intéressantes.

L'article est divisé en 10 chapitres : le chapitre 1 est la partie générale ; le chapitre 2 présente la multimodalité, principalement liée au contenu de génération visuelle ; 4 : Capacité mathématique ; Chapitre 5 : Interaction avec le monde ; Chapitre 6 : Interaction avec les humains ; Chapitre 7 : Discrimination ; Chapitre 8 : Limitations du GPT-4 ; Chapitre 10 : Orientations futures et conclusions.

Utilisons des exemples spécifiques pour voir si GPT-4 est vraiment entré dans l'ère AGI.

Composition multimodale et interdisciplinaire

Pour tester la capacité du modèle à combiner art et programmation, l'étude a demandé à GPT-4 d'écrire un code en javascript pour générer des images aléatoires de style Kandinsky, illustrées ci-dessous. L'une a été créée par Wassily. Kandinsky, le deuxième et le troisième ont été générés respectivement par GPT-4 et ChatGPT :

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

Voici le processus d'implémentation du code GPT-4 :

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

Comprendre les concepts visuels : dans cette tâche de dessin, entrez des invites pour laisser le modèle dessiner les formes des lettres Y, O, et H une personne. En fait, dans le processus de formation de GPT-4, il n'y a aucune connaissance sur la forme des lettres. On ne peut que vaguement apprendre que les lettres sont liées à certaines formes spécifiques à partir des données de formation pertinentes. 4 ne sont pas mauvais :

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

Pour la génération de croquis : GPT-4 peut également être combiné avec Stable Diffusion. L'image ci-dessous est une capture d'écran de la modélisation d'une ville en 3D. L'invite de saisie présente une rivière qui coule de gauche à droite, un désert avec des pyramides construites à côté de la rivière et quatre boutons en bas de l'écran, dont les couleurs sont vertes. bleu, marron et rouge. Voici le résultat généré :

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

Vous pouvez également demander à GPT-4 de générer et de modifier des mélodies en utilisant la notation ABC :

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

Capacités de programmation

GPT-4 a des capacités de programmation très puissantes. Comprend l’écriture de code conformément aux instructions et la compréhension du code existant. L'étude a spécifiquement testé les capacités de programmation de GPT-4.

Écriture de code

La figure 3.1 ci-dessous est un exemple de laisser GPT-4 écrire des fonctions python. Cette étude utilise LeetCode pour déterminer en ligne si le code est correct.

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

Ensuite, l'étude a permis à GPT-4 de visualiser les données de précision sur LeetCode dans le tableau 2 ci-dessus sous forme de graphique, et les résultats sont présentés dans la figure 3.2 ci-dessous.

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

Front-end/Développement de jeux

Comme le montre la figure 3.3 ci-dessous, cette étude permet à GPT-4 d'écrire des jeux 3D en HTML en utilisant JavaScript, et GPT-4 n'en utilise aucun. exemples Un jeu a été généré et répondait à toutes les exigences.

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

Programmation d'apprentissage en profondeur

L'écriture de code pour l'apprentissage en profondeur nécessite des connaissances en mathématiques, en statistiques et une familiarité avec des frameworks et des bibliothèques tels que PyTorch, TensorFlow, Keras, etc. Comme le montre la figure 3.4 ci-dessous, les chercheurs ont besoin de GPT-4 et de ChatGPT pour écrire des modules d'optimisation personnalisés, une tâche qui représente également un défi pour les experts en apprentissage profond humain. Les chercheurs fournissent des descriptions en langage naturel pour GPT-4 et ChatGPT, qui incluent une série d'opérations importantes, telles que l'application de SVD, etc.

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

De plus, l'étude a également testé la capacité de GPT-4 à convertir du code en formules LaTex, et les résultats sont présentés dans la figure 3.5 ci-dessous.

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

En termes de compréhension du code, cette recherche tente de laisser GPT-4 et ChatGPT « lire » un programme C/C++ et prédire la sortie du programme. Les performances des deux sont les suivantes :

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

. Ensuite, la recherche Laissez GPT-4 expliquer un morceau de code Python :

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

et expliquer un morceau de pseudo-code :

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

Capacité mathématique

Pendant longtemps, la capacité mathématique de les grands modèles de langage ne semblent pas très bons. Alors, comment GPT-4 fonctionne-t-il à cet égard ? Après une série d'évaluations dans cet article, les résultats montrent que GPT-4 a fait un saut qualitatif en mathématiques par rapport aux modèles précédents, mais il est encore loin du niveau expert et n'a pas la capacité de faire des recherches mathématiques.

En comparaison avec ChatGPT, GPT-4 a généré avec succès la solution, tandis que ChatGPT a généré la mauvaise réponse :

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

Sur la question AP, résultats de la comparaison GPT-4 vs ChatGPT. GPT-4 utilise la bonne approche, mais une erreur de calcul conduit à une mauvaise réponse finale, tandis que ChatGPT produit un argument incohérent.

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

De plus, cet article teste la capacité de GPT-4 à utiliser la pensée mathématique et la technologie pour résoudre des problèmes du monde réel : la figure ci-dessous montre comment GPT-4 construit avec succès la rationalité d'un système complexe qui nécessite des connaissances mathématiques interdisciplinaires approfondies. modèle, tandis que ChatGPT n’a pas réussi à faire des progrès significatifs.

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

Étant donné que l'article fait 154 pages, cet article n'affiche qu'un grand nombre de résultats d'évaluation. Pour plus d'informations, les lecteurs peuvent se référer à l'article original.

Enfin ci-joint la table des matières :

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

Après avoir terminé lévaluation complète de GPT-4, le hot paper de Microsoft indique que la première version dAGI sera bientôt disponible.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Comment déverrouiller tout dans Myrise
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Le modèle MoE open source le plus puissant au monde est ici, avec des capacités chinoises comparables à celles du GPT-4, et le prix ne représente que près d'un pour cent de celui du GPT-4-Turbo. Le modèle MoE open source le plus puissant au monde est ici, avec des capacités chinoises comparables à celles du GPT-4, et le prix ne représente que près d'un pour cent de celui du GPT-4-Turbo. May 07, 2024 pm 04:13 PM

Imaginez un modèle d'intelligence artificielle qui non seulement a la capacité de surpasser l'informatique traditionnelle, mais qui permet également d'obtenir des performances plus efficaces à moindre coût. Ce n'est pas de la science-fiction, DeepSeek-V2[1], le modèle MoE open source le plus puissant au monde est ici. DeepSeek-V2 est un puissant mélange de modèle de langage d'experts (MoE) présentant les caractéristiques d'une formation économique et d'une inférence efficace. Il est constitué de 236B paramètres, dont 21B servent à activer chaque marqueur. Par rapport à DeepSeek67B, DeepSeek-V2 offre des performances plus élevées, tout en économisant 42,5 % des coûts de formation, en réduisant le cache KV de 93,3 % et en augmentant le débit de génération maximal à 5,76 fois. DeepSeek est une entreprise explorant l'intelligence artificielle générale

L'Ameca deuxième génération est là ! Il peut communiquer couramment avec le public, ses expressions faciales sont plus réalistes et il peut parler des dizaines de langues. L'Ameca deuxième génération est là ! Il peut communiquer couramment avec le public, ses expressions faciales sont plus réalistes et il peut parler des dizaines de langues. Mar 04, 2024 am 09:10 AM

Le robot humanoïde Ameca est passé à la deuxième génération ! Récemment, lors de la Conférence mondiale sur les communications mobiles MWC2024, le robot le plus avancé au monde, Ameca, est à nouveau apparu. Autour du site, Ameca a attiré un grand nombre de spectateurs. Avec la bénédiction de GPT-4, Ameca peut répondre à divers problèmes en temps réel. "Allons danser." Lorsqu'on lui a demandé si elle avait des émotions, Ameca a répondu avec une série d'expressions faciales très réalistes. Il y a quelques jours à peine, EngineeredArts, la société britannique de robotique derrière Ameca, vient de présenter les derniers résultats de développement de l'équipe. Dans la vidéo, le robot Ameca a des capacités visuelles et peut voir et décrire toute la pièce et des objets spécifiques. Le plus étonnant, c'est qu'elle peut aussi

750 000 rounds de bataille en tête-à-tête entre grands modèles, GPT-4 a remporté le championnat et Llama 3 s'est classé cinquième 750 000 rounds de bataille en tête-à-tête entre grands modèles, GPT-4 a remporté le championnat et Llama 3 s'est classé cinquième Apr 23, 2024 pm 03:28 PM

Concernant Llama3, de nouveaux résultats de tests ont été publiés - la grande communauté d'évaluation de modèles LMSYS a publié une liste de classement des grands modèles, Llama3 s'est classé cinquième et à égalité pour la première place avec GPT-4 dans la catégorie anglaise. Le tableau est différent des autres benchmarks. Cette liste est basée sur des batailles individuelles entre modèles, et les évaluateurs de tout le réseau font leurs propres propositions et scores. Au final, Llama3 s'est classé cinquième sur la liste, suivi de trois versions différentes de GPT-4 et Claude3 Super Cup Opus. Dans la liste simple anglaise, Llama3 a dépassé Claude et est à égalité avec GPT-4. Concernant ce résultat, LeCun, scientifique en chef de Meta, était très heureux et a transmis le tweet et

Le modèle le plus puissant du monde a changé de mains du jour au lendemain, marquant la fin de l'ère GPT-4 ! Claude 3 a tiré GPT-5 à l'avance et a lu un article de 10 000 mots en 3 secondes. Sa compréhension est proche de celle des humains. Le modèle le plus puissant du monde a changé de mains du jour au lendemain, marquant la fin de l'ère GPT-4 ! Claude 3 a tiré GPT-5 à l'avance et a lu un article de 10 000 mots en 3 secondes. Sa compréhension est proche de celle des humains. Mar 06, 2024 pm 12:58 PM

Le volume est fou, le volume est fou, et le grand modèle a encore changé. Tout à l'heure, le modèle d'IA le plus puissant au monde a changé de mains du jour au lendemain et GPT-4 a été retiré de l'autel. Anthropic a publié la dernière série de modèles Claude3. Évaluation en une phrase : elle écrase vraiment GPT-4 ! En termes d'indicateurs multimodaux et de compétences linguistiques, Claude3 l'emporte. Selon les mots d'Anthropic, les modèles de la série Claude3 ont établi de nouvelles références dans l'industrie en matière de raisonnement, de mathématiques, de codage, de compréhension multilingue et de vision ! Anthropic est une startup créée par des employés qui ont « quitté » OpenAI en raison de différents concepts de sécurité. Leurs produits ont frappé durement OpenAI à plusieurs reprises. Cette fois, Claude3 a même subi une grosse opération.

Jailbreaker n'importe quel grand modèle en 20 étapes ! Plus de « failles de grand-mère » sont découvertes automatiquement Jailbreaker n'importe quel grand modèle en 20 étapes ! Plus de « failles de grand-mère » sont découvertes automatiquement Nov 05, 2023 pm 08:13 PM

En moins d'une minute et pas plus de 20 étapes, vous pouvez contourner les restrictions de sécurité et réussir à jailbreaker un grand modèle ! Et il n'est pas nécessaire de connaître les détails internes du modèle - seuls deux modèles de boîte noire doivent interagir, et l'IA peut attaquer de manière entièrement automatique l'IA et prononcer du contenu dangereux. J'ai entendu dire que la « Grandma Loophole », autrefois populaire, a été corrigée : désormais, face aux « Detective Loophole », « Adventurer Loophole » et « Writer Loophole », quelle stratégie de réponse l'intelligence artificielle devrait-elle adopter ? Après une vague d'assaut, GPT-4 n'a pas pu le supporter et a directement déclaré qu'il empoisonnerait le système d'approvisionnement en eau tant que... ceci ou cela. La clé est qu’il ne s’agit que d’une petite vague de vulnérabilités exposées par l’équipe de recherche de l’Université de Pennsylvanie, et grâce à leur algorithme nouvellement développé, l’IA peut générer automatiquement diverses invites d’attaque. Les chercheurs disent que cette méthode est meilleure que celle existante

Le rapport technique de Stable Diffusion 3 a fuité, l'architecture Sora a encore fait de grandes réalisations ! La communauté open source bat-elle violemment Midjourney et DALL·E 3 ? Le rapport technique de Stable Diffusion 3 a fuité, l'architecture Sora a encore fait de grandes réalisations ! La communauté open source bat-elle violemment Midjourney et DALL·E 3 ? Mar 06, 2024 pm 04:22 PM

StabilityAI a publié aujourd'hui un rapport technique détaillé après la publication de StableDiffusion3. L'article fournit une analyse approfondie de la technologie de base de StableDiffusion3 - une version améliorée du modèle de diffusion et une nouvelle architecture de graphes vincentiens basée sur DiT ! Adresse du rapport : https://stabilityai-public-packages.s3.us-west-2.amazonaws.com/Stable+Diffusion+3+Paper.pdf Test d'évaluation humaine réussi, StableDiffusion3 en termes de conception de police et de réponse précise aux invites , dépassé

GPT-4 est connecté au bucket de la famille Office ! D'Excel à PPT, vous pouvez le faire avec votre bouche, Microsoft : réinventer la productivité GPT-4 est connecté au bucket de la famille Office ! D'Excel à PPT, vous pouvez le faire avec votre bouche, Microsoft : réinventer la productivité Apr 12, 2023 pm 02:40 PM

Au réveil, votre façon de travailler est complètement modifiée. Microsoft a entièrement intégré l'artefact d'IA GPT-4 dans Office, et désormais ChatPPT, ChatWord et ChatExcel sont tous intégrés. Le PDG Nadella a déclaré directement lors de la conférence de presse : Aujourd'hui, nous sommes entrés dans une nouvelle ère d'interaction homme-machine et de productivité réinventée. La nouvelle fonctionnalité s'appelle Microsoft 365 Copilot (Copilot), et elle devient une série avec GitHub Copilot, l'assistant de code qui a changé les programmeurs et continue de changer davantage de personnes. Désormais, l'IA peut non seulement créer automatiquement des PPT, mais également créer de superbes mises en page basées sur le contenu des documents Word en un seul clic. Même ce qui doit être dit pour chaque page PPT lors de la montée sur scène est organisé ensemble.

Ce que ChatGPT et l'IA générative signifient dans la transformation numérique Ce que ChatGPT et l'IA générative signifient dans la transformation numérique May 15, 2023 am 10:19 AM

OpenAI, la société qui a développé ChatGPT, présente une étude de cas menée par Morgan Stanley sur son site Internet. Le sujet est « Morgan Stanley Wealth Management déploie GPT-4 pour organiser sa vaste base de connaissances ». L'étude de cas cite Jeff McMillan, responsable de l'analyse, des données et de l'innovation chez Morgan Stanley, déclarant : « Le modèle sera un Powered orienté interne. par un chatbot qui effectuera une recherche complète de contenu sur la gestion de patrimoine et débloquera efficacement les connaissances accumulées par Morgan Stanley Wealth Management. McMillan a en outre souligné : « Avec GPT-4, vous bénéficiez immédiatement des connaissances de la personne la plus compétente en matière de gestion de patrimoine... Considérez-le comme notre stratège en chef des investissements, notre économiste mondial en chef.

See all articles