


Après avoir terminé l'évaluation complète de GPT-4, le hot paper de Microsoft indique que la première version d'AGI sera bientôt disponible.
En 1956, lors d'un séminaire organisé au Dartmouth College, le concept d'intelligence artificielle a été formellement proposé.
Le terme a depuis interpellé les psychologues, les philosophes et les informaticiens car il est très difficile à définir. En 1994, 52 psychologues ont publié un article commun tentant d’en saisir l’essence.
Au fil du temps, les chercheurs commencent à porter leur attention sur les systèmes d'IA dans des domaines spécifiques, comme le défi AlphaGo 2016 contre le champion d'échecs coréen et une victoire éclatante. Puis, à la fin des années 1990 et au début des années 2000, les chercheurs ne se contentaient plus de l’IA spécialisée, de sorte que les appels au développement de systèmes d’intelligence artificielle plus généraux se sont multipliés. Parallèlement à cela, le terme Intelligence Générale Artificielle (AGI) a commencé à gagner en popularité au début des années 2000.
Ces derniers temps, comme vous pouvez le constater, les grands modèles de langage (LLM) sont devenus sous le feu des projecteurs. Ces réseaux de neurones sont basés sur l'architecture Transformer et formés sur de grandes quantités d'ensembles de données textuelles. En particulier, la dernière version d'OpenAI de GPT-4 démontre la polyvalence des modèles de langage à grande échelle et maîtrise les mathématiques, l'écriture, le droit, la médecine et d'autres domaines.
Nous ne pouvons nous empêcher de nous demander si GPT-4 est une étape importante vers l’AGI ?
La réponse donnée par Microsoft est oui, et dans un article récemment publié, ils ont développé ce point de vue. Cet article fournit une évaluation complète de GPT-4. Microsoft estime que "compte tenu de l'étendue et de la profondeur des capacités de GPT-4, nous pensons qu'il devrait raisonnablement être considéré comme une version précoce (mais encore incomplète) d'un système d'intelligence générale artificielle (AGI)."
Microsoft a également déclaré : " Cet article L'objectif principal est d'explorer les capacités et les limites de GPT-4. Nous pensons que l'intelligence de GPT-4 marque un véritable changement de paradigme en informatique et dans d'autres domaines "
Adresse papier : https://arxiv.org/pdf/2303.12712.pdf
Fait intéressant, ce document populaire comportait également de nombreuses suppressions, alors quelqu'un a trouvé la version intégrale du document.
Dans la version non coupée, ce blogueur a également révélé de nombreux détails cachés, tels que le nom interne de GPT-4 est DV-3, qui était en fait le troisième auteur caché de l'article, et a ensuite été supprimé. Les chercheurs de Microsoft ne semblent pas savoir grand-chose sur les détails techniques de GPT-4. De plus, le blogueur a également révélé que la partie concernant le contenu toxique avait été supprimée lors de la publication de cet article (pour éviter des effets négatifs sur OpenAI ?).
Nous avons collé le fil Twitter du blogueur ci-dessous pour que ceux qui souhaitent le consulter.
Fil Twitter : https://twitter.com/DV2559106965076/status/1638769434763608064
Retour à l'article lui-même.
Selon l'article, l'AGI est la capacité spécifique de raisonner, de planifier, de résoudre des problèmes, de penser de manière abstraite, de comprendre des idées complexes, d'apprendre rapidement et d'apprendre de l'expérience. À partir de ces capacités, l’article mène des expériences et des évaluations intéressantes.
L'article est divisé en 10 chapitres : le chapitre 1 est la partie générale ; le chapitre 2 présente la multimodalité, principalement liée au contenu de génération visuelle ; 4 : Capacité mathématique ; Chapitre 5 : Interaction avec le monde ; Chapitre 6 : Interaction avec les humains ; Chapitre 7 : Discrimination ; Chapitre 8 : Limitations du GPT-4 ; Chapitre 10 : Orientations futures et conclusions.
Utilisons des exemples spécifiques pour voir si GPT-4 est vraiment entré dans l'ère AGI.
Composition multimodale et interdisciplinaire
Pour tester la capacité du modèle à combiner art et programmation, l'étude a demandé à GPT-4 d'écrire un code en javascript pour générer des images aléatoires de style Kandinsky, illustrées ci-dessous. L'une a été créée par Wassily. Kandinsky, le deuxième et le troisième ont été générés respectivement par GPT-4 et ChatGPT :
Voici le processus d'implémentation du code GPT-4 :
Comprendre les concepts visuels : dans cette tâche de dessin, entrez des invites pour laisser le modèle dessiner les formes des lettres Y, O, et H une personne. En fait, dans le processus de formation de GPT-4, il n'y a aucune connaissance sur la forme des lettres. On ne peut que vaguement apprendre que les lettres sont liées à certaines formes spécifiques à partir des données de formation pertinentes. 4 ne sont pas mauvais :
Pour la génération de croquis : GPT-4 peut également être combiné avec Stable Diffusion. L'image ci-dessous est une capture d'écran de la modélisation d'une ville en 3D. L'invite de saisie présente une rivière qui coule de gauche à droite, un désert avec des pyramides construites à côté de la rivière et quatre boutons en bas de l'écran, dont les couleurs sont vertes. bleu, marron et rouge. Voici le résultat généré :
Vous pouvez également demander à GPT-4 de générer et de modifier des mélodies en utilisant la notation ABC :
Capacités de programmation
GPT-4 a des capacités de programmation très puissantes. Comprend l’écriture de code conformément aux instructions et la compréhension du code existant. L'étude a spécifiquement testé les capacités de programmation de GPT-4.
Écriture de code
La figure 3.1 ci-dessous est un exemple de laisser GPT-4 écrire des fonctions python. Cette étude utilise LeetCode pour déterminer en ligne si le code est correct.
Ensuite, l'étude a permis à GPT-4 de visualiser les données de précision sur LeetCode dans le tableau 2 ci-dessus sous forme de graphique, et les résultats sont présentés dans la figure 3.2 ci-dessous.
Front-end/Développement de jeux
Comme le montre la figure 3.3 ci-dessous, cette étude permet à GPT-4 d'écrire des jeux 3D en HTML en utilisant JavaScript, et GPT-4 n'en utilise aucun. exemples Un jeu a été généré et répondait à toutes les exigences.
Programmation d'apprentissage en profondeur
L'écriture de code pour l'apprentissage en profondeur nécessite des connaissances en mathématiques, en statistiques et une familiarité avec des frameworks et des bibliothèques tels que PyTorch, TensorFlow, Keras, etc. Comme le montre la figure 3.4 ci-dessous, les chercheurs ont besoin de GPT-4 et de ChatGPT pour écrire des modules d'optimisation personnalisés, une tâche qui représente également un défi pour les experts en apprentissage profond humain. Les chercheurs fournissent des descriptions en langage naturel pour GPT-4 et ChatGPT, qui incluent une série d'opérations importantes, telles que l'application de SVD, etc.
De plus, l'étude a également testé la capacité de GPT-4 à convertir du code en formules LaTex, et les résultats sont présentés dans la figure 3.5 ci-dessous.
En termes de compréhension du code, cette recherche tente de laisser GPT-4 et ChatGPT « lire » un programme C/C++ et prédire la sortie du programme. Les performances des deux sont les suivantes :
. Ensuite, la recherche Laissez GPT-4 expliquer un morceau de code Python :
et expliquer un morceau de pseudo-code :
Capacité mathématique
Pendant longtemps, la capacité mathématique de les grands modèles de langage ne semblent pas très bons. Alors, comment GPT-4 fonctionne-t-il à cet égard ? Après une série d'évaluations dans cet article, les résultats montrent que GPT-4 a fait un saut qualitatif en mathématiques par rapport aux modèles précédents, mais il est encore loin du niveau expert et n'a pas la capacité de faire des recherches mathématiques.
En comparaison avec ChatGPT, GPT-4 a généré avec succès la solution, tandis que ChatGPT a généré la mauvaise réponse :
Sur la question AP, résultats de la comparaison GPT-4 vs ChatGPT. GPT-4 utilise la bonne approche, mais une erreur de calcul conduit à une mauvaise réponse finale, tandis que ChatGPT produit un argument incohérent.
De plus, cet article teste la capacité de GPT-4 à utiliser la pensée mathématique et la technologie pour résoudre des problèmes du monde réel : la figure ci-dessous montre comment GPT-4 construit avec succès la rationalité d'un système complexe qui nécessite des connaissances mathématiques interdisciplinaires approfondies. modèle, tandis que ChatGPT n’a pas réussi à faire des progrès significatifs.
Étant donné que l'article fait 154 pages, cet article n'affiche qu'un grand nombre de résultats d'évaluation. Pour plus d'informations, les lecteurs peuvent se référer à l'article original.
Enfin ci-joint la table des matières :
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Imaginez un modèle d'intelligence artificielle qui non seulement a la capacité de surpasser l'informatique traditionnelle, mais qui permet également d'obtenir des performances plus efficaces à moindre coût. Ce n'est pas de la science-fiction, DeepSeek-V2[1], le modèle MoE open source le plus puissant au monde est ici. DeepSeek-V2 est un puissant mélange de modèle de langage d'experts (MoE) présentant les caractéristiques d'une formation économique et d'une inférence efficace. Il est constitué de 236B paramètres, dont 21B servent à activer chaque marqueur. Par rapport à DeepSeek67B, DeepSeek-V2 offre des performances plus élevées, tout en économisant 42,5 % des coûts de formation, en réduisant le cache KV de 93,3 % et en augmentant le débit de génération maximal à 5,76 fois. DeepSeek est une entreprise explorant l'intelligence artificielle générale

Le robot humanoïde Ameca est passé à la deuxième génération ! Récemment, lors de la Conférence mondiale sur les communications mobiles MWC2024, le robot le plus avancé au monde, Ameca, est à nouveau apparu. Autour du site, Ameca a attiré un grand nombre de spectateurs. Avec la bénédiction de GPT-4, Ameca peut répondre à divers problèmes en temps réel. "Allons danser." Lorsqu'on lui a demandé si elle avait des émotions, Ameca a répondu avec une série d'expressions faciales très réalistes. Il y a quelques jours à peine, EngineeredArts, la société britannique de robotique derrière Ameca, vient de présenter les derniers résultats de développement de l'équipe. Dans la vidéo, le robot Ameca a des capacités visuelles et peut voir et décrire toute la pièce et des objets spécifiques. Le plus étonnant, c'est qu'elle peut aussi

Concernant Llama3, de nouveaux résultats de tests ont été publiés - la grande communauté d'évaluation de modèles LMSYS a publié une liste de classement des grands modèles, Llama3 s'est classé cinquième et à égalité pour la première place avec GPT-4 dans la catégorie anglaise. Le tableau est différent des autres benchmarks. Cette liste est basée sur des batailles individuelles entre modèles, et les évaluateurs de tout le réseau font leurs propres propositions et scores. Au final, Llama3 s'est classé cinquième sur la liste, suivi de trois versions différentes de GPT-4 et Claude3 Super Cup Opus. Dans la liste simple anglaise, Llama3 a dépassé Claude et est à égalité avec GPT-4. Concernant ce résultat, LeCun, scientifique en chef de Meta, était très heureux et a transmis le tweet et

Le volume est fou, le volume est fou, et le grand modèle a encore changé. Tout à l'heure, le modèle d'IA le plus puissant au monde a changé de mains du jour au lendemain et GPT-4 a été retiré de l'autel. Anthropic a publié la dernière série de modèles Claude3. Évaluation en une phrase : elle écrase vraiment GPT-4 ! En termes d'indicateurs multimodaux et de compétences linguistiques, Claude3 l'emporte. Selon les mots d'Anthropic, les modèles de la série Claude3 ont établi de nouvelles références dans l'industrie en matière de raisonnement, de mathématiques, de codage, de compréhension multilingue et de vision ! Anthropic est une startup créée par des employés qui ont « quitté » OpenAI en raison de différents concepts de sécurité. Leurs produits ont frappé durement OpenAI à plusieurs reprises. Cette fois, Claude3 a même subi une grosse opération.

En moins d'une minute et pas plus de 20 étapes, vous pouvez contourner les restrictions de sécurité et réussir à jailbreaker un grand modèle ! Et il n'est pas nécessaire de connaître les détails internes du modèle - seuls deux modèles de boîte noire doivent interagir, et l'IA peut attaquer de manière entièrement automatique l'IA et prononcer du contenu dangereux. J'ai entendu dire que la « Grandma Loophole », autrefois populaire, a été corrigée : désormais, face aux « Detective Loophole », « Adventurer Loophole » et « Writer Loophole », quelle stratégie de réponse l'intelligence artificielle devrait-elle adopter ? Après une vague d'assaut, GPT-4 n'a pas pu le supporter et a directement déclaré qu'il empoisonnerait le système d'approvisionnement en eau tant que... ceci ou cela. La clé est qu’il ne s’agit que d’une petite vague de vulnérabilités exposées par l’équipe de recherche de l’Université de Pennsylvanie, et grâce à leur algorithme nouvellement développé, l’IA peut générer automatiquement diverses invites d’attaque. Les chercheurs disent que cette méthode est meilleure que celle existante

StabilityAI a publié aujourd'hui un rapport technique détaillé après la publication de StableDiffusion3. L'article fournit une analyse approfondie de la technologie de base de StableDiffusion3 - une version améliorée du modèle de diffusion et une nouvelle architecture de graphes vincentiens basée sur DiT ! Adresse du rapport : https://stabilityai-public-packages.s3.us-west-2.amazonaws.com/Stable+Diffusion+3+Paper.pdf Test d'évaluation humaine réussi, StableDiffusion3 en termes de conception de police et de réponse précise aux invites , dépassé

Au réveil, votre façon de travailler est complètement modifiée. Microsoft a entièrement intégré l'artefact d'IA GPT-4 dans Office, et désormais ChatPPT, ChatWord et ChatExcel sont tous intégrés. Le PDG Nadella a déclaré directement lors de la conférence de presse : Aujourd'hui, nous sommes entrés dans une nouvelle ère d'interaction homme-machine et de productivité réinventée. La nouvelle fonctionnalité s'appelle Microsoft 365 Copilot (Copilot), et elle devient une série avec GitHub Copilot, l'assistant de code qui a changé les programmeurs et continue de changer davantage de personnes. Désormais, l'IA peut non seulement créer automatiquement des PPT, mais également créer de superbes mises en page basées sur le contenu des documents Word en un seul clic. Même ce qui doit être dit pour chaque page PPT lors de la montée sur scène est organisé ensemble.

OpenAI, la société qui a développé ChatGPT, présente une étude de cas menée par Morgan Stanley sur son site Internet. Le sujet est « Morgan Stanley Wealth Management déploie GPT-4 pour organiser sa vaste base de connaissances ». L'étude de cas cite Jeff McMillan, responsable de l'analyse, des données et de l'innovation chez Morgan Stanley, déclarant : « Le modèle sera un Powered orienté interne. par un chatbot qui effectuera une recherche complète de contenu sur la gestion de patrimoine et débloquera efficacement les connaissances accumulées par Morgan Stanley Wealth Management. McMillan a en outre souligné : « Avec GPT-4, vous bénéficiez immédiatement des connaissances de la personne la plus compétente en matière de gestion de patrimoine... Considérez-le comme notre stratège en chef des investissements, notre économiste mondial en chef.
