L'IA peut prouver 82 % des problèmes dans les bases de données mathématiques. Le nouveau SOTA a été réalisé et il est toujours basé sur Transformer.-IA-php.cn

Table des matières

Ou Transformer

Résultats expérimentaux

One More Thing

Maison

Périphériques technologiques

L'IA peut prouver 82 % des problèmes dans les bases de données mathématiques. Le nouveau SOTA a été réalisé et il est toujours basé sur Transformer.

王林

Apr 10, 2023 am 08:51 AM

数据库 ai sota

L'IA peut prouver 82 % des problèmes dans les bases de données mathématiques. Le nouveau SOTA a été réalisé et il est toujours basé sur Transformer.

Je dois dire que les scientifiques sont récemment obsédés par l'idée de donner des cours de mathématiques sur l'IA.

Non, l'équipe Facebook s'est également jointe à la fête et a proposé un nouveau modèle capable d'automatiser complètement la démonstration de théorèmes et qui est nettement meilleur que SOTA.

Vous devez savoir qu'à mesure que les théorèmes mathématiques deviennent plus complexes, il deviendra de plus en plus difficile de prouver les théorèmes uniquement par la puissance humaine.

Par conséquent, utiliser des ordinateurs pour démontrer des théorèmes mathématiques est devenu un axe de recherche.

OpenAI a également proposé précédemment un modèle GPT-f spécialisé dans cette direction, qui peut démontrer 56% des problèmes de Metamath.

La dernière méthode proposée cette fois peut augmenter ce nombre à 82,6%.

Dans le même temps, les chercheurs affirment que cette méthode prend moins de temps et peut réduire la consommation informatique à un dixième de celle d'origine par rapport au GPT-f.

Peut-on dire que cette fois l'IA réussira son combat contre les mathématiques ?

Ou Transformer

La méthode proposée dans cet article est un programme de formation en ligne basé sur Transformer.

peut être grossièrement divisé en trois étapes :

Première, pré-formation dans la bibliothèque de preuves mathématiques ;

Deuxièmement, affiner le modèle de politique sur l'ensemble de données supervisé ;

Troisième, en ligne ; Modèle de stratégie de formation et modèle de jugement.

Plus précisément, il utilise un algorithme de recherche pour permettre au modèle d'apprendre de la bibliothèque de preuves mathématiques existante, puis de le promouvoir pour prouver davantage de problèmes.

Il existe trois types de bibliothèques de preuves mathématiques, à savoir Metamath, Lean et un environnement de preuve auto-développé.

Pour faire simple, ces bibliothèques de preuves convertissent le langage mathématique ordinaire en une forme similaire à un langage de programmation.

L'IA peut prouver 82 % des problèmes dans les bases de données mathématiques. Le nouveau SOTA a été réalisé et il est toujours basé sur Transformer.

La bibliothèque principale de Metamath est set.mm, qui contient environ 38 000 preuves basées sur la théorie des ensembles ZFC.

Lean est mieux connu comme l'algorithme d'IA de Microsoft qui peut participer aux compétitions de l'OMI. La bibliothèque Lean est conçue pour enseigner à l'algorithme du même nom toutes les connaissances mathématiques du premier cycle et lui permettre d'apprendre à prouver ces théorèmes.

L'objectif principal de cette recherche est de construire un prouveur capable de générer automatiquement une série de stratégies appropriées pour prouver des problèmes.

À cette fin, les chercheurs ont proposé un algorithme de recherche de preuve d'hypergraphe hors équilibre basé sur MCTS.

MCTS est traduit par Monte Carlo Tree Search, qui est souvent utilisé pour résoudre les problèmes d'arbre de jeu. Il est bien connu grâce à AlphaGo.

Son processus de fonctionnement consiste à trouver des actions prometteuses en échantillonnant aléatoirement dans l'espace de recherche, puis à élargir l'arbre de recherche en fonction de cette action.

L'idée adoptée dans cette étude est similaire à celle-ci.

Le processus de preuve de recherche commence à partir de l'objectif g, recherche des méthodes vers le bas et se développe progressivement vers un hypergraphe.

Lorsqu'un ensemble vide apparaît sous une branche, cela signifie qu'une preuve optimale a été trouvée.

Enfin, pendant le processus de rétropropagation, enregistrez les valeurs des nœuds et le nombre total d'opérations du supertree.

L'IA peut prouver 82 % des problèmes dans les bases de données mathématiques. Le nouveau SOTA a été réalisé et il est toujours basé sur Transformer.

Dans ce lien, les chercheurs ont supposé un modèle de stratégie et un modèle de jugement.

Le modèle de politique permet un échantillonnage par le modèle de jugement, qui peut évaluer la capacité de la stratégie actuelle à trouver des méthodes de preuve.

L'ensemble de l'algorithme de recherche est basé sur les deux modèles ci-dessus comme référence.

Ces deux modèles sont des modèles Transformer et partagent des poids.

Vient ensuite l’étape de formation en ligne.

Dans ce processus, le contrôleur enverra la déclaration à une vérification HTPS asynchrone et collectera les données de formation et de preuve.

Le validateur enverra ensuite les échantillons de formation au formateur distribué et synchronisera périodiquement sa copie du modèle.

L'IA peut prouver 82 % des problèmes dans les bases de données mathématiques. Le nouveau SOTA a été réalisé et il est toujours basé sur Transformer.

Résultats expérimentaux

Lors de la session de test, les chercheurs ont comparé HTPS avec GPT-f.

Ce dernier est un modèle de raisonnement par théorème mathématique précédemment proposé par OpenAI, également basé sur Transformer.

Les résultats montrent que le modèle après formation en ligne peut prouver 82% des problèmes dans Metamath, dépassant de loin le record précédent de 56,5% de GPT-f.

L'IA peut prouver 82 % des problèmes dans les bases de données mathématiques. Le nouveau SOTA a été réalisé et il est toujours basé sur Transformer.

Dans la bibliothèque Lean, ce modèle peut prouver 43 % des théorèmes, soit 38 % de plus que SOTA. Voici les questions du test IMO prouvées par ce modèle.

L'IA peut prouver 82 % des problèmes dans les bases de données mathématiques. Le nouveau SOTA a été réalisé et il est toujours basé sur Transformer.

Mais ce n’est pas encore parfait.

Par exemple, dans la question suivante, cela n'a pas résolu la question de la manière la plus simple. Les chercheurs ont dit que c'était parce qu'il y avait des erreurs dans les annotations.

L'IA peut prouver 82 % des problèmes dans les bases de données mathématiques. Le nouveau SOTA a été réalisé et il est toujours basé sur Transformer.

One More Thing

Utilisation d'ordinateurs pour démontrer des problèmes mathématiques, la preuve du théorème des quatre couleurs est l'un des exemples les plus connus.

Le théorème des quatre couleurs est l'un des trois problèmes majeurs des mathématiques modernes. Il stipule que "n'importe quelle carte ne peut utiliser que quatre couleurs pour colorer les pays ayant des frontières communes dans des couleurs différentes".

Étant donné que la démonstration de ce théorème nécessite de nombreux calculs, personne n'a pu le démontrer pleinement dans les 100 ans suivant sa proposition.

Jusqu'en 1976, après 1 200 heures et 10 milliards de jugements sur deux ordinateurs de l'Université de l'Illinois, il était enfin possible de démontrer que n'importe quelle carte n'a besoin que de 4 couleurs pour la marquer, ce qui a également fait sensation dans toute la frontière mathématique.

De plus, à mesure que les problèmes mathématiques deviennent plus complexes, il devient plus difficile d'utiliser la puissance humaine pour vérifier si le théorème est correct.

Récemment, la communauté de l'IA s'est progressivement concentrée sur les problèmes mathématiques.

En 2020, OpenAI a lancé le modèle de raisonnement de théorème mathématique GPT-f, qui peut être utilisé pour la preuve automatique de théorèmes.

Cette méthode peut compléter 56,5 % des preuves de l'ensemble de tests, dépassant de plus de 30 % le modèle SOTA MetaGen-IL de l'époque.

La même année, Microsoft a également publié Lean, qui peut créer des questions de test IMO, ce qui signifie que l'IA peut poser des questions qu'elle n'a jamais vues auparavant.

L'année dernière, après qu'OpenAI ait ajouté un vérificateur à GPT-3, l'effet de la résolution de problèmes mathématiques était nettement meilleur que la méthode de réglage fin précédente, et il pouvait atteindre 90 % du niveau des élèves du primaire.

En janvier de cette année, une étude conjointe du MIT + Harvard + Columbia University + University of Waterloo a montré que le modèle qu'ils proposaient pouvait faire des mathématiques avancées.

En bref, les scientifiques travaillent dur pour faire de l'IA, un sujet partiel, capable à la fois d'arts et de sciences.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7478

Tutoriel CakePHP

1377

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Mysql peut-il renvoyer JSON Apr 08, 2025 pm 03:09 PM

MySQL peut renvoyer les données JSON. La fonction JSON_Extract extrait les valeurs de champ. Pour les requêtes complexes, envisagez d'utiliser la clause pour filtrer les données JSON, mais faites attention à son impact sur les performances. Le support de MySQL pour JSON augmente constamment, et il est recommandé de faire attention aux dernières versions et fonctionnalités.

Comprendre les propriétés acides: les piliers d'une base de données fiable Apr 08, 2025 pm 06:33 PM

Une explication détaillée des attributs d'acide de base de données Les attributs acides sont un ensemble de règles pour garantir la fiabilité et la cohérence des transactions de base de données. Ils définissent comment les systèmes de bases de données gérent les transactions et garantissent l'intégrité et la précision des données même en cas de plantages système, d'interruptions d'alimentation ou de plusieurs utilisateurs d'accès simultanément. Présentation de l'attribut acide Atomicité: une transaction est considérée comme une unité indivisible. Toute pièce échoue, la transaction entière est reculée et la base de données ne conserve aucune modification. Par exemple, si un transfert bancaire est déduit d'un compte mais pas augmenté à un autre, toute l'opération est révoquée. BeginTransaction; UpdateAccountSsetBalance = Balance-100Wh

Master SQL Limit Clause: Contrôlez le nombre de lignes dans une requête Apr 08, 2025 pm 07:00 PM

Clause SQLLIMIT: Contrôlez le nombre de lignes dans les résultats de la requête. La clause limite dans SQL est utilisée pour limiter le nombre de lignes renvoyées par la requête. Ceci est très utile lors du traitement de grands ensembles de données, des affichages paginés et des données de test, et peut améliorer efficacement l'efficacité de la requête. Syntaxe de base de la syntaxe: selectColumn1, Column2, ... FromTable_NamelimitNumber_Of_Rows; Number_OF_ROWS: Spécifiez le nombre de lignes renvoyées. Syntaxe avec décalage: selectColumn1, Column2, ... FromTable_Namelimitoffset, numéro_of_rows; décalage: sauter

Comment optimiser les performances MySQL pour les applications de haute charge? Apr 08, 2025 pm 06:03 PM

Guide d'optimisation des performances de la base de données MySQL dans les applications à forte intensité de ressources, la base de données MySQL joue un rôle crucial et est responsable de la gestion des transactions massives. Cependant, à mesure que l'échelle de l'application se développe, les goulots d'étranglement des performances de la base de données deviennent souvent une contrainte. Cet article explorera une série de stratégies efficaces d'optimisation des performances MySQL pour garantir que votre application reste efficace et réactive dans des charges élevées. Nous combinerons des cas réels pour expliquer les technologies clés approfondies telles que l'indexation, l'optimisation des requêtes, la conception de la base de données et la mise en cache. 1. La conception de l'architecture de la base de données et l'architecture optimisée de la base de données sont la pierre angulaire de l'optimisation des performances MySQL. Voici quelques principes de base: sélectionner le bon type de données et sélectionner le plus petit type de données qui répond aux besoins peut non seulement économiser un espace de stockage, mais également améliorer la vitesse de traitement des données.

La clé principale de MySQL peut être nul Apr 08, 2025 pm 03:03 PM

La clé primaire MySQL ne peut pas être vide car la clé principale est un attribut de clé qui identifie de manière unique chaque ligne dans la base de données. Si la clé primaire peut être vide, l'enregistrement ne peut pas être identifié de manière unique, ce qui entraînera une confusion des données. Lorsque vous utilisez des colonnes entières ou des UUIdes auto-incrémentales comme clés principales, vous devez considérer des facteurs tels que l'efficacité et l'occupation de l'espace et choisir une solution appropriée.

Méthode de Navicat pour afficher le mot de passe de la base de données MongoDB Apr 08, 2025 pm 09:39 PM

Il est impossible de visualiser le mot de passe MongoDB directement via NAVICAT car il est stocké sous forme de valeurs de hachage. Comment récupérer les mots de passe perdus: 1. Réinitialiser les mots de passe; 2. Vérifiez les fichiers de configuration (peut contenir des valeurs de hachage); 3. Vérifiez les codes (May Code Hardcode).

MySQL: Concepts simples pour l'apprentissage facile Apr 10, 2025 am 09:29 AM

MySQL est un système de gestion de base de données relationnel open source. 1) Créez une base de données et des tables: utilisez les commandes CreateDatabase et CreateTable. 2) Opérations de base: insérer, mettre à jour, supprimer et sélectionner. 3) Opérations avancées: jointure, sous-requête et traitement des transactions. 4) Compétences de débogage: vérifiez la syntaxe, le type de données et les autorisations. 5) Suggestions d'optimisation: utilisez des index, évitez de sélectionner * et utilisez les transactions.

Master la clause Order Order by dans SQL: Trier efficacement les données Apr 08, 2025 pm 07:03 PM

Explication détaillée de la clause SqlorderBy: le tri efficace de la clause de données d'ordre de données est une déclaration clé de SQL utilisée pour trier les ensembles de résultats de requête. Il peut être organisé en ordre ascendant (ASC) ou ordre décroissant (DESC) dans des colonnes uniques ou plusieurs colonnes, améliorant considérablement la lisibilité des données et l'efficacité de l'analyse. OrderBy Syntax selectColumn1, Column2, ... FromTable_NameOrderByColumn_Name [ASC | DESC]; Column_name: Triez par colonne. ASC: Ascendance Order Sort (par défaut). DESC: Trier en ordre décroissant. ORDERBY Fonctionnalités principales: Tri multi-colonnes: prend en charge le tri de plusieurs colonnes et l'ordre des colonnes détermine la priorité du tri. depuis

See all articles