AI能证明数学数据库中82%的问题了，新SOTA已达成，还是基于Transformer-人工智能-PHP中文网

还是Transformer

实验结果

One More Thing

首页

科技周边

人工智能

AI能证明数学数据库中82%的问题了，新SOTA已达成，还是基于Transformer

王林

Apr 10, 2023 am 08:51 AM

数据库 ai sota

AI能证明数学数据库中82%的问题了，新SOTA已达成，还是基于Transformer

不得不说，科学家们最近都在痴迷给AI补数学课了。

这不，脸书团队也来凑热闹，提出了一种新模型，能完全自动化论证定理，并显着优于SOTA。

要知道，随着数学定理愈加复杂，之后再仅凭人力来论证定理只会变得更加困难。

因此，用计算机论证数学定理已经成为一个研究焦点。

此前OpenAI也提出过专攻这一方向的模型GPT-f，它能论证Metamath中56%的问题。

而这次提出的最新方法，能将这一数字提升到82.6%。

与此同时，研究人员表示该方法使用的时间还更短，与GPT-f相比可以将计算消耗缩减到原本的十分之一。

难道说这一次AI大战数学，是要成功了?

还是Transformer

本文提出的方法为一种基于Transformer的在线训练程序。

大致可以分为三步：

第一、在数学证明库中预训练;

第二、在有监督数据集上微调策略模型;

第三、在线训练策略模型和判断模型。

具体来看是利用一种搜索算法，让模型在已有的数学证明库中学习，然后去推广证明更多的问题。

其中数学证明库包括3种，分别是Metamath、Lean和自研的一种证明环境。

这些证明库简单来说，就是把普通数学语言转换成近似于编程语言的形式。

AI能证明数学数据库中82%的问题了，新SOTA已达成，还是基于Transformer

Metamath的主库是set.mm，包含基于ZFC集合论的约38000个证明。

Lean更为人熟知的，是微软那个可以参加IMO赛事的AI算法。 Lean库就是为了教会同名算法所有的本科数学知识，并让它学会证明这些定理。

这项研究的主要目标，是为了构建一个证明器，让它可以自动生成一系列合适的策略去论证问题。

为此，研究人员提出了一个基于MCTS的非平衡超图证明搜索算法。

MCTS译为蒙特卡洛树搜索，常用于解决博弈树问题，它因为AlphaGo所被人熟知。

它的运行过程，就是通过在搜索空间中随机抽样来找寻有希望的动作，然后根据这个动作来扩展搜索树。

本项研究采用的思路类似于此。

搜索证明过程从目标g开始，向下搜索方法，逐步发展成一个超图(Hypergraph)。

当出现一个分支下出现空集时，就意味着找到了一个最优证明。

最后，在反向传播过程中，记下超树的节点值和总操作次数。

AI能证明数学数据库中82%的问题了，新SOTA已达成，还是基于Transformer

在这个环节中，研究人员假设了一个策略模型和一个判断模型。

策略模型允许判断模型进行抽样，判断模型可以评估当前策略找到证明方法的能力。

整个搜索算法，就以如上两个模型作为参照。

而这两个模型都是Transformer模型，且权值共享。

接下来，就到了在线训练的阶段。

这个过程中，控制器会将语句发送给异步HTPS验证，并收集训练和证明数据。

然后验证器会将训练样本发送给分布式训练器，并定期同步其模型副本。

AI能证明数学数据库中82%的问题了，新SOTA已达成，还是基于Transformer

实验结果

在测试环节，研究人员将HTPS与GPT-f进行了比较。

后者是OpenAI此前提出的数学定理推理模型，同样基于Transformer。

结果表明，在线训练后的模型可以证明Metamath中82%的问题，远超GPT-f此前56.5%的记录。

AI能证明数学数据库中82%的问题了，新SOTA已达成，还是基于Transformer

在Lean库中，这一模型可以证明其中43%的定理，比SOTA提高了38%，以下是该模型证明出的IMO试题。

AI能证明数学数据库中82%的问题了，新SOTA已达成，还是基于Transformer

不过目前它还不是十全十美。

比如在如下这道题中，它并没有用最简便的办法解出题目，研究人员表示这是因为注释中出现了错误。

AI能证明数学数据库中82%的问题了，新SOTA已达成，还是基于Transformer

One More Thing

用计算机论证数学问题，四色定理的证明便是最为人熟知的例子之一。

四色定理是近代数学三大难题之一，它提出“任何一张地图只用四种颜色就能使具有共同边界的国家，着上不同的颜色”。

由于这一定理的论证需要大量计算，在它被提出后100年内，都没有人能完全论证。

直到1976年，在美国伊利诺斯大学两台计算机上，经过1200小时、100亿次判断后，终于可以论证任何一张地图都只需要4种颜色来标记，由此也轰动了整个数学界。

加之随着数学问题愈加复杂，用人力来检验定理是否正确也变得更加困难。

近来，AI界也把目光逐步聚焦在数学问题上。

2020年，OpenAI推出数学定理推理模型GPT-f，可用于自动定理证明。

这一方法可完成测试集中56.5%的证明，超过当时SOTA模型MetaGen-IL30%以上。

同年，微软也发布了可以做出IMO试题的Lean，这意味着AI能做出没见过的题目了。

去年，OpenAI给GPT-3加上验证器后，做数学题效果明显好于此前微调的办法，可以达到小学生90%的水平。

今年1月，来自MIT 哈佛哥伦比亚大学滑铁卢大学的一项联合研究表明，他们提出的模型可以做高数了。

总之，科学家们正在努力让AI这个偏科生变得文理双全。

以上是AI能证明数学数据库中82%的问题了，新SOTA已达成，还是基于Transformer的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

gmail邮箱登陆入口在哪里

7486

CakePHP 教程

1377

steam的账户名称是什么格式

win11激活密钥永久

NYT连接提示和答案

显示更多

Related knowledge

mysql：简单的概念，用于轻松学习 Apr 10, 2025 am 09:29 AM

MySQL是一个开源的关系型数据库管理系统。1）创建数据库和表：使用CREATEDATABASE和CREATETABLE命令。2）基本操作：INSERT、UPDATE、DELETE和SELECT。3）高级操作：JOIN、子查询和事务处理。4）调试技巧：检查语法、数据类型和权限。5）优化建议：使用索引、避免SELECT*和使用事务。

MySQL：数据库的用户友好介绍 Apr 10, 2025 am 09:27 AM

MySQL的安装和基本操作包括：1.下载并安装MySQL，设置根用户密码；2.使用SQL命令创建数据库和表，如CREATEDATABASE和CREATETABLE；3.执行CRUD操作，使用INSERT,SELECT,UPDATE,DELETE命令；4.创建索引和存储过程以优化性能和实现复杂逻辑。通过这些步骤，你可以从零开始构建和管理MySQL数据库。

Redis内存碎片如何处理？ Apr 10, 2025 pm 02:24 PM

Redis内存碎片是指分配的内存中存在无法再分配的小块空闲区域。应对策略包括：重启Redis：彻底清空内存，但会中断服务。优化数据结构：使用更适合Redis的结构，减少内存分配和释放次数。调整配置参数：使用策略淘汰最近最少使用的键值对。使用持久化机制：定期备份数据，重启Redis清理碎片。监控内存使用情况：及时发现问题并采取措施。

phpmyadmin建立数据表 Apr 10, 2025 pm 11:00 PM

要使用 phpMyAdmin 创建数据表，以下步骤必不可少：连接到数据库并单击“新建”标签。为表命名并选择存储引擎（推荐 InnoDB）。通过单击“添加列”按钮添加列详细信息，包括列名、数据类型、是否允许空值以及其他属性。选择一个或多个列作为主键。单击“保存”按钮创建表和列。

怎么创建oracle数据库 oracle怎么创建数据库 Apr 11, 2025 pm 02:33 PM

创建Oracle数据库并非易事，需理解底层机制。1. 需了解数据库和Oracle DBMS的概念；2. 掌握SID、CDB（容器数据库）、PDB（可插拔数据库）等核心概念；3. 使用SQL*Plus创建CDB，再创建PDB，需指定大小、数据文件数、路径等参数；4. 高级应用需调整字符集、内存等参数，并进行性能调优；5. 需注意磁盘空间、权限和参数设置，并持续监控和优化数据库性能。熟练掌握需不断实践，才能真正理解Oracle数据库的创建和管理。

为什么要使用mysql？利益和优势 Apr 12, 2025 am 12:17 AM

选择MySQL的原因是其性能、可靠性、易用性和社区支持。1.MySQL提供高效的数据存储和检索功能，支持多种数据类型和高级查询操作。2.采用客户端-服务器架构和多种存储引擎，支持事务和查询优化。3.易于使用，支持多种操作系统和编程语言。4.拥有强大的社区支持，提供丰富的资源和解决方案。

使用 Redis Exporter 服务监控 Redis Droplet Apr 10, 2025 pm 01:36 PM

有效监控 Redis 数据库对于保持最佳性能、识别潜在瓶颈和确保整体系统可靠性至关重要。 Redis Exporter Service 是一个强大的实用程序，旨在使用 Prometheus 监控 Redis 数据库。本教程将指导您完成 Redis Exporter Service 的完整设置和配置，确保您无缝建立监控解决方案。通过学习本教程，您将实现完全可操作的监控设置

oracle数据库怎么创建 oracle数据库怎么建库 Apr 11, 2025 pm 02:36 PM

创建Oracle数据库，常用方法是使用dbca图形化工具，步骤如下：1. 使用dbca工具，设置dbName指定数据库名；2. 设置sysPassword和systemPassword为强密码；3. 设置characterSet和nationalCharacterSet为AL32UTF8；4. 设置memorySize和tablespaceSize根据实际需求调整；5. 指定logFile路径。高级方法为使用SQL命令手动创建，但更复杂易错。需要注意密码强度、字符集选择、表空间大小及内存

See all articles

AI能证明数学数据库中82%的问题了，新SOTA已达成，还是基于Transformer

还是Transformer

实验结果

One More Thing

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题