目錄
还是Transformer
实验结果
One More Thing
首頁 科技週邊 人工智慧 AI能證明數學資料庫中82%的問題了,新SOTA已達成,還是基於Transformer

AI能證明數學資料庫中82%的問題了,新SOTA已達成,還是基於Transformer

Apr 10, 2023 am 08:51 AM
資料庫 ai sota

AI能證明數學資料庫中82%的問題了,新SOTA已達成,還是基於Transformer

不得不说,科学家们最近都在痴迷给AI补数学课了。

这不,脸书团队也来凑热闹,提出了一种新模型,能完全自动化论证定理,并显著优于SOTA。

要知道,随着数学定理愈加复杂,之后再仅凭人力来论证定理只会变得更加困难。

因此,用计算机论证数学定理已经成为一个研究焦点。

此前OpenAI也提出过专攻这一方向的模型GPT-f,它能论证Metamath中56%的问题。

而这次提出的最新方法,能将这一数字提升到82.6%。

与此同时,研究人员表示该方法使用的时间还更短,与GPT-f相比可以将计算消耗缩减到原本的十分之一。

难道说这一次AI大战数学,是要成功了?

还是Transformer

本文提出的方法为一种基于Transformer的在线训练程序。

大致可以分为三步:

第一、在数学证明库中预训练;

第二、在有监督数据集上微调策略模型;

第三、在线训练策略模型和判断模型。

具体来看是利用一种搜索算法,让模型在已有的数学证明库中学习,然后去推广证明更多的问题。

其中数学证明库包括3种,分别是Metamath、Lean和自研的一种证明环境。

这些证明库简单来说,就是把普通数学语言转换成近似于编程语言的形式。

AI能證明數學資料庫中82%的問題了,新SOTA已達成,還是基於Transformer

Metamath的主库是set.mm,包含基于ZFC集合论的约38000个证明。

Lean更为人熟知的,是微软那个可以参加IMO赛事的AI算法。Lean库就是为了教会同名算法所有的本科数学知识,并让它学会证明这些定理。

这项研究的主要目标,是为了构建一个证明器,让它可以自动生成一系列合适的策略去论证问题。

为此,研究人员提出了一个基于MCTS的非平衡超图证明搜索算法。

MCTS译为蒙特卡洛树搜索,常用于解决博弈树问题,它因为AlphaGo所被人熟知。

它的运行过程,就是通过在搜索空间中随机抽样来找寻有希望的动作,然后根据这个动作来扩展搜索树。

本项研究采用的思路类似于此。

搜索证明过程从目标g开始,向下搜索方法,逐步发展成一个超图(Hypergraph)。

当出现一个分支下出现空集时,就意味着找到了一个最优证明。

最后,在反向传播过程中,记下超树的节点值和总操作次数。

AI能證明數學資料庫中82%的問題了,新SOTA已達成,還是基於Transformer

在这个环节中,研究人员假设了一个策略模型和一个判断模型。

策略模型允许判断模型进行抽样,判断模型可以评估当前策略找到证明方法的能力。

整个搜索算法,就以如上两个模型作为参照。

而这两个模型都是Transformer模型,且权值共享。

接下来,就到了在线训练的阶段。

这个过程中,控制器会将语句发送给异步HTPS验证,并收集训练和证明数据。

然后验证器会将训练样本发送给分布式训练器,并定期同步其模型副本。

AI能證明數學資料庫中82%的問題了,新SOTA已達成,還是基於Transformer

实验结果

在测试环节,研究人员将HTPS与GPT-f进行了比较。

后者是OpenAI此前提出的数学定理推理模型,同样基于Transformer。

结果表明,在线训练后的模型可以证明Metamath中82%的问题,远超GPT-f此前56.5%的记录。

AI能證明數學資料庫中82%的問題了,新SOTA已達成,還是基於Transformer

在Lean库中,这一模型可以证明其中43%的定理,比SOTA提高了38%,以下是该模型证明出的IMO试题。

AI能證明數學資料庫中82%的問題了,新SOTA已達成,還是基於Transformer

不过目前它还不是十全十美。

比如在如下这道题中,它并没有用最简便的办法解出题目,研究人员表示这是因为注释中出现了错误。

AI能證明數學資料庫中82%的問題了,新SOTA已達成,還是基於Transformer

One More Thing

用電腦論證數學問題,四色定理的證明就是最為人熟知的例子之一。

四色定理是近代數學三大難題之一,它提出「任何一張地圖只用四種顏色就能使具有共同邊界的國家,著上不同的顏色」。

由於這定理的論證需要大量計算,在它被提出後100年內,都沒有人能完全論證。

直到1976年,在美國伊利諾大學兩台電腦上,經過1200小時、100億次判斷後,終於可以論證任何一張地圖都只需要4種顏色來標記,由此也轟動了整個數學界。

加上之隨著數學問題愈加複雜,用人力來檢驗定理是否正確也變得更加困難。

近來,AI界也把目光逐步聚焦在數學問題上。

2020年,OpenAI推出數學定理推理模型GPT-f,可用來自動定理證明。

此方法可完成測試集中56.5%的證明,超過當時SOTA模型MetaGen-IL30%以上。

同年,微軟也發布了可以做出IMO試題的Lean,這意味著AI能做出沒見過的題目了。

去年,OpenAI給GPT-3加上驗證器後,做數學題效果明顯好於先前微調的辦法,可以達到小學生90%的水準。

今年1月,來自MIT 哈佛 哥倫比亞大學 滑鐵盧大學的一項聯合研究表明,他們提出的模型可以做高數了。

總之,科學家們正在努力讓AI這個偏科生變得文理雙全。

以上是AI能證明數學資料庫中82%的問題了,新SOTA已達成,還是基於Transformer的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

mysql:簡單的概念,用於輕鬆學習 mysql:簡單的概念,用於輕鬆學習 Apr 10, 2025 am 09:29 AM

MySQL是一個開源的關係型數據庫管理系統。 1)創建數據庫和表:使用CREATEDATABASE和CREATETABLE命令。 2)基本操作:INSERT、UPDATE、DELETE和SELECT。 3)高級操作:JOIN、子查詢和事務處理。 4)調試技巧:檢查語法、數據類型和權限。 5)優化建議:使用索引、避免SELECT*和使用事務。

SQL 如何添加新列 SQL 如何添加新列 Apr 09, 2025 pm 02:09 PM

SQL 中通過使用 ALTER TABLE 語句為現有表添加新列。具體步驟包括:確定表名稱和列信息、編寫 ALTER TABLE 語句、執行語句。例如,為 Customers 表添加 email 列(VARCHAR(50)):ALTER TABLE Customers ADD email VARCHAR(50);

SQL 添加列的語法是什麼 SQL 添加列的語法是什麼 Apr 09, 2025 pm 02:51 PM

SQL 中添加列的語法為 ALTER TABLE table_name ADD column_name data_type [NOT NULL] [DEFAULT default_value]; 其中,table_name 是表名,column_name 是新列名,data_type 是數據類型,NOT NULL 指定是否允許空值,DEFAULT default_value 指定默認值。

MySQL:數據庫的用戶友好介紹 MySQL:數據庫的用戶友好介紹 Apr 10, 2025 am 09:27 AM

MySQL的安裝和基本操作包括:1.下載並安裝MySQL,設置根用戶密碼;2.使用SQL命令創建數據庫和表,如CREATEDATABASE和CREATETABLE;3.執行CRUD操作,使用INSERT,SELECT,UPDATE,DELETE命令;4.創建索引和存儲過程以優化性能和實現複雜邏輯。通過這些步驟,你可以從零開始構建和管理MySQL數據庫。

SQL 添加列時如何設置默認值 SQL 添加列時如何設置默認值 Apr 09, 2025 pm 02:45 PM

為新添加的列設置默認值,使用 ALTER TABLE 語句:指定添加列並設置默認值:ALTER TABLE table_name ADD column_name data_type DEFAULT default_value;使用 CONSTRAINT 子句指定默認值:ALTER TABLE table_name ADD COLUMN column_name data_type CONSTRAINT default_constraint DEFAULT default_value;

SQL 清空表:性能優化技巧 SQL 清空表:性能優化技巧 Apr 09, 2025 pm 02:54 PM

提高 SQL 清空表性能的技巧:使用 TRUNCATE TABLE 代替 DELETE,釋放空間並重置標識列。禁用外鍵約束,防止級聯刪除。使用事務封裝操作,保證數據一致性。批量刪除大數據,通過 LIMIT 限制行數。清空後重建索引,提高查詢效率。

使用 DELETE 語句清空 SQL 表 使用 DELETE 語句清空 SQL 表 Apr 09, 2025 pm 03:00 PM

是的,DELETE 語句可用於清空 SQL 表,步驟如下:使用 DELETE 語句:DELETE FROM table_name;替換 table_name 為要清空的表的名稱。

如何在 SQL 表中添加一列 如何在 SQL 表中添加一列 Apr 09, 2025 pm 02:06 PM

在 SQL 表中添加列需要執行以下步驟:打開 SQL 環境並選擇數據庫。選擇要修改的表,並使用 "ADD COLUMN" 子句添加一列,其中包括列名、數據類型和是否允許空值。執行 "ALTER TABLE" 語句以完成添加。

See all articles