Google數學AI在Nature發表文章:證明超越1978年吳文俊法定理,展示世界級幾何水平
GoogleDeepMind再發Nature,Alpha系列AI重磅回歸,數學水準突飛猛進。
AlphaGeometry,無需人類示範達到IMO金牌選手的幾何等級。
有當年AlphaZero無需人類知識學圍棋《Mastering the game of Go without human knowledge》的感覺了。
AlphaGeometry在30道IMO難度的幾何定理證明題中做對了25道,而人類金牌選手平均做對了25.9道。此外,之前SOTA方法(1978年的吳文俊法)僅能做對10道。
IMO金牌得主陳誼廷(Evan Chen)負責評估AI生成的答案,他評價到:
AlphaGeometry的輸出令人印象深刻,既可靠又乾淨。過去的人工智慧解決方案存在偶然性,導致輸出有時需要手動檢查。
AlphaGeometry的解決方案具有可驗證的結構,既可以由機器驗證,也可以由人類理解。它使用經典幾何規則,如角度和相似三角形,就像學生一樣。
除成績亮眼之外,這項研究中還有三個重點引起業界關注:
- #無需人類演示,也就是只用了AI合成資料訓練,延續了AlphaZero自學圍棋的方式。
- 大模型結合其他AI方法,與AlphaGo和OpenAI Q*傳聞相似。
- 與許多先前方法不同,AlphaGeometry可以產生人類可讀的證明過程,且模型和程式碼都開源。
團隊認為,AlphaGeometry提供了一個實現高階推理能力、發現新知識的潛在架構。
這可能有助於推動人工智慧的定理證明——被視為建構AGI的關鍵一步。
另外,量子位元在與作者團隊交流過程中,打聽到了是否真的會讓AlphaGeometry去參加一屆IMO競賽,就像當年AlphaGo挑戰人類圍棋冠軍一樣。
他們表示正在努力提升系統的能力,還需要讓AI能解決幾何以外更廣泛的數學問題。
AI證明幾何也畫輔助線
先前AI系統無法很好解決幾何問題,卡就卡在缺乏優質訓練資料。
人類學習幾何可以藉助紙和筆,在圖像上使用現有知識來發現新的、更複雜的幾何屬性和關係。
Google團隊為此用產生了10億個隨機幾何物件圖,以及其中點和線間的所有關係,最終篩選出1億不同難度的獨特定理和證明,AlphaGeometry在這些資料上完全從頭訓練。
系統由兩個模組組成,相互配合尋找複雜的幾何證明。
- 語言模型,預測可用來解決問題的幾何結構(也就是新增輔助線)。
- 符號推理引擎,使用邏輯規則推導出結論。
一作Trieu Trinh介紹,AlphaGeometry的運作過程類似人腦分為快與慢兩種類型。
也就是諾貝爾經濟學獎得主丹尼爾‧卡尼曼的暢銷書《思考快與慢》中普及的「系統1、系統2」概念。
系統1提供快速、直覺的想法,系統2提供更深思熟慮、理性的決策。
一方面,語言模型擅長識別資料中的模式和關係,可以快速預測潛在有用的輔助結構,但通常缺乏嚴格推理或解釋其決策的能力。
另一方面,符號推理引擎基於形式邏輯並使用明確的規則來得出結論。它們是理性且可解釋的,但它們緩慢且不靈活,尤其是在獨自處理大型、複雜的問題時。
例如在解決一個IMO 2015年的競賽題時,藍色部分為AlphaGeometry的語言模型添加的輔助結構,綠色部分是最終證明的精簡版,共有109個步驟。
在做題過程中,AlphaGeometry也發現了2004年IMO競賽題中一個未使用的前提條件,並因此發現了更廣義的定理版本。
不需要O是BC的中點這個條件,就能證明P、B、C共線。
另外研究也發現,對於人類得分最低的3個問題,AlphaGeometry也需要非常長的證明過程和增加非常多的輔助結構才能解決。
但在相對簡單的問題上,人類平均分數和AI產生的證明長度之間沒有顯著相關性 (p = −0.06)。
One More Thing
對於AlphaGeometry與AlphaGo的聯繫和區別,在與團隊交流過程中,Google科學家Quoc Le 介紹到:
他們都是在一個非常複雜的決策空間中搜索,但AlphaGo的方法更傳統(註:神經網路負責模式識別),AlphaGeometry中的神經網路負責建議下一步要採取的行動,指導搜尋演算法在決策空間中向正確的方向移動。
雖然這次成果隨Alpha系列命名,第一單位也是Google DeepMind,但其實作者主要是前Google大腦成員。
Quoc Le大神不用過多介紹,一作Trieu Trinh與通訊作者Thang Luong都在谷歌工作了六七年,Thang Luong自己高中時也是IMO選手。
兩位華人作者中,何河是紐約大學助理教授。吳宇懷先前參與了Google數學大模型Minerva研究,現在已經離開谷歌加入馬斯克團隊,成為xAI的聯合創始人之一。
論文地址:https://www.nature.com/articles/s41586-023-06747-5。
參考連結:
[1]https://www.nature.com/articles/d4186-024-00141 -5。
[2]https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry。
以上是Google數學AI在Nature發表文章:證明超越1978年吳文俊法定理,展示世界級幾何水平的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

本文推荐十大值得关注的加密货币交易平台,涵盖币安(Binance)、OKX、Gate.io、BitFlyer、KuCoin、Bybit、Coinbase Pro、Kraken、BYDFi和XBIT去中心化交易所。这些平台在交易币种数量、交易类型、安全性、合规性、特色功能等方面各有千秋,例如币安以其全球最大的交易量和丰富的功能著称,而BitFlyer则凭借其日本金融厅牌照和高安全性吸引亚洲用户。选择合适的平台需要根据自身交易经验、风险承受能力和投资偏好进行综合考量。 希望本文能帮助您找到最适合自

本文詳細介紹了歐易OKEx賬號的註冊、使用和註銷流程。註冊需下載APP,輸入手機號或郵箱註冊,完成實名認證。使用方面涵蓋登錄、充值提現、交易以及安全設置等操作步驟。而註銷賬號則需要聯繫歐易OKEx客服,提供必要信息並等待處理,最終獲得賬號註銷確認。 通過本文,用戶可以輕鬆掌握歐易OKEx賬號的完整生命週期管理,安全便捷地進行數字資產交易。

本文提供Binance幣安註冊及安全設置的完整指南,涵蓋註冊前的準備工作(包括設備、郵箱、手機號及身份證明文件準備),詳細介紹了官網及APP兩種註冊方式,以及不同級別的身份驗證(KYC)流程。此外,文章還重點講解瞭如何設置資金密碼、開啟雙重驗證(2FA,包括谷歌身份驗證器和短信驗證)以及設置防釣魚碼等關鍵安全步驟,幫助用戶安全便捷地註冊和使用Binance幣安平台進行加密貨幣交易。 請務必在交易前了解相關法律法規及市場風險,謹慎投資。

如何優化jieba分詞以改善景區評論的關鍵詞提取?在使用jieba分詞處理景區評論數據時,如果發現分詞結果不理�...

gate.io手機app使用教程:1、安卓用戶,訪問 Gate.io 官方網站,下載安卓安裝包,您可能需要在手機設置中允許安裝來自未知來源的應用;2、ios用戶,在 App Store 中搜索 "Gate.io" 下載。

C語言數據結構:數據結構在人工智能中的關鍵作用概述在人工智能領域,數據結構對於處理大量數據至關重要。數據結構提供了一種組織和管理數據的有效方法,優化算法和提高程序的效率。常見的數據結構C語言中常用的數據結構包括:數組:一組連續存儲的數據項,具有相同的類型。結構體:將不同類型的數據組織在一起並賦予它們一個名稱的數據類型。鍊錶:一種線性數據結構,其中數據項通過指針連接在一起。堆棧:遵循後進先出(LIFO)原理的數據結構。隊列:遵循先進先出(FIFO)原理的數據結構。實戰案例:圖論中的鄰接表在人工智

虛擬貨幣“最老”排行榜如下:1. 比特幣(BTC),發行於2009年1月3日,是首個去中心化數字貨幣。 2. 萊特幣(LTC),發行於2011年10月7日,被稱為“比特幣的輕量版”。 3. 瑞波幣(XRP),發行於2011年,專為跨境支付設計。 4. 狗狗幣(DOGE),發行於2013年12月6日,基於萊特幣代碼的“迷因幣”。 5. 以太坊(ETH),發行於2015年7月30日,首個支持智能合約的平台。 6. 泰達幣(USDT),發行於2014年,是首個與美元1:1錨定的穩定幣。 7. 艾達幣(ADA),發

本文詳細介紹了歐易OKEx網頁版登錄的完整步驟,包括準備工作(確保網絡連接穩定及瀏覽器更新)、訪問官網(注意網址準確性,避免釣魚網站)、找到登錄入口(點擊官網首頁右上角的“登錄”按鈕)、輸入登錄信息(郵箱/手機號及密碼,支持驗證碼登錄)、完成安全驗證(滑動驗證、谷歌驗證或短信驗證)等五個步驟,最終成功登錄後即可進行數字資產交易等操作。 安全便捷的登錄流程,保障用戶資產安全。
