GoogleDeepMind再發Nature,Alpha系列AI重磅回歸,數學水準突飛猛進。
AlphaGeometry,無需人類示範達到IMO金牌選手的幾何等級。
有當年AlphaZero無需人類知識學圍棋《Mastering the game of Go without human knowledge》的感覺了。
AlphaGeometry在30道IMO難度的幾何定理證明題中做對了25道,而人類金牌選手平均做對了25.9道。此外,之前SOTA方法(1978年的吳文俊法)僅能做對10道。
IMO金牌得主陳誼廷(Evan Chen)負責評估AI生成的答案,他評價到:
AlphaGeometry的輸出令人印象深刻,既可靠又乾淨。過去的人工智慧解決方案存在偶然性,導致輸出有時需要手動檢查。
AlphaGeometry的解決方案具有可驗證的結構,既可以由機器驗證,也可以由人類理解。它使用經典幾何規則,如角度和相似三角形,就像學生一樣。
除成績亮眼之外,這項研究中還有三個重點引起業界關注:
團隊認為,AlphaGeometry提供了一個實現高階推理能力、發現新知識的潛在架構。
這可能有助於推動人工智慧的定理證明——被視為建構AGI的關鍵一步。
另外,量子位元在與作者團隊交流過程中,打聽到了是否真的會讓AlphaGeometry去參加一屆IMO競賽,就像當年AlphaGo挑戰人類圍棋冠軍一樣。
他們表示正在努力提升系統的能力,還需要讓AI能解決幾何以外更廣泛的數學問題。
先前AI系統無法很好解決幾何問題,卡就卡在缺乏優質訓練資料。
人類學習幾何可以藉助紙和筆,在圖像上使用現有知識來發現新的、更複雜的幾何屬性和關係。
Google團隊為此用產生了10億個隨機幾何物件圖,以及其中點和線間的所有關係,最終篩選出1億不同難度的獨特定理和證明,AlphaGeometry在這些資料上完全從頭訓練。
系統由兩個模組組成,相互配合尋找複雜的幾何證明。
一作Trieu Trinh介紹,AlphaGeometry的運作過程類似人腦分為快與慢兩種類型。
也就是諾貝爾經濟學獎得主丹尼爾‧卡尼曼的暢銷書《思考快與慢》中普及的「系統1、系統2」概念。
系統1提供快速、直覺的想法,系統2提供更深思熟慮、理性的決策。
一方面,語言模型擅長識別資料中的模式和關係,可以快速預測潛在有用的輔助結構,但通常缺乏嚴格推理或解釋其決策的能力。
另一方面,符號推理引擎基於形式邏輯並使用明確的規則來得出結論。它們是理性且可解釋的,但它們緩慢且不靈活,尤其是在獨自處理大型、複雜的問題時。
例如在解決一個IMO 2015年的競賽題時,藍色部分為AlphaGeometry的語言模型添加的輔助結構,綠色部分是最終證明的精簡版,共有109個步驟。
在做題過程中,AlphaGeometry也發現了2004年IMO競賽題中一個未使用的前提條件,並因此發現了更廣義的定理版本。
不需要O是BC的中點這個條件,就能證明P、B、C共線。
另外研究也發現,對於人類得分最低的3個問題,AlphaGeometry也需要非常長的證明過程和增加非常多的輔助結構才能解決。
但在相對簡單的問題上,人類平均分數和AI產生的證明長度之間沒有顯著相關性 (p = −0.06)。
對於AlphaGeometry與AlphaGo的聯繫和區別,在與團隊交流過程中,Google科學家Quoc Le 介紹到:
他們都是在一個非常複雜的決策空間中搜索,但AlphaGo的方法更傳統(註:神經網路負責模式識別),AlphaGeometry中的神經網路負責建議下一步要採取的行動,指導搜尋演算法在決策空間中向正確的方向移動。
雖然這次成果隨Alpha系列命名,第一單位也是Google DeepMind,但其實作者主要是前Google大腦成員。
Quoc Le大神不用過多介紹,一作Trieu Trinh與通訊作者Thang Luong都在谷歌工作了六七年,Thang Luong自己高中時也是IMO選手。
兩位華人作者中,何河是紐約大學助理教授。吳宇懷先前參與了Google數學大模型Minerva研究,現在已經離開谷歌加入馬斯克團隊,成為xAI的聯合創始人之一。
論文地址:https://www.nature.com/articles/s41586-023-06747-5。
參考連結:
[1]https://www.nature.com/articles/d4186-024-00141 -5。
[2]https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry。
以上是Google數學AI在Nature發表文章:證明超越1978年吳文俊法定理,展示世界級幾何水平的詳細內容。更多資訊請關注PHP中文網其他相關文章!