在奧數問題面前,AI 的「智商」往往不太夠用。不過,這已經是過去式了。 Google DeepMind 用 AI 做出了今年國際數學奧林匹克競賽 IMO 的真題,並且距離拿金牌僅一步之遙。對 AI 來說,奧數不再是問題了。 IMO 2024 中六個問題的每一個問題滿分為 7 分,總分最高為 42 分。 DeepMind 的系統最終得分為 28 分,意味著解決的 4 個問題都獲得了滿分 —— 相當於銀牌類別的最高分。
1. DeepMind 文章連結:https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/「AI 效應」是指當人工智慧技術取得進展或解決問題時,人們往往會認為這些成就並不是真正的人工智慧或不具備真正的智慧。換句話說,一旦某項技術被理解或普及,它就不再被認為是智慧的。這種現象表明,人們對 「智能」 的定義和期望會隨著技術的進步而不斷提高。
NuminaMath 模型
本月月初,陶哲軒在自己的部落格中發布 AI 數學奧林匹克競賽(AIMO 進步獎) 的初步成績已公佈的消息。其中,獲得第一名的是 Numina 的團隊。
NuminaMath 模型完全自動化且資源效率高出數個數量級,並且採用了完全不同的方法(使用大型語言模型生成 Python 程式碼,以蠻力解決區域競賽級別的數值答案問題)。這個模型也是完全開源的。
DeepMind 的數學推理研究
DeepMind 在數學推理方面也有不懈的努力。在今年年初,它的人工智慧演算法就已經在數學奧林匹克競賽(IMO)上取得了重大成績突破。論文《Solving olympiad geometry without human demonstrations》向世人介紹了 AlphaGeometry,也登上了國際權威期刊《自然》雜誌。專家表示,這是人工智慧朝著具有人類推理能力邁進的重要一步。
論文連結:https://www.nature.com/articles/s41586-023-06747-5未來 DeepMind 也會給我們怎樣的驚喜,我們拭目以待。參考連結:https://mathstodon.xyz/@tao/112850716240504978以上是陶哲軒點評GoogleAlphaProof:AI在數學競賽中展現「超凡智慧」的詳細內容。更多資訊請關注PHP中文網其他相關文章!