Google DeepMind は Nature を再びリリースし、AI の Alpha シリーズが復活し、数学のレベルは飛躍的に向上しました。
#AlphaZero は当時「人知れず囲碁を極める」というゲームを学んだような気がします。 AlphaGeometry は、IMO の難易度の高い幾何定理の証明問題 30 問中 25 問正解しましたが、人間の平均的な金メダルプレイヤーは 25.9 問正解しました。さらに、以前の SOTA 法 (1978 年の呉文君法) では 10 問しか正解できませんでした。 IMO 金メダリストAlphaGeometry、IMO 金メダル選手の幾何学的レベルに達するために人間によるデモンストレーションは必要ありません。
陈伊婷 (Evan Chen) は、AI によって生成された回答を評価する責任を負い、次のようにコメントしました。
##AlphaGeometry の出力は、信頼性が高く、クリーンであり、印象的です。これまでの AI ソリューションは当たり外れが多く、結果として手動でのレビューが必要になる場合もありました。AlphaGeometry のソリューションは、マシンによって検証でき、人間によって理解できる検証可能な構造を備えています。学生と同じように、角度や類似の三角形などの古典的な幾何学ルールを使用します。
優れた結果に加えて、この研究には業界の注目を集めている 3 つの重要なポイントがあります。
#チームは、AlphaGeometry が高度な推論能力を実現し、新しい知識を発見するための潜在的なフレームワークを提供すると信じています。
これは、AGI 構築の重要なステップと見なされている、人工知能における定理証明を進めるのに役立つ可能性があります。さらに、著者のチームとのコミュニケーションプロセス中に、Qubits は、AlphaGo チャレンジと同様に、AlphaGeometry が本当に IMO 競技会に参加することを許可されるかどうかを尋ねました。人間の囲碁チャンピオンのように。
彼らは、システムの機能を向上させるために熱心に取り組んでおり、AI が幾何学を超えた幅広い数学的問題を解決できるようにする必要があると述べました。
AI は幾何学も補助線を引くことを証明しました
幾何学を学習している人間は、紙とペンを使って画像に関する既存の知識を利用して、新しくより複雑な幾何学的特性と関係を発見できます。
Google チームは、この目的のために 10 億のランダムな幾何学的オブジェクト グラフと、それらの点と線の間のすべての関係を生成し、最終的に 1 億の固有の定理とさまざまな困難の証明を選別しました。これらのデータを最初からトレーニングします。
システムは、複雑な幾何学的証明を見つけるために相互に連携する 2 つのモジュールで構成されています。
筆頭著者 Trieu Trinh は、AlphaGeometry の演算プロセスは人間の脳が速いタイプと遅いタイプに分けられるのと似ていると紹介しました。
これは、ノーベル賞受賞者ダニエル・カーネマンのベストセラー本「Thinking Fast and Slow」で広められた「システム 1、システム 2」の概念です。
システム 1 は迅速で直感的なアイデアを提供し、システム 2 はより思慮深く合理的な決定を提供します。
一方で、言語モデルはデータ内のパターンと関係を識別するのが得意で、潜在的に有用な補助構造を迅速に予測できますが、多くの場合、その決定を厳密に推論したり説明したりする能力が欠けています。
一方、記号推論エンジンは形式論理に基づいており、明示的なルールを使用して結論を導き出します。これらは合理的で説明可能ですが、特に大規模で複雑な問題を単独で処理する場合、時間がかかり、柔軟性に欠けます。
たとえば、IMO 2015 のコンテストの問題を解く場合、青い部分は AlphaGeometry の言語モデルによって追加された補助構造、緑色の部分は最終証明の簡易バージョンで、合計 109 のステップがあります。
この問題を解決する過程で、AlphaGeometry は 2004 年の IMO コンテストの問題で未使用の前提条件も発見し、定理のより広範なバージョンを発見しました。
O が BC の中点であるという条件なしで、P、B、および C が同一線上にあることを証明できます。
さらに、この研究では、人間のスコアが最も低い 3 つの問題についても、AlphaGeometry では非常に長い証明プロセスと多くの追加が必要であることも判明しました。解決する補助構造の。
しかし、比較的簡単な問題では、人間の平均スコアと AI によって生成された証明の長さとの間に有意な相関はありませんでした (p = −0.06)。
AlphaGeometry と AlphaGo の関係と違いについて、チームとのコミュニケーションの過程で、Google の科学者が Quoc Le はじめに:
これらはすべて非常に複雑な意思決定空間で検索しますが、AlphaGo の方法はより伝統的です(注: ニューラル ネットワークはパターン認識を担当します), AlphaGeometry のニューラル ネットワークは、次にとるべきアクションを提案し、決定空間内で正しい方向に進むように検索アルゴリズムを誘導する責任があります。
この結果は Alpha シリーズにちなんで名付けられており、最初のユニットも Google DeepMind ですが、著者は実際には元 Google Brain メンバーです。
Quoc Le マスターについては説明の必要はありません。筆頭著者の Trieu Trinh 氏と責任著者の Thang Luong 氏は、どちらも Google で 6 ~ 7 年間働いています。Thang Luong 氏自身も高校時代は IMO プレーヤーでした。
二人の中国人作家のうち、何何さんはニューヨーク大学の助教授です。 Wu Yuhuai 氏は以前、Google の大規模数学モデル Minerva の研究に参加していましたが、現在は Google を辞めてマスク氏のチームに加わり、xAI の共同創設者の 1 人になっています。
論文アドレス: https://www.nature.com/articles/s41586-023-06747-5。
参考リンク:
[1]https://www.nature.com/articles/d4186-024-00141 -5.
[2]https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry。
以上がGoogle Mathematical AI が Nature に記事を掲載: ウー・ウェンジュンの 1978 年の法則定理を超え、世界クラスの幾何学的レベルを実証の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。