最近、科学界で別の論争が起きています。この物語の主人公は、2021 年 12 月にロンドンにある DeepMind の研究センターによって出版された科学論文です。研究者らは、ニューラル ネットワークを使用してモデルをトレーニングおよび構築できることを発見しました。より正確な電子密度と相互作用マップにより、従来の関数理論の系統誤差を効果的に解決できます。
#論文リンク: https://www.science.org/doi/epdf/10.1126/science.abj6511
この記事で提案されている DM21 モデルは、水素鎖、荷電した DNA 塩基対、二値遷移状態などの複雑なシステムを正確にシミュレートします。量子化学の分野においては、普遍的な機能を正確に解明する実現可能な技術的道を開いたと言える。
DeepMind の研究者は、ピアによる再現を容易にするために DM21 モデルのコードもリリースしました。
#ウェアハウス リンク: https://github.com/deepmind/deepmind-research
論理的に言えば、論文とコードは公開され、トップジャーナルに掲載されており、実験結果と研究結果は基本的に信頼できます。 しかし、8 か月後、ロシアと韓国の 8 人の研究者もサイエンス誌に科学的レビューを発表しました。彼らは、ディープマインドの当初の研究には問題があると考えていました。また、テスト セットには重複する部分
が含まれる可能性があり、その結果、実験結果が不正確になる可能性があります。
# 論文リンク: https://www.science.org/doi/epdf/10.1126/science.abq3385
もし疑惑が本当なら、化学業界における主要な技術的進歩として知られるDeepMindの論文は、
データ漏洩#に起因する可能性があります。ニューラル ネットワーク ## で行われた改善に対して。しかし、DeepMind はすぐに反応し、コメントが公開されたのと同じ日にすぐに返信を書き、反対と強い非難を表明しました。論文の主な結論や DM21 の全体的な品質の評価とは無関係です。
#論文リンク: https://www.science.org/doi/epdf/10.1126/science.abq4282
有名な物理学者ファインマンはかつてこう言いました、科学者は自分たちが間違っていることをできるだけ早く証明しなければなりません。そうすることによってのみ進歩することができます。
この議論の結果はまだ最終決定されておらず、ロシアのチームはこれ以上の反論記事を発表していませんが、この事件は科学分野の研究にさらに深刻な影響を与える可能性があります。人工知能 : つまり、トレーニングしたニューラル ネットワーク モデルが、単にパターンを記憶しているのではなく、本当にタスクを理解していることをどのように証明するのでしょうか? 研究の質問
化学は 21 世紀の中心科学である (確信されている)。クリーンな電気の生成など、特定の特性を持つ新材料の設計などまたは高温超伝導体の開発にはすべて、コンピューター上での電子のシミュレーションが必要です。
電子は、原子がどのように結合して分子を形成するかを制御する素粒子です。また、固体内の電気の流れにも関与しています。分子内の電子の位置を理解することは、大きな助けとなります。その構造と特性、反応性の説明に向けて。1926 年に、シュレーディンガーは、波動関数の量子的挙動を正確に記述できるシュレーディンガー方程式を提案しました。しかし、すべての電子は互いに反発するため、この方程式を使用して分子内の電子を予測するだけでは不十分であり、各電子の位置の確率を追跡する必要があり、これは少数の電子であっても非常に複雑な作業です。
1960 年代に、ピエール ホーエンバーグとウォルター コーンが各電子を個別に追跡する必要がないことに気づいたとき、大きな進歩が起こりました。代わりに、各位置に電子が存在する確率 (つまり、電子密度) がわかれば、すべての相互作用を正確に計算できます。
上記の理論を証明した後、コーンはノーベル化学賞を受賞し、密度汎関数理論 (密度汎関数理論、DFT)
を創設しました。DFT はマッピングが存在することを証明したにもかかわらず、電子密度と相互作用エネルギーの間のマッピング、いわゆる密度汎関数の正確な性質は 50 年以上不明のままであり、近似的に解決する必要があります。
DFT は本質的にシュレディンガー方程式を解く方法であり、その精度は交換相関部分に依存します。 DFT にはある程度の近似が含まれますが、物質が顕微鏡レベルで特定の方法でどのように、そしてなぜ動作するかを研究する唯一の実用的な方法であるため、科学のすべての分野で最も広く使用されている技術の 1 つとなっています。
長年にわたり、研究者はさまざまな精度の 400 以上の近似関数を提案してきましたが、これらの近似関数はすべて、重要な数学の一部を捉えていないため、体系的な誤差に悩まされています。正確な機能特性。
近似関数の学習といえば、ニューラル ネットワークが行うことではないでしょうか?
この論文では、DeepMind はニューラル ネットワーク DM 21 (DeepMind 21) をトレーニングし、系統的エラーなしで汎関数を正常に学習し、非局所化エラーを回避できます。スピン対称性の破れなど、幅広い化学反応カテゴリーをより適切に説明できます。
原則として、電荷の移動を伴う化学的および物理的プロセスは非局在化エラーを起こしやすく、結合破壊を伴うプロセスはいずれも発生しやすいです。対称性が崩れた。電荷の移動と結合の切断は多くの重要な技術的応用の中心ですが、これらの問題は、水素などの最も単純な分子の官能基を記述する際に多数の定性的失敗を引き起こす可能性もあります。
モデルは多層パーセプトロン (MLP) を使用して構築され、入力は占有されたコーンのローカル画像と非ローカル画像です。 -偽 (KS) 軌道、局所特徴。
目的関数には 2 つが含まれます。1 つは交換相関エネルギー自体を学習するために使用される回帰損失で、もう 1 つは関数の微分が自己無撞着な計算で使用できることを保証するためのものです。トレーニング後のフィールド、SCF) で計算された勾配正則化項。
回帰損失について、研究者らは 2235 の反応の反応物と生成物を表す固定密度のデータセットを使用し、これらの密度から高精度の反応エネルギーにマッピングするようにネットワークをトレーニングしました。小さなメイングループ H-Kr 分子の原子化、イオン化、電子親和力、分子間結合エネルギーを表す 1161 のトレーニング反応と、H-Ar 原子の主要な FC および FS 密度を表す 1074 の反応を備えています。
トレーニング済みモデル DM21 は、大規模な主要ファミリー ベンチマークのすべての反応で自己一貫性を持って実行でき、より正確な分子密度を生成します。
DeepMind が DM21 をトレーニングする場合、使用されるデータは、半分の電子を持つ水素原子などの分数電荷システムです。
DM21 の優位性を実証するために、研究者らは結合破壊ベンチマーク (BBB) セットと呼ばれる一連の伸長二量体でそれをテストしました。たとえば、遠く離れた 2 つの水素原子には、合計 1 つの電子があります。
実験結果では、DM21 関数が BBB テスト セットで優れたパフォーマンスを示し、これまでにテストされたすべての古典的な DFT 関数と DM21m (DM21 トレーニングと同じですが、トレーニングセット内の端数料金)。
その後、DeepMind は論文の中で、DM21 は分数電荷システムの背後にある物理原理を理解したと主張しました。
しかし、よく見てみると、BBB グループではすべての二量体がトレーニング グループのシステムと非常に似ていることがわかります。実際、電弱相互作用の局所的な性質により、原子の相互作用は短距離でのみ強くなり、それを超えると 2 つの原子は本質的に相互作用していないかのように動作します。
ロシア科学アカデミーのゼリンスキー有機化学研究所の研究グループリーダー、マイケル・メドベージェフ氏は、ニューラルネットワークはある意味で似ていると説明する。人間も同様に、間違った理由で正しい答えを得ることを好みます。したがって、ニューラル ネットワークをトレーニングするのは難しくありませんが、単に正しい答えを記憶しているのではなく、物理法則を学習していることを証明するのは困難です。
したがって、BBB テスト セットは適切なテスト セットではありません。これは、DM21 の分数電子システムの理解や、DM21 によるそのようなシステムの取り扱いに関する他の 4 つの証拠の徹底的な分析をテストするものではありません。決定的な結論も出ていません。SIE4x4 セットでの良好な精度のみが信頼できると考えられます。
ロシアの研究者らは、トレーニング セットでの分数電荷システムの使用だけが DeepMind の研究の唯一の目新しさではないとも考えています。トレーニングセットを通じてニューラルネットワークに物理的制約を導入するという彼らのアイデアと、正しい化学ポテンシャルのトレーニングを通じて物理的意味を与える方法は、将来ニューラルネットワークのDFT汎関数の構築に広く使用される可能性があります。
DM21 のトレーニング セット外の分数電荷 (FC) および分数スピン (FS) 条件を予測する能力は見つからないというコメント論文の主張について。この論文は、トレーニング セットと結合破壊ベンチマーク BBB の約 50% の重複、および他の一般化例の有効性と精度に基づいて実証されました。
DeepMind はこの分析に同意せず、BBB が含まれていないため、指摘は不正確であるか、論文の主な結論および DM21 の全体的な品質の評価とは無関係であると考えています。論文では FC と FS の動作の例のみを示しています。
# トレーニング セットとテスト セットの重複は、機械学習において注目に値する研究課題です。記憶とは、モデルをトレーニングできることを意味します。集中サンプルをコピーすると、テスト セットでのパフォーマンスが向上します。
ゲラシモフは、BBB 上の DM21 (有限距離にある二量体を含む) のパフォーマンスは、FC および FS システムの出力 (つまり、無限の分離限界にある原子) を複製することによって達成できると考えています。二量体一致)についてはよく説明されています。
DM21 がトレーニング セットを超えて一般化することを実証するために、DeepMind の研究者は、H2 (陽イオン性二量体) と H2 (中性二量体) も考慮しました。プロトタイプの BBB の例では、集合体の値など)、正確な交換相関関数は非局所的であると結論付けることができます。一定の記憶値を返すと、距離が増加するにつれて BBB 予測に重大な誤差が生じる可能性があります。
以上が逆転の連続! DeepMind はロシアのチームから質問を受けました。ニューラル ネットワークが物理世界を理解していることをどのように証明できるでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。