逆転の連続! DeepMind はロシアのチームから質問を受けました。ニューラル ネットワークが物理世界を理解していることをどのように証明できるでしょうか?
最近、科学界で別の論争が起きています。この物語の主人公は、2021 年 12 月にロンドンにある DeepMind の研究センターによって出版された科学論文です。研究者らは、ニューラル ネットワークを使用してモデルをトレーニングおよび構築できることを発見しました。より正確な電子密度と相互作用マップにより、従来の関数理論の系統誤差を効果的に解決できます。
#論文リンク: https://www.science.org/doi/epdf/10.1126/science.abj6511
この記事で提案されている DM21 モデルは、水素鎖、荷電した DNA 塩基対、二値遷移状態などの複雑なシステムを正確にシミュレートします。量子化学の分野においては、普遍的な機能を正確に解明する実現可能な技術的道を開いたと言える。
DeepMind の研究者は、ピアによる再現を容易にするために DM21 モデルのコードもリリースしました。
#ウェアハウス リンク: https://github.com/deepmind/deepmind-research
論理的に言えば、論文とコードは公開され、トップジャーナルに掲載されており、実験結果と研究結果は基本的に信頼できます。 しかし、8 か月後、ロシアと韓国の 8 人の研究者もサイエンス誌に科学的レビューを発表しました。彼らは、ディープマインドの当初の研究には問題があると考えていました。また、テスト セットには重複する部分
が含まれる可能性があり、その結果、実験結果が不正確になる可能性があります。
# 論文リンク: https://www.science.org/doi/epdf/10.1126/science.abq3385
もし疑惑が本当なら、化学業界における主要な技術的進歩として知られるDeepMindの論文は、
データ漏洩#に起因する可能性があります。ニューラル ネットワーク ## で行われた改善に対して。しかし、DeepMind はすぐに反応し、コメントが公開されたのと同じ日にすぐに返信を書き、反対と強い非難を表明しました。論文の主な結論や DM21 の全体的な品質の評価とは無関係です。
#論文リンク: https://www.science.org/doi/epdf/10.1126/science.abq4282
有名な物理学者ファインマンはかつてこう言いました、科学者は自分たちが間違っていることをできるだけ早く証明しなければなりません。そうすることによってのみ進歩することができます。
この議論の結果はまだ最終決定されておらず、ロシアのチームはこれ以上の反論記事を発表していませんが、この事件は科学分野の研究にさらに深刻な影響を与える可能性があります。人工知能 : つまり、トレーニングしたニューラル ネットワーク モデルが、単にパターンを記憶しているのではなく、本当にタスクを理解していることをどのように証明するのでしょうか? 研究の質問
化学は 21 世紀の中心科学である (確信されている)。クリーンな電気の生成など、特定の特性を持つ新材料の設計などまたは高温超伝導体の開発にはすべて、コンピューター上での電子のシミュレーションが必要です。
電子は、原子がどのように結合して分子を形成するかを制御する素粒子です。また、固体内の電気の流れにも関与しています。分子内の電子の位置を理解することは、大きな助けとなります。その構造と特性、反応性の説明に向けて。1926 年に、シュレーディンガーは、波動関数の量子的挙動を正確に記述できるシュレーディンガー方程式を提案しました。しかし、すべての電子は互いに反発するため、この方程式を使用して分子内の電子を予測するだけでは不十分であり、各電子の位置の確率を追跡する必要があり、これは少数の電子であっても非常に複雑な作業です。
1960 年代に、ピエール ホーエンバーグとウォルター コーンが各電子を個別に追跡する必要がないことに気づいたとき、大きな進歩が起こりました。代わりに、各位置に電子が存在する確率 (つまり、電子密度) がわかれば、すべての相互作用を正確に計算できます。
上記の理論を証明した後、コーンはノーベル化学賞を受賞し、密度汎関数理論 (密度汎関数理論、DFT)
を創設しました。DFT はマッピングが存在することを証明したにもかかわらず、電子密度と相互作用エネルギーの間のマッピング、いわゆる密度汎関数の正確な性質は 50 年以上不明のままであり、近似的に解決する必要があります。
DFT は本質的にシュレディンガー方程式を解く方法であり、その精度は交換相関部分に依存します。 DFT にはある程度の近似が含まれますが、物質が顕微鏡レベルで特定の方法でどのように、そしてなぜ動作するかを研究する唯一の実用的な方法であるため、科学のすべての分野で最も広く使用されている技術の 1 つとなっています。
長年にわたり、研究者はさまざまな精度の 400 以上の近似関数を提案してきましたが、これらの近似関数はすべて、重要な数学の一部を捉えていないため、体系的な誤差に悩まされています。正確な機能特性。
近似関数の学習といえば、ニューラル ネットワークが行うことではないでしょうか?
この論文では、DeepMind はニューラル ネットワーク DM 21 (DeepMind 21) をトレーニングし、系統的エラーなしで汎関数を正常に学習し、非局所化エラーを回避できます。スピン対称性の破れなど、幅広い化学反応カテゴリーをより適切に説明できます。
原則として、電荷の移動を伴う化学的および物理的プロセスは非局在化エラーを起こしやすく、結合破壊を伴うプロセスはいずれも発生しやすいです。対称性が崩れた。電荷の移動と結合の切断は多くの重要な技術的応用の中心ですが、これらの問題は、水素などの最も単純な分子の官能基を記述する際に多数の定性的失敗を引き起こす可能性もあります。
モデルは多層パーセプトロン (MLP) を使用して構築され、入力は占有されたコーンのローカル画像と非ローカル画像です。 -偽 (KS) 軌道、局所特徴。
目的関数には 2 つが含まれます。1 つは交換相関エネルギー自体を学習するために使用される回帰損失で、もう 1 つは関数の微分が自己無撞着な計算で使用できることを保証するためのものです。トレーニング後のフィールド、SCF) で計算された勾配正則化項。
回帰損失について、研究者らは 2235 の反応の反応物と生成物を表す固定密度のデータセットを使用し、これらの密度から高精度の反応エネルギーにマッピングするようにネットワークをトレーニングしました。小さなメイングループ H-Kr 分子の原子化、イオン化、電子親和力、分子間結合エネルギーを表す 1161 のトレーニング反応と、H-Ar 原子の主要な FC および FS 密度を表す 1074 の反応を備えています。
トレーニング済みモデル DM21 は、大規模な主要ファミリー ベンチマークのすべての反応で自己一貫性を持って実行でき、より正確な分子密度を生成します。
本当にSOTAまたはデータ漏洩?
DeepMind が DM21 をトレーニングする場合、使用されるデータは、半分の電子を持つ水素原子などの分数電荷システムです。
DM21 の優位性を実証するために、研究者らは結合破壊ベンチマーク (BBB) セットと呼ばれる一連の伸長二量体でそれをテストしました。たとえば、遠く離れた 2 つの水素原子には、合計 1 つの電子があります。
実験結果では、DM21 関数が BBB テスト セットで優れたパフォーマンスを示し、これまでにテストされたすべての古典的な DFT 関数と DM21m (DM21 トレーニングと同じですが、トレーニングセット内の端数料金)。
その後、DeepMind は論文の中で、DM21 は分数電荷システムの背後にある物理原理を理解したと主張しました。
しかし、よく見てみると、BBB グループではすべての二量体がトレーニング グループのシステムと非常に似ていることがわかります。実際、電弱相互作用の局所的な性質により、原子の相互作用は短距離でのみ強くなり、それを超えると 2 つの原子は本質的に相互作用していないかのように動作します。
ロシア科学アカデミーのゼリンスキー有機化学研究所の研究グループリーダー、マイケル・メドベージェフ氏は、ニューラルネットワークはある意味で似ていると説明する。人間も同様に、間違った理由で正しい答えを得ることを好みます。したがって、ニューラル ネットワークをトレーニングするのは難しくありませんが、単に正しい答えを記憶しているのではなく、物理法則を学習していることを証明するのは困難です。
したがって、BBB テスト セットは適切なテスト セットではありません。これは、DM21 の分数電子システムの理解や、DM21 によるそのようなシステムの取り扱いに関する他の 4 つの証拠の徹底的な分析をテストするものではありません。決定的な結論も出ていません。SIE4x4 セットでの良好な精度のみが信頼できると考えられます。
ロシアの研究者らは、トレーニング セットでの分数電荷システムの使用だけが DeepMind の研究の唯一の目新しさではないとも考えています。トレーニングセットを通じてニューラルネットワークに物理的制約を導入するという彼らのアイデアと、正しい化学ポテンシャルのトレーニングを通じて物理的意味を与える方法は、将来ニューラルネットワークのDFT汎関数の構築に広く使用される可能性があります。
DeepMind の回答
DM21 のトレーニング セット外の分数電荷 (FC) および分数スピン (FS) 条件を予測する能力は見つからないというコメント論文の主張について。この論文は、トレーニング セットと結合破壊ベンチマーク BBB の約 50% の重複、および他の一般化例の有効性と精度に基づいて実証されました。
DeepMind はこの分析に同意せず、BBB が含まれていないため、指摘は不正確であるか、論文の主な結論および DM21 の全体的な品質の評価とは無関係であると考えています。論文では FC と FS の動作の例のみを示しています。
# トレーニング セットとテスト セットの重複は、機械学習において注目に値する研究課題です。記憶とは、モデルをトレーニングできることを意味します。集中サンプルをコピーすると、テスト セットでのパフォーマンスが向上します。
ゲラシモフは、BBB 上の DM21 (有限距離にある二量体を含む) のパフォーマンスは、FC および FS システムの出力 (つまり、無限の分離限界にある原子) を複製することによって達成できると考えています。二量体一致)についてはよく説明されています。
DM21 がトレーニング セットを超えて一般化することを実証するために、DeepMind の研究者は、H2 (陽イオン性二量体) と H2 (中性二量体) も考慮しました。プロトタイプの BBB の例では、集合体の値など)、正確な交換相関関数は非局所的であると結論付けることができます。一定の記憶値を返すと、距離が増加するにつれて BBB 予測に重大な誤差が生じる可能性があります。
以上が逆転の連続! DeepMind はロシアのチームから質問を受けました。ニューラル ネットワークが物理世界を理解していることをどのように証明できるでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









このサイトは6月27日、JianyingはByteDanceの子会社であるFaceMeng Technologyによって開発されたビデオ編集ソフトウェアであり、Douyinプラットフォームに依存しており、基本的にプラットフォームのユーザー向けに短いビデオコンテンツを作成すると報告しました。 Windows、MacOS、その他のオペレーティング システム。 Jianyingは会員システムのアップグレードを正式に発表し、インテリジェント翻訳、インテリジェントハイライト、インテリジェントパッケージング、デジタルヒューマン合成などのさまざまなAIブラックテクノロジーを含む新しいSVIPを開始しました。価格的には、クリッピングSVIPの月額料金は79元、年会費は599元(当サイト注:月額49.9元に相当)、継続月額サブスクリプションは月額59元、継続年間サブスクリプションは、年間499元(月額41.6元に相当)です。さらに、カット担当者は、ユーザーエクスペリエンスを向上させるために、オリジナルのVIPに登録している人は、

検索強化生成およびセマンティック メモリを AI コーディング アシスタントに組み込むことで、開発者の生産性、効率、精度を向上させます。 JanakiramMSV 著者の EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG から翻訳。基本的な AI プログラミング アシスタントは当然役に立ちますが、ソフトウェア言語とソフトウェア作成の最も一般的なパターンに関する一般的な理解に依存しているため、最も適切で正しいコードの提案を提供できないことがよくあります。これらのコーディング アシスタントによって生成されたコードは、彼らが解決する責任を負っている問題の解決には適していますが、多くの場合、個々のチームのコーディング標準、規約、スタイルには準拠していません。これにより、コードがアプリケーションに受け入れられるように修正または調整する必要がある提案が得られることがよくあります。

でももしかしたら公園の老人には勝てないかもしれない?パリオリンピックの真っ最中で、卓球が注目を集めています。同時に、ロボットは卓球のプレーにも新たな進歩をもたらしました。先ほど、DeepMind は、卓球競技において人間のアマチュア選手のレベルに到達できる初の学習ロボット エージェントを提案しました。論文のアドレス: https://arxiv.org/pdf/2408.03906 DeepMind ロボットは卓球でどれくらい優れていますか?おそらく人間のアマチュアプレーヤーと同等です: フォアハンドとバックハンドの両方: 相手はさまざまなプレースタイルを使用しますが、ロボットもそれに耐えることができます: さまざまなスピンでサーブを受ける: ただし、ゲームの激しさはそれほど激しくないようです公園の老人。ロボット、卓球用

大規模言語モデル (LLM) は巨大なテキスト データベースでトレーニングされ、そこで大量の現実世界の知識を取得します。この知識はパラメータに組み込まれており、必要なときに使用できます。これらのモデルの知識は、トレーニングの終了時に「具体化」されます。事前トレーニングの終了時に、モデルは実際に学習を停止します。モデルを調整または微調整して、この知識を活用し、ユーザーの質問により自然に応答する方法を学びます。ただし、モデルの知識だけでは不十分な場合があり、モデルは RAG を通じて外部コンテンツにアクセスできますが、微調整を通じてモデルを新しいドメインに適応させることが有益であると考えられます。この微調整は、ヒューマン アノテーターまたは他の LLM 作成物からの入力を使用して実行され、モデルは追加の実世界の知識に遭遇し、それを統合します。

AIGC について詳しくは、51CTOAI.x コミュニティ https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou を参照してください。これらの質問は、インターネット上のどこでも見られる従来の質問バンクとは異なります。既成概念にとらわれずに考える必要があります。大規模言語モデル (LLM) は、データ サイエンス、生成人工知能 (GenAI)、および人工知能の分野でますます重要になっています。これらの複雑なアルゴリズムは人間のスキルを向上させ、多くの業界で効率とイノベーションを推進し、企業が競争力を維持するための鍵となります。 LLM は、自然言語処理、テキスト生成、音声認識、推奨システムなどの分野で幅広い用途に使用できます。 LLM は大量のデータから学習することでテキストを生成できます。

機械学習は人工知能の重要な分野であり、明示的にプログラムしなくてもコンピューターにデータから学習して能力を向上させる機能を提供します。機械学習は、画像認識や自然言語処理から、レコメンデーションシステムや不正行為検出に至るまで、さまざまな分野で幅広く応用されており、私たちの生活様式を変えつつあります。機械学習の分野にはさまざまな手法や理論があり、その中で最も影響力のある 5 つの手法は「機械学習の 5 つの流派」と呼ばれています。 5 つの主要な学派は、象徴学派、コネクショニスト学派、進化学派、ベイジアン学派、およびアナロジー学派です。 1. 象徴主義は、象徴主義とも呼ばれ、論理的推論と知識の表現のためのシンボルの使用を強調します。この学派は、学習は既存の既存の要素を介した逆演繹のプロセスであると信じています。

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

エディター | Radish Skin 2021 年の強力な AlphaFold2 のリリース以来、科学者はタンパク質構造予測モデルを使用して、細胞内のさまざまなタンパク質構造をマッピングし、薬剤を発見し、既知のあらゆるタンパク質相互作用の「宇宙地図」を描いてきました。ちょうど今、Google DeepMind が AlphaFold3 モデルをリリースしました。このモデルは、タンパク質、核酸、小分子、イオン、修飾残基を含む複合体の結合構造予測を実行できます。 AlphaFold3 の精度は、これまでの多くの専用ツール (タンパク質-リガンド相互作用、タンパク質-核酸相互作用、抗体-抗原予測) と比較して大幅に向上しました。これは、単一の統合された深層学習フレームワーク内で、次のことを達成できることを示しています。
