


AI4Science の基礎: 幾何学グラフ ニューラル ネットワーク、最も包括的なレビューがここにあります。中国人民大学ヒルハウスはテンセントAIラボ、清華大学、スタンフォード大学などと共同でリリースした。
編集者 | XS
Nature は、タンパク質合成技術 Chroma と結晶材料設計手法 GNoME という 2 つの重要な研究結果を 2023 年 11 月に発表しました。どちらの研究でも、科学データを処理するツールとしてグラフ ニューラル ネットワークを採用しました。
実際、グラフ ニューラル ネットワーク、特に幾何学的グラフ ニューラル ネットワークは、常に科学知能 (AI for Science) 研究にとって重要なツールです。これは、科学分野における粒子、分子、タンパク質、結晶などの物理システムを特別なデータ構造、つまり幾何学グラフにモデル化できるためです。
一般的なトポロジー図とは異なり、物理システムをより適切に説明するために、幾何学図は不可欠な空間情報を追加し、平行移動、回転、反転の物理的対称性を満たす必要があります。物理システムのモデリングにおける幾何学グラフ ニューラル ネットワークの優位性を考慮して、近年さまざまな手法が登場し、論文数は増え続けています。
最近、中国人民大学とヒルハウスは、テンセント AI ラボ、清華大学、スタンフォード大学、その他の機関と協力して、レビュー論文「幾何学グラフ ニューラル ネットワークの調査: データ構造、モデル」を発表しました。およびアプリケーション"。このレビューでは、群理論や対称性などの理論的知識の簡単な紹介に基づいて、データ構造やモデルから多数の科学的応用に至るまで、関連する幾何学グラフ ニューラル ネットワークの文献を体系的にレビューします。
紙のリンク: https://arxiv.org/abs/2403.00485
GitHub リンク: https:/ /github.com/RUC-GLAD/GGNN4Science
このレビューでは、著者は 300 以上の参考文献を調査し、3 つの異なる幾何学グラフ ニューラル ネットワーク モデルを要約し、粒子指向の関連する合計 23 モデルを紹介しました。分子、タンパク質などのさまざまな科学データに基づいてさまざまなタスクに対応する手法を確立し、50 を超える関連する評価データセットが収集されています。最後に、幾何学グラフの基本モデル、大規模な言語モデルとの組み合わせなど、将来の研究の方向性を展望しています。
以下は各章の簡単な紹介です。
#幾何グラフのデータ構造
幾何グラフは、隣接行列、ノード特性、ノードの幾何情報(座標など)から構成されます。ユークリッド空間では、幾何学的図形は通常、並進、回転、鏡映の物理的対称性を示します。これらの変換を記述するには、通常、ユークリッド群、並進群、直交群、順列群などの群が使用されます。直観的には、移動、平行移動、回転、反転の 4 つの操作を特定の順序で組み合わせたものとして理解できます。 AI for Science の多くの分野にとって、幾何学グラフは、小分子、タンパク質、結晶、物理点群などを含む多くの物理システムを表現するために使用できる強力で汎用性の高い表現方法です。幾何グラフ ニューラル ネットワーク モデル
実際の問題における解決目標の対称性の要件に従って、この記事では幾何学的グラフを使用します。グラフ ニューラル ネットワーク ネットワークは、不変 (不変) モデル、等変 (等変) モデル、Transformer アーキテクチャからインスピレーションを得た Geometric Graph Transformer の 3 つのカテゴリに分類されます。球面調和の高度に制御可能なモデルについて。上記のルールに従って、この記事では、近年よく知られている幾何グラフ ニューラル ネットワーク モデルを収集し、分類します。高次の制御可能なモデルは、高次の球面調和関数とウィグナー D 行列を使用して、システムの幾何学的情報を表現します。この方法では、量子力学のクレブシュ ゴルダン係数を使用して、既約表現の次数を制御します。幾何学的メッセージパッシングプロセスを実現します。
#幾何グラフ ニューラル ネットワークは、この種の設計によって保証される対称性によって精度が大幅に向上し、生成タスクでも威力を発揮します。
次の図は、QM9、PDBBind の 3 つのデータセットに対する幾何学的グラフ ニューラル ネットワークと従来のモデルを使用した、分子特性予測、タンパク質とリガンドのドッキング、抗体設計 (生成) の 3 つのタスクの結果です。幾何学グラフ ニューラル ネットワークの利点がはっきりとわかります。
科学的応用
科学的応用に関しては、このレビューでは物理学 (粒子)、生化学 (小分子、タンパク質) を取り上げます。結晶などの他のアプリケーション シナリオと同様に、タスク定義と確保するために必要な対称性のタイプから始まり、各タスクで一般的に使用されるデータ セットとこのタイプのタスクでの古典的なモデル設計のアイデアが紹介されます。
上の表は、さまざまな分野における一般的なタスクと古典的なモデルを示しています。その中で、単一のインスタンスと複数のインスタンス (複数の参加が必要な化学反応など) に応じて、分子)、記事は別です。小分子-小分子、小分子-タンパク質、タンパク質-タンパク質の 3 つの領域が区別されます。
現場でのモデル設計と実験開発をより容易にするために、この記事では、単一インスタンスと複数インスタンスに基づいた 2 種類のタスクの共通データ セットとベンチマーク (ベンチマーク) を数え、さまざまなデータのサンプルを記録しています。タスクの量と種類。
次の表は、一般的な単一インスタンス タスクのデータ セットをまとめたものです。
将来の見通し
この記事では、出発点として役立つことを期待して、いくつかの側面について予備的な見通しを示します。 1. 幾何グラフ基本モデルさまざまなタスクや分野で統一された基本モデルを使用する利点は、GPT シリーズ モデルの大幅な進歩に反映されています。このアイデアを幾何学グラフ ニューラル ネットワークの設計に導入するために、タスク空間、データ空間、モデル空間で合理的な設計をどのように実行するかは、依然として興味深い未解決の問題です。
2. モデルのトレーニングと実際の実験検証の効率的なサイクル科学データの取得には費用と時間がかかり、評価は独立したデータセットでのみ行われます。現実世界からのフィードバックを直接反映することはできません。 GNoME (グラフ ネットワークのトレーニング、密度汎関数理論の計算、材料の発見と合成のための自動ラボを含むエンドツーエンドのパイプラインを統合する) と同様の、効率的なモデルと現実の反復実験パラダイムを実現する方法の重要性は、今後ますます高まっていくでしょう。日。
3. 大規模言語モデル (LLM) との統合大規模言語モデル (LLM) には、さまざまな分野をカバーする豊富な知識があることが広く証明されています。分子特性の予測や薬剤設計などの特定のタスクに LLM を利用する研究はいくつかありますが、それらはプリミティブまたは分子グラフ上でのみ機能します。これらを幾何学グラフ ニューラル ネットワークと有機的に組み合わせて、3D 構造情報を処理し、3D 構造の予測や生成を実行できるようにする方法は、依然として非常に困難です。
4. 等分散制約の緩和データ効率とモデルの汎化能力を高めるために等分散が重要であることは間違いありませんが、強すぎることに注意する価値があります。等分散制約はモデルに対して制限が強すぎる場合があり、パフォーマンスに悪影響を与える可能性があります。したがって、設計されたモデルの等分散性と適応性のバランスをどのように取るかは非常に興味深い問題です。この分野の探求は、モデルの動作についての理解を深めるだけでなく、より幅広い適用性を備えた、より堅牢で一般的なソリューションの開発への道を開くことにもなります。
参考文献[1] Schütt K、Kindermans P J、Sauceda Felix H E、他 Schnet: 量子相互作用をモデル化するための連続フィルター畳み込みニューラル ネットワーク[ J ]. 神経情報処理システムの進歩、2017、30.
[2] Satorras V G、Hoogeboom E、Welling M. E (n) 等変グラフ ニューラル ネットワーク[C]//機械学習に関する国際会議。 PMLR、2021: 9323-9332.
[3] Thomas N、Smidt T、Kearnes S、他。テンソル フィールド ネットワーク: 3 次元点群の回転および平行移動等価ニューラル ネットワーク[J]。 arXiv プレプリント arXiv:1802.08219、2018.
[4] Gaseiger J、Groß J、Günnemann S. 分子グラフのための方向性メッセージ パッシング[C]//学習表現に関する国際会議。 2019.
[5] Gaseiger J、Becker F、Günnemann S. Gemnet: 分子のユニバーサル方向グラフ ニューラル ネットワーク[J]。 Advances in Neural Information Processing Systems、2021、34: 6790-6802.
[6] Merchant A、Batzner S、Schoenholz S S、他。材料発見のための深層学習のスケーリング[J]。自然、2023、624(7990): 80-85.
以上がAI4Science の基礎: 幾何学グラフ ニューラル ネットワーク、最も包括的なレビューがここにあります。中国人民大学ヒルハウスはテンセントAIラボ、清華大学、スタンフォード大学などと共同でリリースした。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









現代の製造において、正確な欠陥検出は製品の品質を確保するための鍵であるだけでなく、生産効率を向上させるための核心でもあります。ただし、既存の欠陥検出データセットには、実際のアプリケーションに必要な精度や意味論的な豊富さが欠けていることが多く、その結果、モデルが特定の欠陥カテゴリや位置を識別できなくなります。この問題を解決するために、広州香港科技大学と Simou Technology で構成されるトップの研究チームは、産業欠陥に関する詳細かつ意味的に豊富な大規模なアノテーションを提供する「DefectSpectrum」データセットを革新的に開発しました。表 1 に示すように、他の産業データ セットと比較して、「DefectSpectrum」データ セットは最も多くの欠陥注釈 (5438 個の欠陥サンプル) と最も詳細な欠陥分類 (125 個の欠陥カテゴリ) を提供します。

オープンな LLM コミュニティは百花繚乱の時代です Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1 などがご覧いただけます。優秀なパフォーマーモデル。しかし、GPT-4-Turboに代表される独自の大型モデルと比較すると、オープンモデルには依然として多くの分野で大きなギャップがあります。一般的なモデルに加えて、プログラミングと数学用の DeepSeek-Coder-V2 や視覚言語タスク用の InternVL など、主要な領域に特化したいくつかのオープン モデルが開発されています。

AI にとって、数学オリンピックはもはや問題ではありません。木曜日、Google DeepMind の人工知能は、AI を使用して今年の国際数学オリンピック IMO の本当の問題を解決するという偉業を達成し、金メダル獲得まであと一歩のところまで迫りました。先週終了したばかりの IMO コンテストでは、代数、組合せ論、幾何学、数論を含む 6 つの問題が出題されました。 Googleが提案したハイブリッドAIシステムは4問正解で28点を獲得し、銀メダルレベルに達した。今月初め、UCLA 終身教授のテレンス・タオ氏が、100 万ドルの賞金をかけて AI 数学オリンピック (AIMO Progress Award) を宣伝したばかりだったが、予想外なことに、AI の問題解決のレベルは 7 月以前にこのレベルまで向上していた。 IMO に関する質問を同時に行うのが最も難しいのは、最も歴史が長く、規模が最も大きく、最も否定的な IMO です。

編集者 |KX 今日に至るまで、単純な金属から大きな膜タンパク質に至るまで、結晶学によって決定される構造の詳細と精度は、他のどの方法にも匹敵しません。しかし、最大の課題、いわゆる位相問題は、実験的に決定された振幅から位相情報を取得することのままです。デンマークのコペンハーゲン大学の研究者らは、結晶相の問題を解決するための PhAI と呼ばれる深層学習手法を開発しました。数百万の人工結晶構造とそれに対応する合成回折データを使用して訓練された深層学習ニューラル ネットワークは、正確な電子密度マップを生成できます。この研究では、この深層学習ベースの非経験的構造解法は、従来の非経験的計算法とは異なり、わずか 2 オングストロームの解像度で位相問題を解決できることが示されています。これは、原子解像度で利用可能なデータのわずか 10% ~ 20% に相当します。

編集者 | ScienceAI 限られた臨床データに基づいて、何百もの医療アルゴリズムが承認されています。科学者たちは、誰がツールをテストすべきか、そしてどのようにテストするのが最善かについて議論しています。デビン シン氏は、救急治療室で小児患者が治療を長時間待っている間に心停止に陥るのを目撃し、待ち時間を短縮するための AI の応用を模索するようになりました。 SickKids 緊急治療室からのトリアージ データを使用して、Singh 氏らは潜在的な診断を提供し、検査を推奨する一連の AI モデルを構築しました。ある研究では、これらのモデルにより医師の診察が 22.3% 短縮され、医療検査が必要な患者 1 人あたりの結果の処理が 3 時間近く高速化できることが示されました。ただし、研究における人工知能アルゴリズムの成功は、これを証明するだけです。

コンピレーション|Xingxuan によって制作|51CTO テクノロジー スタック (WeChat ID: blog51cto) 過去 2 年間、私は従来のシステムよりも大規模言語モデル (LLM) を使用した生成 AI プロジェクトに多く関与してきました。サーバーレス クラウド コンピューティングが恋しくなってきました。そのアプリケーションは、会話型 AI の強化から、さまざまな業界向けの複雑な分析ソリューションやその他の多くの機能の提供まで多岐にわたります。多くの企業は、パブリック クラウド プロバイダーが既製のエコシステムをすでに提供しており、それが最も抵抗の少ない方法であるため、これらのモデルをクラウド プラットフォームにデプロイしています。ただし、安くはありません。クラウドは、スケーラビリティ、効率、高度なコンピューティング機能 (オンデマンドで利用可能な GPU) などの他の利点も提供します。パブリック クラウド プラットフォームでの LLM の展開については、あまり知られていない側面がいくつかあります

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

2023 年には、AI のほぼすべての分野が前例のない速度で進化しています。同時に、AI は身体化されたインテリジェンスや自動運転などの主要な分野の技術的限界を押し広げています。マルチモーダルの流れのもと、AI大型モデルの主流アーキテクチャとしてのTransformerの状況は揺るがされるだろうか? MoE (専門家混合) アーキテクチャに基づく大規模モデルの検討が業界の新しいトレンドになっているのはなぜですか?ラージ ビジョン モデル (LVM) は、一般的な視覚における新たなブレークスルーとなる可能性がありますか? ...過去 6 か月間にリリースされたこのサイトの 2023 PRO メンバー ニュースレターから、上記の分野の技術トレンドと業界の変化を詳細に分析し、新しい分野での目標を達成するのに役立つ 10 の特別な解釈を選択しました。準備してください。この解釈は 2023 年の Week50 からのものです
