ホームページ テクノロジー周辺機器 AI 予測精度は 0.98 と高く、清華大学、深セン科技などが Transformer に基づく MOF 材料の多機能予測フレームワークを提案しました。

予測精度は 0.98 と高く、清華大学、深セン科技などが Transformer に基づく MOF 材料の多機能予測フレームワークを提案しました。

Mar 05, 2024 pm 07:28 PM
理論

予測精度は 0.98 と高く、清華大学、深セン科技などが Transformer に基づく MOF 材料の多機能予測フレームワークを提案しました。

編集者| 大きな可能性を秘めています。

分子動力学などの従来のシミュレーション手法は、複雑で計算量が多くなりますが、システム動作のシミュレーションにおいては非常に正確です。対照的に、特徴量エンジニアリングに基づく機械学習手法は、複雑なシステムを扱う場合に優れたパフォーマンスを発揮しますが、ラベル付きデータが不足しているため、簡単に過剰適合の問題が発生する可能性があります。さらに、これらの機械学習手法は通常、単一のタスクを解決するように設計されており、マルチタスク学習はサポートされていません。したがって、適切な方法を選択するときは、精度、データ要件、タスクの複雑さなどの要素を比較検討して、特定の問題に最適なソリューションを見つける必要があります。

これらの課題に対処するために、清華大学、カリフォルニア大学、中山大学、蘇州大学、深センテクノロジー、AI for Science Institute (AISI、北京) で構成される多機関チームが協力し、現在、 MOF は、多目的ガス予測のために設計された、大規模な 3 次元 MOF 表現学習のための革新的なフレームワークです。 Uni-MOF は、科学研究と実用的なアプリケーションの両方に適しています。

Uni-MOF は、MOF 材料の多機能ガス吸着予測器とみなすことができ、シミュレーション データで優れた予測精度を示し、ガス吸着研究における機械学習の重要な応用を示しています。

この研究は「金属有機骨格における高精度ガス吸着予測のための包括的な変圧器ベースのアプローチ」と題され、2024 年 3 月 1 日に「Nature Communications」に掲載されました。

予測精度は 0.98 と高く、清華大学、深セン科技などが Transformer に基づく MOF 材料の多機能予測フレームワークを提案しました。論文リンク: https://www.nature.com/articles/s41467-024-46276-xxx

統合された吸着フレームワークが必要

金属有機フレームワーク (MOF) は、構造特性と化学組成を調整できるため、ガス分離やその他の分野で広く使用されています。

MOF にはガス吸着の大きな可能性がありますが、その吸着能力を正確に予測することは依然として課題です。

分子動力学やモンテカルロ (MC) などの計算手法は、計算コストが高く実装が複雑であるため、大規模、マルチガス、ハイスループットの計算での使用が制限されます。さらに、ガス吸着は広範囲の条件で作用するため、予測がより複雑になります。

グラフ ニューラル ネットワークとトランスフォーマーは、MOF プロパティを適切に予測することが示されています。

吸着特性を予測するための既存のモデルは高性能で強力な予測機能を備えていますが、通常は単一のタスク、具体的には特定の条件下での特定のガスの吸着吸収率を予測するために設計されています。ただし、これらの単一タスクの予測に利用できるデータセットは多くの場合制限されており、モデルの一般化が妨げられています。

一方、異なる温度と圧力環境におけるさまざまな吸着ガスからのラベル付きデータを組み合わせると、動作条件全体にわたるトレーニングに適した大規模なデータセットを作成できます。データ量の増加により、モデルの一般化機能も強化され、実際の産業用途が向上します。したがって、これらのモデルを発展させるには、統一された吸着フレームワークが必要です。

さらに、大規模なラベルなし MOF 構造のアンサンブル表現学習、つまり事前トレーニングにより、モデルのパフォーマンスと表現機能をさらに向上させることができます。

Uni-MOF フレームワーク: 科学研究と実用的なアプリケーションの両方に適しています

これに触発されて、研究チームは、構造表現学習を使用する多目的ソリューションとして Uni-MOF フレームワークを提案しました。さまざまな条件下での MOF のガス吸着を予測します。

他の Transformer ベースのモデル (MOFormer や MOFTransformer など) と比較すると、Uni-MOF は Transformer ベースのフレームワークとして、事前トレーニングでナノ多孔質材料の 3 次元構造を特定して復元できるだけでなく、したがって、ナノ多孔質材料の堅牢性が大幅に向上します。さらに、微調整タスクでは温度、圧力、さまざまなガス分子などの動作条件が考慮されるため、Uni-MOF は科学研究と実用アプリケーションの両方に適しています。

Uni-MOF MOF 材料の包括的なガス吸着推定ツールとして、MOF の結晶情報ファイル (CIF) および関連するガス、温度、圧力パラメータのみが、幅広い動作範囲でのナノ多孔質材料の予測に必要です。条件、ガス吸着特性、 Uni-MOF フレームワークは使いやすく、モジュールを選択できます。

さらに、過剰適合の問題は、さまざまなシステム間吸収ラベル付きデータと大量のラベルなし構造データの表現学習を組み合わせることで効果的に解決されます。これにより、高品質のデータとデータの欠陥の両方が補われ、最終的にはガス吸着予測の精度が向上します。

Uni-MOF フレームワークにより、原子レベルの材料識別精度が可能になる一方、統合モデルにより Uni-MOF は工学的問題への適用性が高まります。専門分野だけでなく、真に統一モデルを実現することが材料分野の今後の方向性であることは間違いありません。 Uni-MOF は、ガス吸着分野における機械学習の先駆的な実践です。

Uni-MOF フレームワークの概要

Uni-MOF フレームワークには、3 次元ナノ多孔質結晶の事前トレーニングと、下流アプリケーション向けのマルチタスク予測の微調整が含まれています。

予測精度は 0.98 と高く、清華大学、深セン科技などが Transformer に基づく MOF 材料の多機能予測フレームワークを提案しました。

図 1: Uni-MOF フレームワークの概略図。 (出典: 論文)

3D 結晶材料での事前トレーニングにより、下流タスク、特に大規模なラベルなしデータの予測パフォーマンスが大幅に向上します。

トレーニング データ セットの監視が不十分であるという問題を解決するために、研究者は MOF 構造の大規模なデータセットを収集し、ToBaCCo.3.0 を使用して 300,000 を超える MOF を生成しました。マテリアルズ ゲノム ストラテジーと準反応性アセンブリ アルゴリズム (QReaxAA) に基づく COF のハイスループット構築は、包括的な COF ライブラリを確立するために実現可能です。 Uni-MOF は、材料の空間構成を通じて材料の構造特性を十分に学習できます。最も重要なのは化学結合の情報です。

Uni-MOF がより多様な資料を学習し、より幅広い資料への汎化能力を向上できるようにするために、事前トレーニング プロセス中に MOF と COF が仮想的かつ実験的に導入されました。 BERT や Uni-Mol のマスクされたラベリング タスクと同様に、Uni-MOF はマスクされた原子の予測タスクを採用しており、それにより事前トレーニングされたモデルが物質の空間構造を深く理解することが容易になります。

事前トレーニングの堅牢性を強化し、学習された表現を一般化するために、研究者らは MOF の元の座標にノイズを導入しました。事前トレーニング段階では、2 つのタスクが設計されています。 (1) ノイズのあるデータから元の 3D 位置を再構成し、(2) 遮蔽された原子を予測します。これらのタスクにより、モデルの堅牢性が強化され、下流の予測パフォーマンスが向上します。

多様な空間構成に加えて、材料特性データ ポイントの包括的なセットもモデルのトレーニングには重要です。データセットを充実させるために、研究者らはカスタム データ生成プロセスを確立しました (図 1b を参照)。

Uni-MOF の微調整は、事前トレーニングを通じて取得された表現の抽出と、大規模なデータセットを生成および収集するための自家製ワークフローの使用に基づいています。微調整プロセスでは、MOF および COF のさまざまな吸着条件下で約 3,000,000 個のラベル付きデータ ポイントを使用してモデルをトレーニングし、吸着容量の正確な予測を可能にしました。

Uni-MOF は、システム間ターゲット データの多様なデータベースを使用して微調整され、あらゆる状態の MOF のマルチシステム吸着特性を予測します。したがって、Uni-MOF は、MOF 吸着剤の吸着性能を予測するための統一された使いやすいフレームワークです。

最も重要なことは、Uni-MOF では人間が定義した構造的特徴を特定するために追加の労力を必要としないことです。代わりに、MOF の CIF と関連するガス、温度、圧力パラメーターで十分です。自己教師あり学習戦略と豊富なデータベースにより、Uni-MOF はさまざまな動作パラメータの下でナノ多孔質材料のガス吸着特性を予測できることが保証され、MOF 材料のガス吸着の熟練した推定ツールとなります。

予測精度最大 0.98、システム全体で予測

この研究では、631,000 を超える MOF および COF のデータベースに対して自己教師あり学習を実行し、予測精度は最大 0.98 でした。これは、3D 事前トレーニングに基づく表現学習フレームワークが、過剰適合を回避しながら MOF の複雑な構造情報を効果的に学習していることを示しています。

Uni-MOF は、3 つの主要なデータベース (hMOF_MOFX-DB、CoRE_MOFX-DB、および CoRE_MAP_DB) のガス吸着性能を予測するために適用され、十分なデータを持つデータベースでは最大 0.98 の予測精度が達成されました。

予測精度は 0.98 と高く、清華大学、深セン科技などが Transformer に基づく MOF 材料の多機能予測フレームワークを提案しました。

#図 2: 大規模データベースにおける Uni-MOF の全体的なパフォーマンス。 (出典: 論文)

データセットが完全にサンプリングされている場合、Uni-MOF は 0.83 以上の予測精度を維持するだけでなく、低圧でのみ吸着を予測することで、高圧での高性能を正確に選択できます。 . 吸着剤、実験的スクリーニング結果と一致しています。したがって、Uni-MOF は、材料科学分野における機械学習技術の応用における大きな進歩となります。

予測精度は 0.98 と高く、清華大学、深セン科技などが Transformer に基づく MOF 材料の多機能予測フレームワークを提案しました。

図 3: 低圧予測と高圧実験値に基づく吸着等温線。各曲線はラングミュア フィットを表します。 (出典: 論文)

さらに、Uni-MOF フレームワークは、単一システムのタスクと比較して、システム間のデータセットで優れたパフォーマンスを示し、次のような予測精度で未知のガスの吸着特性を正確に予測できます。 0.85と高く、高い予測力と汎用性を示します。

予測精度は 0.98 と高く、清華大学、深セン科技などが Transformer に基づく MOF 材料の多機能予測フレームワークを提案しました。

図 4: Uni-MOF クロスシステム予測ケース。 (出典: 論文)

研究によると、事前トレーニングされた自己教師あり学習戦略が Uni-MOF の堅牢性と下流予測パフォーマンスを効果的に向上させることができます。

予測精度は 0.98 と高く、清華大学、深セン科技などが Transformer に基づく MOF 材料の多機能予測フレームワークを提案しました。

図 5: Uni-MOF と事前トレーニングなしの Uni-MOF の比較。 (出典: 論文)

Uni-MOF は、三次元構造に関する広範な事前トレーニングを通じて MOF の構造的特徴を効果的に学習し、hMOF の 0.99 という高い決定係数を達成します。

予測精度は 0.98 と高く、清華大学、深セン科技などが Transformer に基づく MOF 材料の多機能予測フレームワークを提案しました。

図 6: 構造特性の予測と分析。 (出典: 論文)

さらに、t-SNE (t 分布確率的近傍埋め込み) 解析により、微調整段階で構造特徴をさらに学習でき、異なる吸着挙動を持つ構造を適切に識別できることが確認されました。学習された表現とガス吸着ターゲットの間に強い相関があることが示されています。

予測精度は 0.98 と高く、清華大学、深セン科技などが Transformer に基づく MOF 材料の多機能予測フレームワークを提案しました。

図 7: hMOF および CoRE_MOF データセットにおける MOF 構造表現の視覚化、t-SNE 法によって計算された低次元埋め込み。 (出典: 論文)

要約すると、Uni-MOF フレームワークは、MOF 材料の多機能予測プラットフォームとして機能し、MOF のガス吸着推定器として機能し、さまざまな動作条件下でのガス吸着を高精度で予測します。材料科学の分野で幅広い応用の可能性があります。

以上が予測精度は 0.98 と高く、清華大学、深セン科技などが Transformer に基づく MOF 材料の多機能予測フレームワークを提案しました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

「Defect Spectrum」は、従来の欠陥検出の限界を打ち破り、超高精度かつ豊富なセマンティックな産業用欠陥検出を初めて実現します。 「Defect Spectrum」は、従来の欠陥検出の限界を打ち破り、超高精度かつ豊富なセマンティックな産業用欠陥検出を初めて実現します。 Jul 26, 2024 pm 05:38 PM

現代の製造において、正確な欠陥検出は製品の品​​質を確保するための鍵であるだけでなく、生産効率を向上させるための核心でもあります。ただし、既存の欠陥検出データセットには、実際のアプリケーションに必要な精度や意味論的な豊富さが欠けていることが多く、その結果、モデルが特定の欠陥カテゴリや位置を識別できなくなります。この問題を解決するために、広州香港科技大学と Simou Technology で構成されるトップの研究チームは、産業欠陥に関する詳細かつ意味的に豊富な大規模なアノテーションを提供する「DefectSpectrum」データセットを革新的に開発しました。表 1 に示すように、他の産業データ セットと比較して、「DefectSpectrum」データ セットは最も多くの欠陥注釈 (5438 個の欠陥サンプル) と最も詳細な欠陥分類 (125 個の欠陥カテゴリ) を提供します。

NVIDIA 対話モデル ChatQA はバージョン 2.0 に進化し、コンテキストの長さは 128K と記載されています NVIDIA 対話モデル ChatQA はバージョン 2.0 に進化し、コンテキストの長さは 128K と記載されています Jul 26, 2024 am 08:40 AM

オープンな LLM コミュニティは百花繚乱の時代です Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1 などがご覧いただけます。優秀なパフォーマーモデル。しかし、GPT-4-Turboに代表される独自の大型モデルと比較すると、オープンモデルには依然として多くの分野で大きなギャップがあります。一般的なモデルに加えて、プログラミングと数学用の DeepSeek-Coder-V2 や視覚言語タスク用の InternVL など、主要な領域に特化したいくつかのオープン モデルが開発されています。

Google AI が IMO 数学オリンピック銀メダルを獲得、数理推論モデル AlphaProof が発売、強化学習が復活 Google AI が IMO 数学オリンピック銀メダルを獲得、数理推論モデル AlphaProof が発売、強化学習が復活 Jul 26, 2024 pm 02:40 PM

AI にとって、数学オリンピックはもはや問題ではありません。木曜日、Google DeepMind の人工知能は、AI を使用して今年の国際数学オリンピック IMO の本当の問題を解決するという偉業を達成し、金メダル獲得まであと一歩のところまで迫りました。先週終了したばかりの IMO コンテストでは、代数、組合せ論、幾何学、数論を含む 6 つの問題が出題されました。 Googleが提案したハイブリッドAIシステムは4問正解で28点を獲得し、銀メダルレベルに達した。今月初め、UCLA 終身教授のテレンス・タオ氏が、100 万ドルの賞金をかけて AI 数学オリンピック (AIMO Progress Award) を宣伝したばかりだったが、予想外なことに、AI の問題解決のレベルは 7 月以前にこのレベルまで向上していた。 IMO に関する質問を同時に行うのが最も難しいのは、最も歴史が長く、規模が最も大きく、最も否定的な IMO です。

新しい科学的で複雑な質問応答ベンチマークと大規模モデルの評価システムを提供するために、UNSW、アルゴンヌ、シカゴ大学、およびその他の機関が共同で SciQAG フレームワークを立ち上げました。 新しい科学的で複雑な質問応答ベンチマークと大規模モデルの評価システムを提供するために、UNSW、アルゴンヌ、シカゴ大学、およびその他の機関が共同で SciQAG フレームワークを立ち上げました。 Jul 25, 2024 am 06:42 AM

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載 結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載 Aug 08, 2024 pm 09:22 PM

編集者 |KX 今日に至るまで、単純な金属から大きな膜タンパク質に至るまで、結晶学によって決定される構造の詳細と精度は、他のどの方法にも匹敵しません。しかし、最大の課題、いわゆる位相問題は、実験的に決定された振幅から位相情報を取得することのままです。デンマークのコペンハーゲン大学の研究者らは、結晶相の問題を解決するための PhAI と呼ばれる深層学習手法を開発しました。数百万の人工結晶構造とそれに対応する合成回折データを使用して訓練された深層学習ニューラル ネットワークは、正確な電子密度マップを生成できます。この研究では、この深層学習ベースの非経験的構造解法は、従来の非経験的計算法とは異なり、わずか 2 オングストロームの解像度で位相問題を解決できることが示されています。これは、原子解像度で利用可能なデータのわずか 10% ~ 20% に相当します。

自然の視点: 医療における人工知能のテストは混乱に陥っています。何をすべきでしょうか? 自然の視点: 医療における人工知能のテストは混乱に陥っています。何をすべきでしょうか? Aug 22, 2024 pm 04:37 PM

編集者 | ScienceAI 限られた臨床データに基づいて、何百もの医療アルゴリズムが承認されています。科学者たちは、誰がツールをテストすべきか、そしてどのようにテストするのが最善かについて議論しています。デビン シン氏は、救急治療室で小児患者が治療を長時間待っている間に心停止に陥るのを目撃し、待ち時間を短縮するための AI の応用を模索するようになりました。 SickKids 緊急治療室からのトリアージ データを使用して、Singh 氏らは潜在的な診断を提供し、検査を推奨する一連の AI モデルを構築しました。ある研究では、これらのモデルにより医師の診察が 22.3% 短縮され、医療検査が必要な患者 1 人あたりの結果の処理が 3 時間近く高速化できることが示されました。ただし、研究における人工知能アルゴリズムの成功は、これを証明するだけです。

SOTA パフォーマンス、厦門マルチモーダルタンパク質-リガンド親和性予測 AI 手法、初めて分子表面情報を結合 SOTA パフォーマンス、厦門マルチモーダルタンパク質-リガンド親和性予測 AI 手法、初めて分子表面情報を結合 Jul 17, 2024 pm 06:37 PM

編集者 | KX 医薬品の研究開発の分野では、タンパク質とリガンドの結合親和性を正確かつ効果的に予測することが、医薬品のスクリーニングと最適化にとって重要です。しかし、現在の研究では、タンパク質とリガンドの相互作用における分子表面情報の重要な役割が考慮されていません。これに基づいて、アモイ大学の研究者らは、初めてタンパク質の表面、3D 構造、配列に関する情報を組み合わせ、クロスアテンション メカニズムを使用して異なるモダリティの特徴を比較する、新しいマルチモーダル特徴抽出 (MFE) フレームワークを提案しました。アライメント。実験結果は、この方法がタンパク質-リガンド結合親和性の予測において最先端の性能を達成することを実証しています。さらに、アブレーション研究は、この枠組み内でのタンパク質表面情報と多峰性特徴の位置合わせの有効性と必要性​​を実証しています。 「S」で始まる関連研究

テキスト、位置決め、セグメンテーションのタスクをカバーし、Zhiyuan と香港華人が共同で初の多機能 3D 医療マルチモーダル大型モデルを提案しました テキスト、位置決め、セグメンテーションのタスクをカバーし、Zhiyuan と香港華人が共同で初の多機能 3D 医療マルチモーダル大型モデルを提案しました Jun 22, 2024 am 07:16 AM

著者 | 編集者 Bai Fan、香港中文大学 | ScienceAI 最近、香港中文大学と Zhiyuan は、3D 医療画像を促進するために M3D-Data、M3D-LaMed、M3D-Bench を含む一連の研究を共同提案しました。データセット、モデル、評価のあらゆる側面からの分析の開発。 (1) M3D-Data は現在最大の 3D 医用画像データ セットであり、M3D-Cap (120K3D 画像とテキストのペア)、M3D-VQA (510K の質問と回答のペア)、M3D-Seg (150K3DMask)、M3D-RefSeg ( 3K 推論セグメンテーション ) 合計 4 つのサブデータセット。 (2) M3D-LaMed は現在、最も汎用性の高い 3D 医療マルチモーダル大型モデルです。

See all articles