目次
マルチスケールタスクにおいて現在の最先端モデルを上回る性能を発揮します
ホームページ テクノロジー周辺機器 AI SOTA パフォーマンス、マルチスケール学習、中山大学がタンパク質と薬物の相互作用 AI フレームワークを提案

SOTA パフォーマンス、マルチスケール学習、中山大学がタンパク質と薬物の相互作用 AI フレームワークを提案

Jun 04, 2024 pm 03:43 PM
理論

SOTA パフォーマンス、マルチスケール学習、中山大学がタンパク質と薬物の相互作用 AI フレームワークを提案

Editor | Violet

タンパク質、薬物、その他の生体分子間の相互作用は、さまざまな生物学的プロセスにおいて重要な役割を果たします。これらの相互作用を理解することは、生物学的プロセスの根底にある分子機構を解読し、新しい治療戦略を開発するために重要です。 タンパク質は細胞内で最も重要な分子の一つであり、細胞内でさまざまな機能を果たします。薬物は多くの場合、特定のタンパク質と相互作用することによって生理学的プロセスを調節します。これらの相互作用は、特定の分子シグナル伝達経路を促進または阻害する可能性があります。現在のマルチスケール計算方法では、単一のスケールに依存しすぎて、他のスケールが十分に適合していないことがよくあります。これは、不均一なマルチスケール指向性とマルチスケール学習に固有の貪欲さに関連している可能性があります。

最適化の不均衡を軽減するために、中山大学と上海交通大学の研究者は、学習のためにマルチスケール情報を効果的に統合できる、変数期待値最大化に基づくマルチスケール表現学習フレームワーク MUSE を提案しました。この戦略は、相互監視と反復最適化を通じて、原子構造と分子ネットワークスケール間のマルチスケール情報を効果的に融合します。このアプローチにより、より多くの情報伝達と学習が可能になります。この戦略は、相互監視と反復最適化を通じて、原子構造と分子ネットワークスケール間のマルチスケール情報を効果的に融合します。

MUSE+ は、分子相互作用 (タンパク質間、薬物間、薬物間) タスクに関して現在の最先端モデルよりも優れているだけでなく、タンパク質界面予測においても現在の最先端モデルよりも優れています。原子構造スケールで。さらに重要なことは、マルチスケール学習フレームワークは、他のスケールでの計算による創薬にも拡張できることです。

タンパク質と薬物の相互作用のバランスの取れたマルチスケール学習のための変分期待値最大化フレームワーク

」と題されたこの研究は、5月25日付けの「Nature Communications」に掲載されました。

SOTA パフォーマンス、マルチスケール学習、中山大学がタンパク質と薬物の相互作用 AI フレームワークを提案論文リンク:

https://www.nature.com/articles/s41467-024-48801-4
生体分子相互作用

タンパク質の機能の特徴は、タンパク質、薬物、およびタンパク質に関連しています。他の生体分子との相互作用。これらの相互作用を理解することは、生物学的プロセスの分子機構を解読し、新しい治療戦略を開発するために重要です。しかし、実験的相互作用に関連する需要とコストが大幅に増加しているため、生体分子間の相互作用を自動的に予測して理解するための計算ツールが必要です。 これらの需要と増大するコストに対応するには、生体分子間の相互作用を自動的に予測して理解するための計算ツールが必要です。

これらの相互作用を純粋に構造から予測することは、構造生物学における最も重要な課題の 1 つです。現在の計算手法は主に分子ネットワークまたは構造情報に基づいて相互作用を予測しており、それらを統一されたマルチスケールのフレームワークに統合していません。

一部のマルチビュー学習方法はマルチスケール情報の融合を目指していますが、マルチスケール表現を学習する直感的な方法は、分子グラフと相互作用ネットワークを組み合わせて共同最適化することです。ただし、マルチスケール学習の不均衡と固有の貪欲さのため、これらのモデルは単一のスケールに大きく依存することがよくあります。あらゆる規模に関する情報を有効に活用できず、一般化が不十分である。

さらに、効果的なマルチスケール フレームワークは、さまざまなスケール内の豊富な情報を取得する必要があるだけでなく、それらの間の基礎的な関係を適切に保存する必要もあります。

タンパク質と薬物のマルチスケール情報を学習するための MUSE

ここで、中山大学の研究チームは、変数期待値最大化 (Expectation Maximization) に基づいたマルチスケール表現学習フレームワークである MUSE を提案しました。複数回使用 異なるスケールが交互の反復プロセスで最適化されます。単一スケールの情報に大きく依存する既存の手法と比較して、MUSE は相互監視と反復最適化を通じてマルチスケール学習における最適化の不均衡問題を効果的に解決します。

MUSE は、変分期待値最大化 (EM) フレームワークを通じて分子構造モデリングとタンパク質-薬物相互作用ネットワーク学習を組み合わせたマルチスケール学習方法です。 EM フレームワークは、複数の反復を交互に繰り返すプロセスで、2 つのモジュール、つまり期待ステップ (E ステップ) と最大化ステップ (M ステップ) を最適化します。

E ステップ中に、MUSE は各生体分子の構造情報を利用して、既知の相互作用と強化サンプルを使用した M ステップでのトレーニングに効果的な構造表現を学習します。これは、タンパク質と薬物のペアとそれらの原子レベルの構造情報を入力として受け取り、M ステップで予測される相互作用によって強化されます。 M ステップは、分子レベルの相互作用ネットワーク、構造埋め込み、および E ステップの予測相互作用を入力として受け取り、予測された相互作用を出力します。 E ステップと M ステップ間の反復最適化により、2 つのスケールで異なる学習率で分子構造とネットワーク情報を対話的に取得できます。

相互監視により、各スケール モデルが適切な方法で学習し、異なるスケールで効果的な情報を利用できるようになります。このフレームワークは、タンパク質と薬物間の相互作用の複数のマルチスケールにわたって実証されます。 MUSE はマルチスケール学習における特徴の不均衡を軽減し、異なるスケールからの階層的で補完的な情報を効果的に統合すると分析されています。

SOTA パフォーマンス、マルチスケール学習、中山大学がタンパク質と薬物の相互作用 AI フレームワークを提案

図 1: MUSE フレームワークとそのアプリケーションの概略図。 (出典: 論文)

マルチスケールタスクにおいて現在の最先端モデルを上回る性能を発揮します

原子構造情報を利用して分子ネットワークスケールでの予測を改善します

彼らのアプローチを評価するには、まず、研究者らは、MUSE を使用して原子の構造情報を統合し、分子ネットワーク規模の予測を改善しました。 MUSE は、タンパク質間相互作用 (PPI)、薬物間相互作用 (DPI)、薬物間相互作用 (DDI) という 3 つのマルチスケール相互作用予測タスクで最先端のパフォーマンスを実現します。

SOTA パフォーマンス、マルチスケール学習、中山大学がタンパク質と薬物の相互作用 AI フレームワークを提案

図 2: タンパク質と薬物の相互作用の予測における MUSE のパフォーマンス。 (出典: 論文)

分子ネットワークスケールからの原子構造スケール予測の改善

研究者らは、原子構造情報を使用して分子ネットワークスケール予測を改善することに加えて、原子構造で構造を学習および予測するMUSEの能力をさらに研究しました。スケール PPI に関連する界面接触および結合部位の予測を含む、特徴付けを行う能力。

タンパク質の鎖間接触の予測を評価するために、MUSE を DIPS-Plus ベンチマークで最先端の手法と比較しました。 MUSE は他のすべての方法よりも一貫して優れており、原子構造予測におけるその有効性と適応性が検証されています。

SOTA パフォーマンス、マルチスケール学習、中山大学がタンパク質と薬物の相互作用 AI フレームワークを提案

図 3: 原子構造のスケールでの MUSE パフォーマンス。 (出典: 論文)

MUSE は、残基がタンパク質間相互作用に直接関与しているかどうかを予測するためにさらに評価されました。この結果は、MUSE での分子ネットワーク スケールの学習により、原子構造スケールの予測に対する貴重な洞察が得られることを示しています。

反復最適化によりマルチスケール学習の不均衡特性を緩和

なぜMUSEがマルチスケール表現において優れたパフォーマンスを達成できるのかを探るため、研究者らはマルチスケールの不均衡特性に基づいてMUSEの学習能力を分析しました。学ぶ。

SOTA パフォーマンス、マルチスケール学習、中山大学がタンパク質と薬物の相互作用 AI フレームワークを提案

図 4: マルチスケール学習における不均衡な特徴の分析。 (出典: 論文)

結果は、MUSE がマルチスケール学習における不均衡特性と貪欲な学習を効果的に軽減し、トレーニングプロセス中にさまざまなスケールでの情報の包括的な利用を保証することを示しています。さらに、使用率分析の実験により、研究者はモデルが学習した内容を具体的に理解できるようになり、MUSE を使用してさまざまなスケールでモデル学習のバランスをとれば汎化機能が強化できることが実証されました。

学習されたマルチスケール表現の視覚化と解釈

学習されたマルチスケール表現をよりよく理解するために、研究者は、MUSE によって学習されたマルチスケール表現をさまざまな角度から研究しました。(1) MUSE のキャプチャ アトミックの能力PPI に関与する構造情報 (つまり、構造モチーフと埋め込み)、(2) 学習された原子構造と分子ネットワーク表現の間の相互監視。

SOTA パフォーマンス、マルチスケール学習、中山大学がタンパク質と薬物の相互作用 AI フレームワークを提案

図 5: マルチスケール表現の視覚化と解釈。 (出典: 論文)

結合部位予測 (PDB id: 3CQQ-A) の例として、MUSE は結合部位に属する残基を 97.7% の精度で正確に識別できます。これは、MUSE における相互監視が、原子構造スケール モデルが相互作用に関連する重要な部分構造を学習するのに役立つことを示唆しています。

最後に、研究者らは、原子構造スケールで予測された擬似ラベルが分子ネットワークスケールに及ぼす影響を研究するために、アブレーション研究も実施しました。

MUSE はベンチマークで最先端のパフォーマンスを示していますが、ノイズが多く不完全なマルチスケールのダウンストリーム タスクを処理する能力を向上させることはまだ可能です。これは、ナレッジ グラフと説明可能な AI 技術による事前知識を組み合わせることで実現できます。一方、この概念的なマルチスケールのフレームワークは、他のスケールの計算による創薬にも拡張できます。

以上がSOTA パフォーマンス、マルチスケール学習、中山大学がタンパク質と薬物の相互作用 AI フレームワークを提案の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

「Defect Spectrum」は、従来の欠陥検出の限界を打ち破り、超高精度かつ豊富なセマンティックな産業用欠陥検出を初めて実現します。 「Defect Spectrum」は、従来の欠陥検出の限界を打ち破り、超高精度かつ豊富なセマンティックな産業用欠陥検出を初めて実現します。 Jul 26, 2024 pm 05:38 PM

現代の製造において、正確な欠陥検出は製品の品​​質を確保するための鍵であるだけでなく、生産効率を向上させるための核心でもあります。ただし、既存の欠陥検出データセットには、実際のアプリケーションに必要な精度や意味論的な豊富さが欠けていることが多く、その結果、モデルが特定の欠陥カテゴリや位置を識別できなくなります。この問題を解決するために、広州香港科技大学と Simou Technology で構成されるトップの研究チームは、産業欠陥に関する詳細かつ意味的に豊富な大規模なアノテーションを提供する「DefectSpectrum」データセットを革新的に開発しました。表 1 に示すように、他の産業データ セットと比較して、「DefectSpectrum」データ セットは最も多くの欠陥注釈 (5438 個の欠陥サンプル) と最も詳細な欠陥分類 (125 個の欠陥カテゴリ) を提供します。

結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載 結晶相問題を解決するための数百万の結晶データを使用したトレーニング、深層学習手法 PhAI が Science 誌に掲載 Aug 08, 2024 pm 09:22 PM

編集者 |KX 今日に至るまで、単純な金属から大きな膜タンパク質に至るまで、結晶学によって決定される構造の詳細と精度は、他のどの方法にも匹敵しません。しかし、最大の課題、いわゆる位相問題は、実験的に決定された振幅から位相情報を取得することのままです。デンマークのコペンハーゲン大学の研究者らは、結晶相の問題を解決するための PhAI と呼ばれる深層学習手法を開発しました。数百万の人工結晶構造とそれに対応する合成回折データを使用して訓練された深層学習ニューラル ネットワークは、正確な電子密度マップを生成できます。この研究では、この深層学習ベースの非経験的構造解法は、従来の非経験的計算法とは異なり、わずか 2 オングストロームの解像度で位相問題を解決できることが示されています。これは、原子解像度で利用可能なデータのわずか 10% ~ 20% に相当します。

NVIDIA 対話モデル ChatQA はバージョン 2.0 に進化し、コンテキストの長さは 128K と記載されています NVIDIA 対話モデル ChatQA はバージョン 2.0 に進化し、コンテキストの長さは 128K と記載されています Jul 26, 2024 am 08:40 AM

オープンな LLM コミュニティは百花繚乱の時代です Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1 などがご覧いただけます。優秀なパフォーマーモデル。しかし、GPT-4-Turboに代表される独自の大型モデルと比較すると、オープンモデルには依然として多くの分野で大きなギャップがあります。一般的なモデルに加えて、プログラミングと数学用の DeepSeek-Coder-V2 や視覚言語タスク用の InternVL など、主要な領域に特化したいくつかのオープン モデルが開発されています。

Google AI が IMO 数学オリンピック銀メダルを獲得、数理推論モデル AlphaProof が発売、強化学習が復活 Google AI が IMO 数学オリンピック銀メダルを獲得、数理推論モデル AlphaProof が発売、強化学習が復活 Jul 26, 2024 pm 02:40 PM

AI にとって、数学オリンピックはもはや問題ではありません。木曜日、Google DeepMind の人工知能は、AI を使用して今年の国際数学オリンピック IMO の本当の問題を解決するという偉業を達成し、金メダル獲得まであと一歩のところまで迫りました。先週終了したばかりの IMO コンテストでは、代数、組合せ論、幾何学、数論を含む 6 つの問題が出題されました。 Googleが提案したハイブリッドAIシステムは4問正解で28点を獲得し、銀メダルレベルに達した。今月初め、UCLA 終身教授のテレンス・タオ氏が、100 万ドルの賞金をかけて AI 数学オリンピック (AIMO Progress Award) を宣伝したばかりだったが、予想外なことに、AI の問題解決のレベルは 7 月以前にこのレベルまで向上していた。 IMO に関する質問を同時に行うのが最も難しいのは、最も歴史が長く、規模が最も大きく、最も否定的な IMO です。

PRO | なぜ MoE に基づく大規模モデルがより注目に値するのでしょうか? PRO | なぜ MoE に基づく大規模モデルがより注目に値するのでしょうか? Aug 07, 2024 pm 07:08 PM

2023 年には、AI のほぼすべての分野が前例のない速度で進化しています。同時に、AI は身体化されたインテリジェンスや自動運転などの主要な分野の技術的限界を押し広げています。マルチモーダルの流れのもと、AI大型モデルの主流アーキテクチャとしてのTransformerの状況は揺るがされるだろうか? MoE (専門家混合) アーキテクチャに基づく大規模モデルの検討が業界の新しいトレンドになっているのはなぜですか?ラージ ビジョン モデル (LVM) は、一般的な視覚における新たなブレークスルーとなる可能性がありますか? ...過去 6 か月間にリリースされたこのサイトの 2023 PRO メンバー ニュースレターから、上記の分野の技術トレンドと業界の変化を詳細に分析し、新しい分野での目標を達成するのに役立つ 10 の特別な解釈を選択しました。準備してください。この解釈は 2023 年の Week50 からのものです

新しい科学的で複雑な質問応答ベンチマークと大規模モデルの評価システムを提供するために、UNSW、アルゴンヌ、シカゴ大学、およびその他の機関が共同で SciQAG フレームワークを立ち上げました。 新しい科学的で複雑な質問応答ベンチマークと大規模モデルの評価システムを提供するために、UNSW、アルゴンヌ、シカゴ大学、およびその他の機関が共同で SciQAG フレームワークを立ち上げました。 Jul 25, 2024 am 06:42 AM

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

Transformer に基づく浙江大学の化学逆合成予測モデルは、Nature サブジャーナルで 60.8% に達しました。 Transformer に基づく浙江大学の化学逆合成予測モデルは、Nature サブジャーナルで 60.8% に達しました。 Aug 06, 2024 pm 07:34 PM

編集者 | KX 逆合成は創薬や有機合成において重要なタスクであり、そのプロセスを高速化するために AI の使用が増えています。既存の AI 手法はパフォーマンスが不十分で、多様性が限られています。実際には、化学反応は多くの場合、反応物と生成物の間にかなりの重複を伴​​う局所的な分子変化を引き起こします。これに触発されて、浙江大学のHou Tingjun氏のチームは、単一ステップの逆合成予測を分子列編集タスクとして再定義し、標的分子列を反復的に改良して前駆体化合物を生成することを提案した。そして、高品質かつ多様な予測を実現できる編集ベースの逆合成モデルEditRetroを提案する。広範な実験により、このモデルが標準ベンチマーク データ セット USPTO-50 K で優れたパフォーマンスを達成し、トップ 1 の精度が 60.8% であることが示されました。

自然の視点: 医療における人工知能のテストは混乱に陥っています。何をすべきでしょうか? 自然の視点: 医療における人工知能のテストは混乱に陥っています。何をすべきでしょうか? Aug 22, 2024 pm 04:37 PM

編集者 | ScienceAI 限られた臨床データに基づいて、何百もの医療アルゴリズムが承認されています。科学者たちは、誰がツールをテストすべきか、そしてどのようにテストするのが最善かについて議論しています。デビン シン氏は、救急治療室で小児患者が治療を長時間待っている間に心停止に陥るのを目撃し、待ち時間を短縮するための AI の応用を模索するようになりました。 SickKids 緊急治療室からのトリアージ データを使用して、Singh 氏らは潜在的な診断を提供し、検査を推奨する一連の AI モデルを構築しました。ある研究では、これらのモデルにより医師の診察が 22.3% 短縮され、医療検査が必要な患者 1 人あたりの結果の処理が 3 時間近く高速化できることが示されました。ただし、研究における人工知能アルゴリズムの成功は、これを証明するだけです。

See all articles