わずか数秒でタンパク質の動態情報を正確に推定できる山東大学、北京工業大学などのAIモデルRMSF-netがNatureサブジャーナルに掲載されました。
タンパク質のダイナミクスは、そのメカニズムを理解する上で非常に重要です。ただし、タンパク質の動態情報をコンピューターで予測することは困難です。
ここで、山東大学、BioMap、北京工業大学、湖北医科大学、寧夏医科大学、キングアブドラ科学技術大学 (KAUST) の研究チームが、以前の手法を上回るニューラル ネットワーク モデル RMSF -net を提案しました。大規模なタンパク質ダイナミクス データセットで最良の結果を生成するモデルは、タンパク質のダイナミクス情報を数秒で正確に推測できます。
実験タンパク質構造データとクライオ EM データの統合から効果的に学習することにより、このメソッドは、クライオ EM 画像と PDB モデルの間のインタラクティブな双方向制約と監視を正確に特定し、ダイナミクス予測の効率を最大化することができます。
RMSF-net は、タンパク質動態研究において重要な役割を果たす無料で使用できるツールです。
この研究は「複雑な原子構造とクライオEM密度情報を統合した深層学習によるタンパク質構造の柔軟性の正確な予測」と題され、7月2日に「Nature Communications」に掲載されました。
- https://www.nature.com/articles/s41467-024-49858-x
RMSF-net GitHub アドレス:
- https://github. com/XintSong/RMSF-net
タンパク質のダイナミクス
タンパク質のダイナミクスは、そのメカニズムを理解する上で非常に重要です。クライオ電子顕微鏡 (クライオ EM) テクノロジーは、ほとんどのタンパク質を分解でき、高分子構造は 3D 密度マップで表されます。
クライオ電子顕微鏡の限界
元の 2D 粒子画像の解像度と S/N 比が低いため、クライオ電子顕微鏡分析では再構成中の小さな構造変化を解決できません。
クライオ電子顕微鏡におけるディープラーニングの応用
ディープラーニング手法は、クライオ電子顕微鏡画像の自動解析に広く使用されています。高解像度のクライオ EM マップを使用すると、クライオ EM マップからタンパク質データ バンク (PDB) モデルを構築できます。
RMSF-net の概要
RMSF-net は、極低温電子顕微鏡密度マップ用のニューラル ネットワーク モデルです。クライオ EM 密度と PDB モデル情報を活用して、タンパク質の動的情報を数秒で正確に推測します。
RMSF
RMSF は、分子動力学 (MD) 解析において分子構造の柔軟性を評価するために広く使用されている測定方法です。その主な目的は、タンパク質内の局所構造 (残基、原子) の RMSF を予測することです。
クライオ EM 画像に加えて、RMSF-net は追加入力として PDB モデルを利用して、MD シミュレーション結果に非常に近い RMSF 予測を生成します。
RMSF-net は、相互接続された 2 つのモジュールを含む 3 次元畳み込みニューラル ネットワークです。メイン モジュールは、Unet+ (L3) アーキテクチャを使用して、入力密度ボックスの特徴をエンコードおよびデコードします。別のモジュールは、1x1 畳み込みを利用して、Unet+バックボーンによって生成された特徴マップのチャネルを回帰します。次に、中心クリッピングが回帰モジュール出力に適用されて、中心の RMSF サブボックスが取得されます。ここで、ボクセル値は、その中に含まれる原子の RMSF に対応します。最後に、RMSF サブボックスは、結合アルゴリズムを使用して RMSF マップに空間的に結合されます。
さらに、研究者らは、RMSF-net のトレーニングと検証のための大規模なタンパク質ダイナミクス データセットも構築しました。このデータセットでは、適合した PDB モデルを持つ 335 個のクライオ EM 構造エントリが選択され、対応する MD シミュレーションが実行されました。包括的な実験結果は、RMSF-net の効率と有効性を実証しています。
表: データセットに対するさまざまな RMSF 予測手法のパフォーマンス。 (出典: 論文)
RMSF-netは、厳密な5分割相互検証で良好なパフォーマンスを示し、MDシミュレーション結果との相関係数は0.746±0.127でした。 RMSF-net の相関係数は、DEFMap と比較して 15%、ベースライン手法と比較して 10% 改善されました。
ダイナミクス予測の解釈可能性
研究者らは、比較実験を通じてRMSFネットダイナミクス予測の解釈可能性を強化しました。彼らは、RMSF 予測プロセスを 2 つのステップに分けています:
- 構造情報抽出 (Occ2RMSF-net)
- 抽出された構造情報に基づく運動学予測
研究によると、低温電子顕微鏡スペクトル (DEFMap や RMSF-net_cryo など) に基づくモデルの動力学予測は主にタンパク質の解釈 構造の実装。これは、構造と機能の関係の第一原理と一致する、タンパク質のトポロジーとダイナミクスの関係を強調しています。
さらに、RMSF-net_cryo、RMSF-net_pdb、および最終的な二重結合 RMSF-net の包括的な比較により、次のことが証明されます: 一方で、PDB モデルからの構造情報が再生されます。 RMSF-netの役割における主要な役割。ディープモデルはMDシミュレーションから構造トポロジーと柔軟性の間のパターンを学習し、その一方で、モデルは極低温電子顕微鏡の不均一な密度分布に含まれる速度論的情報によってさらに強化されます。地図。これらの結果は、RMSF-net におけるタンパク質動態予測におけるクライオ EM マップと PDB モデルからの情報の相補的な役割を検証します。
限界と今後の方向性
RMSF-net が主に溶液中の純粋なタンパク質とその複合体の柔軟性を予測することに限定されていることは否定できません。この方法は、小分子リガンドに結合したときまたは膜環境におけるタンパク質の動的特性に関して、特定の局所領域で不正確さを示す可能性があります。
RMSF-net の優れたパフォーマンスは、この方向でのさらなる研究の実現可能性を明らかにしています。この研究は、核酸およびタンパク質-核酸複合体には拡張されていません。多重構造予測や遷移解析を含む高分子動力学のあらゆる側面の包括的な特性評価には、今後さらに広範かつ詳細な研究が必要です。
それにもかかわらず、RMSF-net は、その優れたパフォーマンスと超高速処理速度により、タンパク質のダイナミクスを予測するツールとして、タンパク質の構造とダイナミクスの研究において依然として大きな応用の可能性を秘めています。
注: 表紙はインターネットから取得したものです
以上がわずか数秒でタンパク質の動態情報を正確に推定できる山東大学、北京工業大学などのAIモデルRMSF-netがNatureサブジャーナルに掲載されました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











現代の製造において、正確な欠陥検出は製品の品質を確保するための鍵であるだけでなく、生産効率を向上させるための核心でもあります。ただし、既存の欠陥検出データセットには、実際のアプリケーションに必要な精度や意味論的な豊富さが欠けていることが多く、その結果、モデルが特定の欠陥カテゴリや位置を識別できなくなります。この問題を解決するために、広州香港科技大学と Simou Technology で構成されるトップの研究チームは、産業欠陥に関する詳細かつ意味的に豊富な大規模なアノテーションを提供する「DefectSpectrum」データセットを革新的に開発しました。表 1 に示すように、他の産業データ セットと比較して、「DefectSpectrum」データ セットは最も多くの欠陥注釈 (5438 個の欠陥サンプル) と最も詳細な欠陥分類 (125 個の欠陥カテゴリ) を提供します。

オープンな LLM コミュニティは百花繚乱の時代です Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1 などがご覧いただけます。優秀なパフォーマーモデル。しかし、GPT-4-Turboに代表される独自の大型モデルと比較すると、オープンモデルには依然として多くの分野で大きなギャップがあります。一般的なモデルに加えて、プログラミングと数学用の DeepSeek-Coder-V2 や視覚言語タスク用の InternVL など、主要な領域に特化したいくつかのオープン モデルが開発されています。

編集者 |KX 今日に至るまで、単純な金属から大きな膜タンパク質に至るまで、結晶学によって決定される構造の詳細と精度は、他のどの方法にも匹敵しません。しかし、最大の課題、いわゆる位相問題は、実験的に決定された振幅から位相情報を取得することのままです。デンマークのコペンハーゲン大学の研究者らは、結晶相の問題を解決するための PhAI と呼ばれる深層学習手法を開発しました。数百万の人工結晶構造とそれに対応する合成回折データを使用して訓練された深層学習ニューラル ネットワークは、正確な電子密度マップを生成できます。この研究では、この深層学習ベースの非経験的構造解法は、従来の非経験的計算法とは異なり、わずか 2 オングストロームの解像度で位相問題を解決できることが示されています。これは、原子解像度で利用可能なデータのわずか 10% ~ 20% に相当します。

AI にとって、数学オリンピックはもはや問題ではありません。木曜日、Google DeepMind の人工知能は、AI を使用して今年の国際数学オリンピック IMO の本当の問題を解決するという偉業を達成し、金メダル獲得まであと一歩のところまで迫りました。先週終了したばかりの IMO コンテストでは、代数、組合せ論、幾何学、数論を含む 6 つの問題が出題されました。 Googleが提案したハイブリッドAIシステムは4問正解で28点を獲得し、銀メダルレベルに達した。今月初め、UCLA 終身教授のテレンス・タオ氏が、100 万ドルの賞金をかけて AI 数学オリンピック (AIMO Progress Award) を宣伝したばかりだったが、予想外なことに、AI の問題解決のレベルは 7 月以前にこのレベルまで向上していた。 IMO に関する質問を同時に行うのが最も難しいのは、最も歴史が長く、規模が最も大きく、最も否定的な IMO です。

2023 年には、AI のほぼすべての分野が前例のない速度で進化しています。同時に、AI は身体化されたインテリジェンスや自動運転などの主要な分野の技術的限界を押し広げています。マルチモーダルの流れのもと、AI大型モデルの主流アーキテクチャとしてのTransformerの状況は揺るがされるだろうか? MoE (専門家混合) アーキテクチャに基づく大規模モデルの検討が業界の新しいトレンドになっているのはなぜですか?ラージ ビジョン モデル (LVM) は、一般的な視覚における新たなブレークスルーとなる可能性がありますか? ...過去 6 か月間にリリースされたこのサイトの 2023 PRO メンバー ニュースレターから、上記の分野の技術トレンドと業界の変化を詳細に分析し、新しい分野での目標を達成するのに役立つ 10 の特別な解釈を選択しました。準備してください。この解釈は 2023 年の Week50 からのものです

編集者 |ScienceAI 質問応答 (QA) データセットは、自然言語処理 (NLP) 研究を促進する上で重要な役割を果たします。高品質の QA データ セットは、モデルの微調整に使用できるだけでなく、大規模言語モデル (LLM) の機能、特に科学的知識を理解し推論する能力を効果的に評価することもできます。現在、医学、化学、生物学、その他の分野をカバーする多くの科学 QA データ セットがありますが、これらのデータ セットにはまだいくつかの欠点があります。まず、データ形式は比較的単純で、そのほとんどが多肢選択式の質問であり、評価は簡単ですが、モデルの回答選択範囲が制限され、科学的な質問に回答するモデルの能力を完全にテストすることはできません。対照的に、自由回答型の Q&A

編集者 | KX 逆合成は創薬や有機合成において重要なタスクであり、そのプロセスを高速化するために AI の使用が増えています。既存の AI 手法はパフォーマンスが不十分で、多様性が限られています。実際には、化学反応は多くの場合、反応物と生成物の間にかなりの重複を伴う局所的な分子変化を引き起こします。これに触発されて、浙江大学のHou Tingjun氏のチームは、単一ステップの逆合成予測を分子列編集タスクとして再定義し、標的分子列を反復的に改良して前駆体化合物を生成することを提案した。そして、高品質かつ多様な予測を実現できる編集ベースの逆合成モデルEditRetroを提案する。広範な実験により、このモデルが標準ベンチマーク データ セット USPTO-50 K で優れたパフォーマンスを達成し、トップ 1 の精度が 60.8% であることが示されました。

編集者 | ScienceAI 限られた臨床データに基づいて、何百もの医療アルゴリズムが承認されています。科学者たちは、誰がツールをテストすべきか、そしてどのようにテストするのが最善かについて議論しています。デビン シン氏は、救急治療室で小児患者が治療を長時間待っている間に心停止に陥るのを目撃し、待ち時間を短縮するための AI の応用を模索するようになりました。 SickKids 緊急治療室からのトリアージ データを使用して、Singh 氏らは潜在的な診断を提供し、検査を推奨する一連の AI モデルを構築しました。ある研究では、これらのモデルにより医師の診察が 22.3% 短縮され、医療検査が必要な患者 1 人あたりの結果の処理が 3 時間近く高速化できることが示されました。ただし、研究における人工知能アルゴリズムの成功は、これを証明するだけです。
