深層学習手法は、生体分子構造の単一状態予測において大幅な進歩を促進しました。ただし、生体分子の機能は、生体分子が取り得る立体構造の範囲によって異なります。これは、さまざまな生物学的プロセスに関与し、治療薬として非常に興味深い分子である非常に柔軟な分子の一種であるペプチドに特に当てはまります。
トロント大学のフィリップ M. キムとオサマ アブディンは、入力ペプチドの許容立体構造空間から直接全原子サンプリングを可能にする伝達可能な生成モデルである PepFlow を開発しました。研究者らは拡散フレームワークでモデルをトレーニングし、その後、等価フローを立体構造サンプリングに使用しました。
一般化された全原子モデリングの法外なコストを克服するために、彼らは生成プロセスをモジュール化し、シーケンス固有のネットワークパラメーターを予測するためにスーパーネットワークを統合しました。 PepFlow はペプチド構造を正確に予測し、従来の方法の数分の 1 の実行時間で実験的なペプチド コレクションを効率的に再現します。 PepFlow は、大環状化などの制約を満たす立体構造をサンプリングするためにも使用できます。
「これまでのところ、ペプチドの完全な立体構造をシミュレーションすることはできていません。」とこの研究の筆頭著者であるオサマ・アブディンは述べています。このモデルは、医薬品開発を導くための結合剤としてペプチドを設計によって使用できる可能性を秘めています」
この研究のタイトルは「ハイパーネットワーク条件付き拡散を通じたペプチドエネルギーランドスケープからの直接構造サンプリング」であり、6 月 27 日に「Nature Machine Intelligence」に掲載されました。 2024年。
タンパク質-ペプチド相互作用ペプチドの治療的可能性
ペプチドモデリングとエンジニアリング
この問題を解決するために、彼らは PepFlow を開発しました。これは、入力されたペプチド配列の全原子の立体構造を予測できる、モジュール式のハイパーネットワーク条件付き生成モデルです。 PepFlow は、既知の分子構造に基づいてトレーニングされた連続時間拡散モデルです。対応する確率フロー ODE は、エネルギーのサンプリングとトレーニングに使用されます。
PepFlow は、一重項ペプチド構造と短い線状モチーフの集合 (SLiM) を予測する強力な機能を備えており、潜在空間立体配座検索を通じて大環状化などの制約の下でペプチド構造をモデル化できます。
このモデルは、主要な Google Deepmind AI システムである AlphaFold の機能を拡張して、タンパク質の構造を予測します。 PepFlow は、特定のペプチドに対してさまざまな立体構造を生成することにより、AlphaFold2 よりも優れた性能を発揮します。AlphaFold2 は、この問題を解決するように設計されたものではありません。
PepFlow を際立たせているのは、その背後にある技術革新です。たとえば、これは、非常に高度な物理ベースの機械学習モデルであるボルツマン生成器からインスピレーションを得た一般化されたモデルです。
「PepFlow モデリングを使用すると、ペプチドの真のエネルギー状態についての洞察が得られます。」アブディン氏は、「PepFlow の開発には 2 年半かかり、トレーニングにはわずか 1 か月しかかかりませんでしたが、次のフロンティアに進む価値はあり、ペプチドの 1 つの構造のみを予測するモデル 全体として、ペプチドの立体構造を正確かつ効率的にサンプリングできるため、ペプチドのドッキングと設計が向上する可能性があります。ペプチドドッキング法は通常、目的のタンパク質にドッキングされたペプチド立体構造のライブラリーから始まります。ペプチド集合体をより正確に生成すると、このプロセスが改善される可能性があります。
PepFlow は、さまざまな配列が標的タンパク質間の界面で立体構造をとる傾向を評価するために使用することもでき、これを阻害ペプチドの設計に使用することもできます。
図: PepFlow と分子動力学シミュレーションによって生成されたアンサンブルの比較。 (出典: 論文)
PepFlow は AlphaFold2 で改良されていますが、これはモデルの最初のバージョンにすぎないため、制限もあります。PepFlow 有一个显着缺点,与玻尔兹曼生成器不同,PepFlow 缺乏对生成的样本重新加权以达到精确的玻尔兹曼分布的能力。
虽然 PepFlow 能够对生成的样本进行似然计算,但可处理的计算需要使用随机估计器,这会给计算值添加噪声。此外,PepFlow 偶尔会生成高能样本,但无法捕获分子动力学模拟中观察到的全部能量景观。
改进 PepFlow 的一个潜在方法是将开发的模型转移到其他采样框架。在条件设置中使用了标准化流,并使用了不同的采样方法,以促进从玻尔兹曼分布中进行采样。
最近学界开发的流匹配范式,进一步作为以无模拟方式训练连续规范化流模型的替代方法。流动匹配已被有效用于不同分子(包括小分子和蛋白质)的结构采样,并可潜在地用于扩展 PepFlow 框架的有效性。
总之,PepFlow 的设计目标是易于扩展,以考虑其他因素、新信息和潜在用途。
即使只是第一个版本,PepFlow 也是一个全面而有效的模型,具有进一步开发依赖肽结合来激活或抑制生物过程的治疗方法的潜力。
论文链接:https://www.nature.com/articles/s42256-024-00860-4
相关报道:https://phys.org/news/2024-06-deep-outperforms-google-ai -peptide.html
以上がNature サブジャーナル、AlphaFold よりも優れた全原子サンプリング、ペプチド構造を予測する AI 手法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。