タンパク質は生命にとって不可欠であり、ほぼすべての生物学的プロセスで役割を果たします。一方で、それらはニューロン間で信号を伝達し、微視的な侵入者を識別し、免疫反応を活性化することができます。一方、タンパク質は、病気の治療の一環として治療メディエーターとして広く研究されています。したがって、物理的に折りたためる新しいタンパク質構造を生成することにより、細胞経路を利用して疾患を治療する新しい方法への扉が開かれます。
この記事では、スタンフォード大学、マイクロソフト リサーチ、およびその他の機関の研究者が、生体内でのタンパク質のフォールディング プロセスに触発されて、フォールディング拡散 (フォールディング拡散、FoldingDiff) モデルを導入しました。これは、タンパク質の自然な折り畳みプロセスを反映することによってタンパク質の骨格構造を設計します。
具体的には、タンパク質の骨格構造を、構成アミノ酸残基の相対的な向きを捉える一連の連続した角度として記述します。そして、この表現の回転不変性により、複雑な等変ネットワークの必要性が大幅に軽減されます。
この研究では、トランスのバックボーンに基づいてノイズ除去された拡散確率モデルをトレーニングし、このモデルが天然タンパク質と同様の複雑さと構造パターンを持つ非常に現実的なタンパク質構造を無条件に生成できることを実証しました。
一部のネチズンは次のように述べています。このモデルは AlphaFold に競争をもたらすのだろうか。
方法と結果タンパク質は可変長のアミノ酸残基の鎖として理解できます。典型的なアミノ酸は 20 個です。これらの種は、同じ 3 原子 N-C_α-C 骨格を共有していますが、C_α 原子に接続されている異なる側鎖を持っています (通常、R と表示されます、図 1 を参照)。
これらの残基は集合して 3D 構造に折り畳まれるポリマー鎖を形成し、その形状がタンパク質の機能を大きく決定します。これらの折り畳まれた構造は、次の 4 つのレベルを使用して説明できます:
この研究では、複雑な等変ネットワークの必要性を排除しながら、タンパク質の折り畳みの生物学的プロセスを追跡する、簡略化されたタンパク質骨格フレームワークを提案しています。彼らは、長さが N 個のアミノ酸であるタンパク質の骨格を 3 次元座標として見るのではなく、それを 6 つの連続した内部角度のシーケンスとして見ました。つまり、現在の残基の位置が与えられると、6 つの内角のベクトルは次の残基のすべての骨格原子の相対位置を表します。これらの内角は、タンパク質骨格に原子を繰り返し追加し、3D デカルト座標に変換し直すという三角関数を使用して簡単に計算できます。
下の図は実験の結果を示しています。天然構造のラマチャンドラン図 (図 a) には、LH α ヘリックス、RH α ヘリックス、β シートに対応する 3 つの領域が含まれています。ここで生成された構造では、3 つの領域すべてが完全に再現されています (図 3b)。言い換えれば、FoldingDiff はタンパク質骨格内に二次構造要素を生成することができます。さらに、実験では、FoldingDiff モデルが RH α ヘリックスが LH α ヘリックスよりも一般的であることを正しく学習していることが示されています。等変ネットワークを使用した以前の研究では、これら 2 種類のスパイラルを区別できませんでした。
#次の図は、テスト主鎖の二次構造 (4a) と生成された主鎖 (4b) を示しています。二次元ヒストグラムの結果は、生成された構造が、複数のαヘリックス、複数のβシート、およびその 2 つの混合物を含むタンパク質の真の構造を反映していることを示しています。
下の図は、生成された 780 個の構造のうち 111 個 (14.2%) が設計可能であり、それらの scTM スコアが ≥0.5 であることを示しています (図 5a)。これは、Trippe et al. が報告した値 11.8% よりも高いです。また、生成されたメインチェーンはトレーニング例により似ており、設計性が向上する傾向があることもわかります (5b)。
詳細については、原論文をお読みください。
以上がスタンフォードとマイクロソフトは、オープンソースとなっている拡散モデルを使用してタンパク質構造を生成するために提携しました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。