医薬品開発では、タンパク質に対する小分子リガンドの結合親和性と機能的影響を決定することが重要です。現在の計算手法では、これらのタンパク質とリガンドの相互作用特性を予測できますが、高解像度のタンパク質構造がなければ、多くの場合、精度が失われ、機能的効果を予測できません。
モナッシュ大学とグリフィス大学の研究者は、相互作用フィンガープリントをデコードする配列データから物理化学的制約を直接結合するフレームワークであるPSICHIC (PhySIcoCHhemICal グラフ ニューラル ネットワーク) を開発しました。これにより、PSICHIC はタンパク質とリガンドの相互作用の背後にあるメカニズムを解読し、最先端の精度と解釈可能性を達成することができます。
構造データを使用せずに同じタンパク質-リガンドのペアでトレーニングしたPSICHICは、結合親和性予測において主要な構造ベースの方法と同等、またはそれを上回りました。
PSICHIC の解釈可能なフィンガープリントは、相互作用に関与するタンパク質残基とリガンド原子を特定し、タンパク質-リガンド相互作用の選択性決定要因を明らかにするのに役立ちます。
この研究は「シーケンスデータからタンパク質-リガンド相互作用フィンガープリントを学習するための物理化学グラフニューラルネットワーク」と題され、2024年6月17日に「Nature Machine Intelligence」に掲載されました。
タンパク質-リガンドの親和性予測チャレンジ創薬プロセスでは、特定のタンパク質とリガンドの選択的相互作用が決定するため、タンパク質に対する小分子リガンドの結合親和性と機能的影響を理解することが重要です。期待される薬の効果。
しかし、現在の計算手法ではタンパク質とリガンドの相互作用特性を予測することは可能ですが、高解像度のタンパク質構造がないと予測精度が低下することが多く、機能効果の予測も困難です。
シーケンスベースの方法は、コストとリソースの点でより多くの利点がありますが(たとえば、高価な実験による構造決定プロセスを必要としない)、これらの方法は、パターンマッチングにおける過剰な自由度の問題に直面することが多く、簡単に過剰適合につながる可能性があります。一般化機能が限られているため、構造ベースまたは複合ベースの方法と比較してパフォーマンスのギャップが生じます。
物理化学グラフ ニューラル ネットワーク
モナッシュ大学とグリフィス大学の研究チームは、物理的および化学的な身体相互作用に従って配列データからタンパク質-リガンドを直接解読する方法である PSICHIC (物理化学グラフ ニューラル ネットワーク) を開発しました。指紋認証方式。以前の配列ベースのモデルとは異なり、PSICHIC は物理化学的制約を独自に組み込んで、最先端の精度と解釈可能性を実現します。
2D シーケンスベースのメソッドとして、PSICHIC はクラスタリング アルゴリズムを適用することでこれらの制約を生成し、2D プロットに課します。これにより、PSICHIC はトレーニング中にタンパク質とリガンドの相互作用を決定する合理的な基礎パターンに主に適応できます。
イラスト: PSICHIC の概要(出典: 論文)
パフォーマンスの検証と比較
構造データなしで同じタンパク質-リガンドペアでトレーニングした後、PSICHIC は結合親和性予測で優れたパフォーマンスを示します- アート構造ベースの手法と複合ベースの手法は、それらに匹敵するか、さらにはそれを上回ります。
PDBBind v2016 および PDBBind v2020 データセットの実験結果は、PSICHIC が複数の指標において TransCPI、MolTrans、DrugBAN などの他の配列ベースの手法よりも優れていることを示しています。
イラスト:PDBBind v2016 および PDBBind v2020 ベンチマークでのタンパク質-リガンド結合親和性予測のパフォーマンス統計概要。 (出典: 論文)
具体的には:
また:
興味深いことに、PSICHIC の解釈可能なフィンガープリントは、PSICHIC が配列データのみからタンパク質-リガンド相互作用の根底にあるメカニズムを解読し、結合部位タンパク質残基と関与するリガンドの原子能力を特定する能力を獲得していることを示しています。結合親和性ラベルを持ち、相互作用情報を持たない配列データ。
価値将来の展望
以上がNature サブジャーナル、精度 96% の AI が配列からタンパク質とリガンドの相互作用を予測の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。