医薬品開発では、タンパク質に対する小分子リガンドの結合親和性と機能的影響を決定することが重要です。現在の計算手法では、これらのタンパク質とリガンドの相互作用特性を予測できますが、高解像度のタンパク質構造がなければ、多くの場合、精度が失われ、機能的効果を予測できません。
モナシュ大学とグリフィス大学の研究者は、物理化学的制約を組み合わせて配列データから直接相互作用フィンガープリントを解読するフレームワークである PSICHIC (PhySIcoCHhemICal グラフ ニューラル ネットワーク) を開発しました。これにより、PSICHIC はタンパク質とリガンドの相互作用の背後にあるメカニズムを解読し、最先端の精度と解釈可能性を実現できます。
構造データを使用せずに同じタンパク質とリガンドのペアでトレーニングされた PSICHIC は、結合親和性予測において主要な構造ベースの方法と同等、またはそれを超えています。
PSICHIC の解釈可能なフィンガープリントは、相互作用に関与するタンパク質残基とリガンド原子を特定し、タンパク質-リガンド相互作用の選択性決定要因を明らかにするのに役立ちます。
この研究は「配列データからタンパク質とリガンドの相互作用フィンガープリントを学習するための物理化学グラフニューラルネットワーク」というタイトルで、2024年6月17日に「Nature Machine Intelligence」に掲載されました。
タンパク質-リガンド親和性予測における課題創薬においては、特定のタンパク質とリガンドの選択的相互作用が期待される結果を決定するため、タンパク質に対する小分子リガンドの結合親和性と機能的効果を決定することが重要です。薬の影響。
しかし、現在の計算手法ではタンパク質とリガンドの相互作用特性を予測することは可能ですが、高解像度のタンパク質構造がなければ、予測精度が低下することが多く、機能効果を予測することも困難です。
シーケンスベースの方法は、コストとリソースの点でより有利ですが(たとえば、高価な実験的構造決定プロセスが必要ありません)、これらの方法は通常、パターンマッチングにおける過剰な自由度の問題に直面しており、それが簡単にオーバーフィッティングにつながり、一般化機能が限られているため、構造ベースまたは複合ベースの方法と比較してパフォーマンスのギャップが生じます。
物理化学グラフ ニューラル ネットワーク
モナッシュ大学とグリフィス大学の研究チームは、物理的および化学的な身体相互作用に従って配列データからタンパク質-リガンドを直接解読する方法である PSICHIC (物理化学グラフ ニューラル ネットワーク) を開発しました。指紋認証方式。以前の配列ベースのモデルとは異なり、PSICHIC には物理化学的制約が特に組み込まれており、最先端の精度と解釈可能性を実現しています。
2D シーケンスベースのメソッドとして、PSICHIC はクラスタリング アルゴリズムを適用することでこれらの制約を生成し、2D プロットに課します。これにより、PSICHIC はトレーニング中にタンパク質とリガンドの相互作用を決定する合理的な基礎パターンに主に適応できます。
パフォーマンスの検証と比較構造データを使用せずに同じタンパク質-リガンドペアでトレーニングした後、PSICHIC は結合親和性予測において最先端の構造ベースおよび複合体ベースの方法に匹敵するか、さらにはそれを上回ります。
PDBBind v2016 および PDBBind v2020 データセットの実験結果は、PSICHIC が複数の指標において TransCPI、MolTrans、DrugBAN などの他の配列ベースの手法よりも優れていることを示しています。
グラフィック: PDBBind v2016 および PDBBind v2020 ベンチマークでのタンパク質-リガンド結合親和性予測のパフォーマンス統計の概要。 (出典: 論文)具体的には、PSICHICは、特に予測精度と汎化能力の点で、予測誤差が低く、相関指数が高いことが示されています。 PSICHIC は、機能効果予測において最大 0.96 の精度を達成します。
さらに、PSICHICは、結合部位と主要なリガンド官能基の同定において優れています。複数のタンパク質-リガンド複合体構造 (PDB 6K1S や 6OXV など) の解析において、PSICHIC は重要な結合残基とリガンド官能基を正確に特定することができ、配列データ内のタンパク質を直接解読する能力を検証しました。リガンドは相互作用します。この機能は、配列データからタンパク質とリガンドの結合部位や重要な残基を予測する機能に特に反映されています。
1. PSICHIC の解釈可能な指紋イラスト: インタラクティブな指紋を使用した仮想スクリーニング。 (出典: 論文)
興味深いことに、PSICHIC の解釈可能なフィンガープリントは、PSICHIC が配列データのみからタンパク質-リガンド相互作用の根底にあるメカニズムを解読し、結合部位のタンパク質残基と関与するリガンド原子を特定する能力を獲得していることを示しています。これは、結合親和性ラベルを持ち、相互作用情報を持たない配列データのみでトレーニングする場合にも当てはまります。
図: 相互作用フィンガープリントを使用した選択性分析。 (出典: 論文) 研究者らは、PSICHIC を使用して新しいアデノシン A1 受容体アゴニストのスクリーニングに成功し (最も近い既知の A1R アゴニストに対するタニモトの類似性は 0.2)、アデノシン受容体リガンドのサブタイプ間の違いを分析しました。以上が0.96 の精度で、物理的および化学的制約グラフ ニューラル ネットワークを使用して、配列からタンパク質とリガンドの相互作用を予測します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。