糖類は自然界で最も豊富な有機物質であり、生命に不可欠です。生理学的および病理学的プロセス中に炭水化物がどのようにタンパク質を調節するかを理解することは、主要な生物学的問題に対処し、新しい治療法を開発する機会を提供する可能性があります。
しかし、糖分子の多様性と複雑さにより、糖とタンパク質の結合部位と相互作用部位を実験的に同定することが困難となっています。
ここでは、中国科学院のチームが、特定のタンパク質構造上の糖結合部位を正確に予測できる深層学習モデルである DeepGlycanSite を開発しました。
DeepGlycanSite は、タンパク質の幾何学的および進化的特性を Transformer アーキテクチャを備えたディープ等変グラフ ニューラル ネットワークに統合し、そのパフォーマンスは以前の高度な手法を大幅に上回り、さまざまな糖分子の結合部位を効果的に予測できます。
突然変異誘発研究と組み合わせると、DeepGlycanSite は重要な G タンパク質共役受容体のグアノシン-5'-二リン酸認識部位を明らかにします。
これらの発見は、糖結合部位の予測における DeepGlycanSite の価値を実証し、治療上重要なタンパク質の糖調節の背後にある分子機構への洞察を提供することができます。
この研究は「DeepGlycanSiteによる高精度の炭水化物結合部位予測」と題され、2024年6月17日に「Nature Communications」に掲載されました。
糖はあらゆる生物の細胞表面に遍在し、レクチン、抗体、酵素、トランスポーターなどのさまざまなタンパク質ファミリーと相互作用して、免疫応答、細胞分化、神経発達などの重要な生物学的プロセスを調節します。炭水化物とタンパク質の間の相互作用メカニズムを理解することは、炭水化物医薬品を開発するための基礎です。
しかし、炭水化物の構造の多様性と複雑さ、特にタンパク質との結合部位の多様性は、実験データの取得と薬剤設計に課題をもたらしています。
イラスト: 糖分子の複雑さと糖結合部位の多様性。 (出典: 論文)
これまで、従来の結合部位予測法は、複雑な構造を持ち、サイズの変化が大きい糖分子には適していませんでした。これは、高解像度の糖タンパク質複合体構造データの不足と相まって、予測モデルのパフォーマンスを制限します。
近年、タンパク質データバンク (PDB) とオープングライコミックスリソースの急速な発展により、学術コミュニティは 19,000 を超えるそのような複合体の構造データを蓄積しました。こうした高品質なデータの増加により、AI技術を活用した正確な糖結合部位予測モデルの開発が可能となり、糖類薬物の発見と最適化プロセスの加速が期待されます。
最新の研究で、中国科学院チームは、標的タンパク質構造と糖結合部位を正確に予測できるディープ等変グラフニューラルネットワーク(EGNN)モデルであるDeepGlycanSiteを導入した。
イラスト: DeepGlycanサイトの概要。 (出典: 論文)
チームは、DeepGlycanSite でタンパク質を残基レベルのグラフィック表現として表示するために、残基内および残基間の方向や距離、進化情報などの幾何学的特徴を活用しました。自己注意メカニズムを備えた Transformer ブロックと組み合わせることで、特徴抽出と複雑な関係の発見を強化します。
研究者らは、100 を超える固有の糖結合タンパク質を含む独立したテストセットで、DeepGlycanSite を現在の最先端の計算手法と比較しました。
結果は、DeepGlycanSite (0.625) の平均 Matthews 相関係数 (MCC) が StackCBPred (0.018) の 30 倍以上であり、他の配列ベースの予測方法をはるかに上回っていることを示しています。
従来のリガンド結合部位法では、疎水性やサイズが小さいために単純な糖分子の結合部位が除外される場合がありますが、DeepGlycanSite はこれらの部位を効果的に特定できます。
図: さまざまな糖結合部位の予測におけるモデルのパフォーマンスの比較。 (出典: 論文)
さらに、DeepGlycanSite はタンパク質上の複数の糖結合部位の予測にも優れています。これは、多価複合糖質が糖とタンパク質の相互作用や生物学的プロセスの制御にどのような影響を与えるかを理解する上で非常に価値があります。たとえば、多価複合糖質は、糖分子とレクチンの間の相互作用に影響を与える化学ツールおよび薬剤候補として設計されています。
タンパク質の配列や構造情報のみを使用する従来の方法とは異なり、DeepGlycanSite は、優れたパフォーマンスの鍵となる可能性のあるタンパク質の幾何学的情報と進化的特性を十分に考慮します。
さらに、クエリ糖分子の化学構造を考慮すると、DeepGlycanSite はその特異的結合部位を予測できます。
図: 糖の特異的結合部位の予測をクエリします。 (出典: 論文)
研究者らは、機能的に重要な G タンパク質共役受容体 (GPCR) への DeepGlycanSite の応用を研究しました。 AlphaFold2 によって予測されたタンパク質構造と炭水化物の化学構造を使用して、DeepGlycanSite はヒト P2Y14 上の GDP-Fuc の特異的結合部位を検出することに成功しました。
AlphaFold2 の予測側鎖の品質を改善する必要がある一方で、DeepGlycanSite はタンパク質構造の精度にあまり依存せず、予測されたタンパク質構造を使用して糖-タンパク質相互作用についての洞察を提供できます。
要約すると、独立したテストセットとインビトロのケーススタディでの DeepGlycanSite の検証は、DeepGlycanSite が糖結合部位の予測に効果的なツールであることを示しています。研究者は DeepGlycanSite を使用して標的タンパク質上の糖結合ポケットを予測することができ、それによって糖とタンパク質の相互作用の理解を進めることができます。
糖は生物学的機能において重要な役割を果たしており、DeepGlycanSite は糖分子と糖結合タンパク質の生物学的機能の分析に役立つだけでなく、糖薬物の開発にも強力なツールを提供します。
論文リンク:https://www.nature.com/articles/s41467-024-49516-2
以上が中国科学院チームのTransformer深層学習モデルは、従来の方法の30倍の精度で糖とタンパク質の相互作用部位を予測するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。