準確率達0.96，從序列預測蛋白-配體互作的物理化學約束圖神經網絡-人工智慧-PHP中文網

準確率達0.96，從序列預測蛋白-配體互作的物理化學約束圖神經網絡

編輯 | 蘿蔔皮

在藥物研發中，確定小分子配體對蛋白質的結合親和力和功能效應至關重要。目前的計算方法可以預測這些蛋白質-配體相互作用特性，但如果沒有高解析度的蛋白質結構，通常會失去準確性，並且無法預測功能效應。

莫納什大學和格里菲斯大學的研究人員開發了 PSICHIC（PhySIcoCHemICal graph neural network），這是一個結合物理化學約束的框架，可直接從序列資料解碼相互作用指紋。這使 PSICHIC 能夠解碼蛋白質-配體相互作用背後的機制，實現最先進的準確性和可解釋性。

在沒有結構數據的相同蛋白質-配體對上進行訓練後，PSICHIC 在結合親和力預測方面與領先的基於結構的方法性能相當，甚至超過了它們。

PSICHIC 的可解釋指紋識別了參與相互作用的蛋白質殘基和配體原子，並有助於揭示蛋白質-配體相互作用的選擇性決定因素。

研究以「Physicochemical graph neural network for learning protein–ligand interaction fingerprints from sequence data」為題，於 2024 年 6 月 17 日發佈在《Nature Machine Intelligence》。

準確率達0.96，從序列預測蛋白-配體互作的物理化學約束圖神經網絡

蛋白質-配體親和力預測中的挑戰

在藥物發現中，確定小分子配體對蛋白質的結合親和力和功能效應十分重要，因為配體與特定蛋白質的選擇性相互作用決定了藥物的預期效果。

然而，儘管目前的計算方法能夠預測蛋白質-配體相互作用屬性，但如果沒有高分辨率蛋白質結構，預測準確性往往會降低，而且在預測功能效應方面也存在困難。

基於序列的方法雖然在成本和資源上更具優勢（例如，無需昂貴的實驗結構確定過程），但這些方法通常面臨模式匹配中的過度自由度問題，容易導致過擬合和有限的泛化能力，從而造成與基於結構或複合物的方法之間的性能差距。

物理化學圖神經網絡

莫納什大學和格里菲斯大學的研究團隊開發了PSICHIC（物理化學圖神經網絡），這是一種遵循物理化學原理從序列數據直接解碼蛋白質-配體相互作用指紋的方法。與先前的基於序列的模型不同，PSICHIC 特別結合了物理化學約束，以實現最先進的準確性和可解釋性。

作為一種基於二維序列的方法，PSICHIC 透過應用聚類演算法來產生並在二維圖上施加這些約束，從而使 PSICHIC 能夠主要適應訓練期間決定蛋白質-配體相互作用的合理基本模式。

準確率達0.96，從序列預測蛋白-配體互作的物理化學約束圖神經網絡

性能驗證與比較

在沒有結構數據的相同蛋白質-配體對上進行訓練後，PSICHIC 在結合親和力預測方面與最先進的基於結構和基於複合物的方法相媲美甚至超越了它們。

在 PDBBind v2016 和 PDBBind v2020 資料集上的實驗結果表明，PSICHIC在多項指標上均優於其他基於序列的方法，如 TransCPI、MolTrans 和 DrugBAN 等。

準確率達0.96，從序列預測蛋白-配體互作的物理化學約束圖神經網絡

圖示：PDBBind v2016 和 PDBBind v2020 基準測試中蛋白質-配體結合親和力預測的效能統計摘要。（資料來源：論文）

具體而言，PSICHIC 顯示了更低的預測誤差和更高的相關性指數，尤其在預測準確性和泛化能力方面表現突出。 PSICHIC 在功能效應預測方面實現了高達 0.96 的準確率。

此外，PSICHIC 在結合位點和關鍵配體功能基團的識別方面表現出色。在多個蛋白質-配體複雜結構（如PDB 6K1S和6OXV）的分析中，PSICHIC 能夠準確定位重要的結合殘基和配體功能基團，這驗證了其在序列數據中直接解碼蛋白質-配體相互作用模式的能力。此能力特別體現在其透過序列資料預測蛋白質-配體結合位點和關鍵殘基。

準確率達0.96，從序列預測蛋白-配體互作的物理化學約束圖神經網絡

1. PSICHIC 的可解釋指紋

圖示：利用互動指紋進行虛擬篩選。（來源：論文）

有趣的是，PSICHIC 的可解釋指紋表明，它獲得了僅從序列數據解碼蛋白質-配體相互作用的潛在機制、識別結合位點蛋白質殘基和所涉及的配體原子的能力。即使僅在具有結合親和力標籤而沒有相互作用資訊的序列資料上進行訓練也是如此。

準確率達0.96，從序列預測蛋白-配體互作的物理化學約束圖神經網絡

圖示：利用交互作用指紋進行選擇性分析。（資料來源：論文）研究人員利用PSICHIC 成功篩選出一種新型腺苷A1 受體激動劑（與已知最接近的A1R 激動劑的Tanimoto 相似度為0.2），並分析了腺苷受體亞型之間的配體選擇性。
價值體現
蛋白質-配體相互作用指紋描述了配體和蛋白質殘基之間發生的特定相互作用的特徵。傳統上，這些指紋來自 3D 蛋白質-配體複合物，這是一個昂貴的過程，本文顯示其對結構解析度品質很敏感。
相較之下，PSICHIC 僅利用序列數據，為獲取可解釋的相互作用指紋提供了一種獨特的方法。透過納入約束，PSICHIC 展現出新興能力，使其能夠揭示蛋白質-配體相互作用機制並有效預測相互作用特性。 PSYCHIC 消除了對 3D 資料的需求，為在大規模序列資料庫上進行穩健學習鋪平了道路。
作為概念驗證，該團隊證明了 PSICHIC 可以有效篩選候選藥物並進行選擇性分析。 PSICHIC 只需要序列資料即可運行，有潛力成為藥物發現中普遍有用的工具。研究人員期待它在從頭配體設計中發揮作用，PSICHIC 的可解釋指紋可以整合到其中以優化分子結構。
未來展望
目前，PSICHIC 僅限於分析單一蛋白質的蛋白質-配體交互作用。未來計劃包括將其分析擴展到蛋白質複合物，例如與異三聚體 G 蛋白複合的 GPCR，這可以促進直接從序列數據全面研究蛋白質-配體動力學。
此外，PSICHIC 從序列資料中獲得的強大學習能力為探索變構調節等複雜相互作用鋪平了道路，有助於理解變構配體如何調節蛋白質標靶內的正構配體。
該團隊已將他們的數據、程式碼和最佳化模型提供給更廣泛的科學界。 PSICHIC 已在各個應用領域中證明其穩健性和有效性，在未來發展中具有廣闊的潛力，並有望對虛擬化合物篩選領域和創新小分子療法的設計產生重大影響。
論文連結：https://www.nature.com/articles/s42256-024-00847-1
相關報告：https://phys.org/news/2024-06-ai-tool-rapid-effective-drug .html

以上是準確率達0.96，從序列預測蛋白-配體互作的物理化學約束圖神經網絡的詳細內容。更多資訊請關注PHP中文網其他相關文章！