Éditeur | Radis Skin
La prédiction de la structure du complexe protéique joue un rôle important dans le développement de médicaments, la conception d'anticorps et d'autres applications. Cependant, en raison de la précision limitée de la prédiction, les résultats de la prédiction sont souvent incompatibles avec les résultats expérimentaux.
Une équipe de recherche de l'Université de Pékin, du Laboratoire Changping et de l'Université Harvard a proposé ColabDock, un cadre général qui utilise des modèles de prédiction structurelle d'apprentissage en profondeur pour intégrer les contraintes expérimentales de différentes formes et sources sans autre recyclage ou réglage à grande échelle.
ColabDock surpasse HADDOCK et ClusPro en utilisant AlphaFold2 comme modèle de prédiction de structure, non seulement dans les prédictions de structures complexes avec des résidus simulés et des contraintes de surface, mais également dans les prédictions de structure avec des perturbations de déplacement chimique RMN et un marquage covalent de cette manière.
En outre, il peut aider à la prédiction de l’interface anticorps-antigène en simulant les limitations de l’analyse de l’interface.
L'étude s'intitulait « Prédiction de la structure intégrée de l'amarrage protéine-protéine avec des contraintes expérimentales à l'aide de ColabDock » et a été publiée dans « Nature Machine Intelligence » le 5 août 2024.
L'amarrage protéique fournit des informations structurelles importantes pour la compréhension des mécanismes biologiques. Bien que les modèles profonds se soient développés rapidement dans la prédiction de la structure des protéines, la plupart des modèles effectuent des prédictions de manière autonome, ce qui peut entraîner des incohérences entre les contraintes expérimentales et les structures prédites.
Afin de résoudre ce problème, des équipes de recherche de l'Université de Pékin, du laboratoire Changping et d'autres institutions ont proposé un cadre général pour la prédiction de conformation complexe sous contrainte - ColabDock, qui est un amarrage protéine-protéine général guidé par un cadre de contraintes expérimentales clairsemées.
Grâce à la rétropropagation du gradient, cette méthode intègre efficacement les a priori contraints expérimentalement et le paysage énergétique des modèles de prédiction de la structure des protéines basés sur les données, recherchant automatiquement les conformations qui satisfont aux deux tout en tolérant les conflits ou les ambiguïtés dans les contraintes.
ColabDock peut exploiter différentes formes et sources de contraintes expérimentales sans autre recyclage ni ajustement approfondi.
Le cadre contient deux étapes : l'étape de génération et l'étape de prédiction.
Dans la phase de génération, ColabDock utilise ColabDesign, un framework de conception de protéines développé sur la base d'AlphaFold2. Les profils de séquence d'entrée sont optimisés dans l'espace logit pour guider les modèles de prédiction de structure afin de générer des structures complexes basées sur des contraintes et des modèles expérimentaux donnés tout en maximisant les mesures pLDDT et pAE.
Dans la phase de prédiction, la structure est prédite en fonction de la structure complexe générée et du modèle donné. Pour chaque cible, ColabDock effectue plusieurs analyses et génère différentes conformations. La conformation finale a été sélectionnée par un algorithme de machine à vecteurs de support (SVM) classé.
Performances robustes
En guise de preuve de concept, les chercheurs ont adopté AlphaFold2 comme modèle de prédiction de structure dans ColabDock. Bien entendu, d’autres modèles d’apprentissage profond basés sur les données peuvent également être utilisés ici, tels que RoseTTAFold2 et AF-Multimer.
Les chercheurs ont testé ColabDock sur des ensembles de données synthétiques et plusieurs types de contraintes expérimentales, notamment la perturbation du déplacement chimique RMN (CSP), le marquage covalent (CL) et l'analyse de mutation profonde simulée (DMS).
Illustration : performances de ColabDock sur l'ensemble de validation. (Source : Paper)
ColabDock évalue deux types de contraintes, à savoir les contraintes 1v1 et MvN. Le premier se situe au niveau résidu-résidu et les exemples incluent les contraintes de XL-MS. Ce dernier se situe au niveau de l’interface et est pertinent pour les expériences RMN et CL.
Les résultats des tests sur des ensembles de données synthétiques montrent que ColabDock atteint des performances satisfaisantes. De plus, comme prévu, les performances de ColabDock s'améliorent à mesure que le nombre de contraintes augmente.
Même avec peu de contraintes, ColabDock surpasse AF-Multimer sur des ensembles de données de référence et les mêmes paramètres de trame, et converge vers moins de conformations lorsque plus de contraintes sont fournies, démontrant l'application efficace d'informations supplémentaires.
Illustration : Comparaison de ColabDock, HADDOCK et ClusPro sur l'ensemble de référence. (Source : papier)
Par rapport à HADDOCK et ClusPro, ColabDock fonctionne mieux lorsque la qualité des contraintes est plus élevée. Sur les deux ensembles de données expérimentales, ColabDock surpasse toujours HADDOCK et ClusPro quels que soient le nombre et la qualité des contraintes fournies.
Illustration : Analyse des performances et des contraintes de ColabDock sur un ensemble CSP. (Source : article)
Enfin, les chercheurs ont évalué les performances de différentes méthodes d'amarrage sur l'ensemble de données anticorps-antigène. ColabDock a prédit une proportion beaucoup plus élevée de structures de qualité intermédiaire ou supérieure que HADDOCK et ClusPro.
Illustration : Comparaison de ColabDock, HADDOCK et ClusPro sur l'ensemble de référence anticorps-antigène. (Source : article)
Cela montre que ColabDock a une valeur d'application potentielle dans la conception d'anticorps. De plus, ColabDock affiche toujours des performances comparables, voire meilleures, à celles d'AF-Multimer sur le nouvel ensemble de données impartiales.
Limitations et conclusion
ColabDock a également certaines limites. Actuellement, ColabDock ne peut accepter que des distances inférieures à 22 Å, qui sont déterminées par la limite supérieure de la carte de distance dans AlphaFold2. Cette limitation rend le modèle applicable uniquement à un petit sous-ensemble de réactifs XL-MS.
Sans optimisation basée sur les fragments, ColabDock ne peut traiter que des complexes de moins de 1 200 résidus sur une unité de traitement graphique (GPU) NVIDIA A100 en raison d'une mémoire limitée.
De plus, cette méthode peut être très chronophage, notamment pour les gros complexes protéiques. L’utilisation de la version au format à virgule flottante bfloat16 d’AlphaFold2 devrait permettre d’économiser de la mémoire et d’accélérer les calculs.
Je crois qu'à l'avenir, après que les chercheurs l'auront optimisé de manière itérative, en tant que cadre unifié, ColabDock sera en mesure d'aider à combler le fossé entre la science expérimentale et informatique des protéines.
Lien papier :https://www.nature.com/articles/s42256-024-00873-z
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!