Dans le développement de médicaments, il est crucial de déterminer l'affinité de liaison et l'effet fonctionnel des ligands de petites molécules sur les protéines. Les méthodes informatiques actuelles peuvent prédire ces propriétés d’interaction protéine-ligand, mais sans structures protéiques à haute résolution, la précision est souvent perdue et les effets fonctionnels ne peuvent être prédits.
Des chercheurs de l'Université Monash et de l'Université Griffith ont développé PSICHIC (PhySIcoCHhemICal graph neural network), un cadre qui combine des contraintes physicochimiques pour décoder les empreintes digitales d'interaction directement à partir des données de séquence. Cela permet à PSICHIC de décoder les mécanismes à l’origine des interactions protéine-ligand, atteignant ainsi une précision et une interprétabilité de pointe.
Formé sur les mêmes paires protéine-ligand sans données structurelles, PSICHIC fonctionne à égalité, voire dépasse, les principales méthodes basées sur la structure dans les prédictions d'affinité de liaison.
Les empreintes digitales interprétables de PSICHIC identifient les résidus protéiques et les atomes de ligand impliqués dans les interactions et aident à révéler les déterminants de la sélectivité des interactions protéine-ligand.
La recherche s'intitulait « Réseau neuronal de graphes physicochimiques pour l'apprentissage des empreintes digitales d'interaction protéine-ligand à partir de données de séquence » et a été publiée dans « Nature Machine Intelligence » le 17 juin 2024.
Défis liés à la prédiction de l'affinité protéine-ligandDans la découverte de médicaments, il est important de déterminer l'affinité de liaison et l'effet fonctionnel des ligands à petites molécules sur les protéines, car l'interaction sélective du ligand avec une protéine spécifique détermine l'effet attendu. effet du médicament.
Cependant, bien que les méthodes informatiques actuelles soient capables de prédire les propriétés d’interaction protéine-ligand, sans structures protéiques à haute résolution, la précision de la prédiction est souvent réduite et il existe également des difficultés à prédire les effets fonctionnels.
Bien que les méthodes basées sur les séquences soient plus avantageuses en termes de coût et de ressources (par exemple, aucun processus coûteux de détermination de structure expérimentale n'est requis), ces méthodes sont généralement confrontées au problème de degrés de liberté excessifs dans la correspondance de modèles, ce qui conduit facilement à un surajustement et capacités de généralisation limitées, créant ainsi un écart de performance par rapport aux méthodes basées sur la structure ou les composites.
Physical Chemistry Graph Neural Network
Une équipe de recherche de l'Université Monash et de l'Université Griffith a développé PSICHIC (Physical Chemistry Graph Neural Network), une méthode pour décoder directement les protéines-ligands à partir de données de séquence selon les principes physiques et chimiques des empreintes digitales d'interaction corporelle. méthode. Contrairement aux modèles précédents basés sur des séquences, PSICHIC intègre spécifiquement des contraintes physico-chimiques pour atteindre une précision et une interprétabilité de pointe.
En tant que méthode basée sur des séquences 2D, PSICHIC génère et impose ces contraintes sur un tracé 2D en appliquant un algorithme de clustering, permettant à PSICHIC de s'adapter principalement aux modèles rationnels sous-jacents qui déterminent les interactions protéine-ligand pendant l'entraînement.
Validation et comparaison des performancesAprès un entraînement sur les mêmes paires protéine-ligand sans données structurelles, PSICHIC rivalise ou même surpasse les méthodes de pointe basées sur la structure et les complexes dans les prédictions d'affinité de liaison.
Les résultats expérimentaux sur les ensembles de données PDBBind v2016 et PDBBind v2020 montrent que PSICHIC surpasse les autres méthodes basées sur des séquences, telles que TransCPI, MolTrans et DrugBAN, sur plusieurs indicateurs.
Graphique : Résumé des statistiques de performances pour les prédictions d'affinité de liaison protéine-ligand sur les benchmarks PDBBind v2016 et PDBBind v2020. (Source : article)Plus précisément, PSICHIC montre une erreur de prédiction plus faible et un indice de corrélation plus élevé, notamment en termes de précision de prédiction et de capacité de généralisation. PSICHIC atteint une précision allant jusqu'à 0,96 dans la prédiction des effets fonctionnels.
De plus, PSICHIC excelle dans l'identification des sites de liaison et des groupes fonctionnels clés du ligand. Dans l'analyse de plusieurs structures complexes protéine-ligand (telles que PDB 6K1S et 6OXV), PSICHIC a pu localiser avec précision d'importants résidus de liaison et des groupes fonctionnels de ligands, ce qui a validé sa capacité à décoder directement les protéines dans les données de séquence. ligands pour interagir les uns avec les autres. Cette capacité se reflète particulièrement dans sa capacité à prédire les sites de liaison protéine-ligand et les résidus clés à partir des données de séquence.
1. Empreinte digitale interprétable de PSICHICIllustration : Dépistage virtuel par empreintes digitales interactives. (Source : article)
Fait intéressant, les empreintes digitales interprétables de PSICHIC montrent qu'il obtient la capacité de décoder le mécanisme sous-jacent des interactions protéine-ligand à partir des seules données de séquence, en identifiant les résidus protéiques du site de liaison et les atomes de ligand impliqués. Cela est vrai même lors d'un entraînement uniquement sur des données de séquence avec des étiquettes d'affinité de liaison et aucune information d'interaction.
Illustration : Analyse de sélectivité à l’aide d’empreintes digitales d’interaction. (Source : article) Les chercheurs ont utilisé PSICHIC pour sélectionner avec succès un nouvel agoniste du récepteur de l'adénosine A1 (la similarité de Tanimoto avec l'agoniste A1R connu le plus proche est de 0,2) et ont analysé les différences entre les sous-types de sélectivité du récepteur de l'adénosine.Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!