Table des matières
Background
Method
Effet
Summary
Maison Périphériques technologiques IA Première mondiale : le nouvel algorithme d'IA open source de Molecular Heart permet de surmonter les problèmes de prédiction des chaînes latérales des protéines et de conception de séquences

Première mondiale : le nouvel algorithme d'IA open source de Molecular Heart permet de surmonter les problèmes de prédiction des chaînes latérales des protéines et de conception de séquences

Jun 05, 2023 pm 06:10 PM
ai 算法

La formation de la structure et de la fonction des protéines dépend en grande partie de l'interaction entre les atomes de la chaîne latérale. Par conséquent, une prédiction précise de la chaîne latérale des protéines (PSCP) est un maillon clé pour résoudre les problèmes de prédiction de la structure des protéines et de conception des protéines. Cependant, les prédictions précédentes sur la structure des protéines se concentraient principalement sur la structure de la chaîne principale, et la prédiction de la structure de la chaîne latérale a toujours été un problème difficile qui n'a pas été complètement résolu.

Récemment, l'équipe Molecular Heart Xu Jinbo a lancé une nouvelle architecture profonde PSCP, AttnPacker, qui a réalisé des améliorations significatives en termes de vitesse, d'efficacité de la mémoire et de précision globale. Il s'agit actuellement de l'algorithme de prédiction de structure de chaîne latérale le plus connu et du premier. le monde. Un algorithme d’IA capable d’effectuer simultanément la prédiction des chaînes latérales des protéines et la conception des séquences.

L'article a été publié dans les Actes de la National Academy of Sciences (PNAS), et son modèle pré-entraîné, son code source et ses scripts d'inférence ont été open source sur Github.

全球首创 :分子之心开源新AI算法,攻克蛋白质侧链预测与序列设计难题

  • Lien papier : https://www.pnas.org/doi/10.1073/pnas.2216438120#supplementary-materials
  • Lien open source :https:/ / github.com/MattMcPartlon/AttnPacker

Background

Les protéines sont constituées de plusieurs acides aminés et leurs structures sont divisées en chaînes principales et chaînes latérales. Les différences dans les chaînes latérales ont un impact énorme sur la structure et la fonction des protéines, notamment sur l’activité biologique. Grâce à une compréhension claire de la structure des chaînes latérales, les scientifiques peuvent déterminer avec plus de précision la structure tridimensionnelle des protéines, analyser les interactions protéine-protéine et mener une conception rationnelle des protéines. Lorsqu'ils sont appliqués au domaine de la conception de médicaments, les scientifiques peuvent trouver rapidement et plus précisément des sites de liaison appropriés pour les médicaments et les récepteurs, et même optimiser ou concevoir des sites de liaison selon les besoins. Dans le domaine de l'optimisation des enzymes, les scientifiques peuvent optimiser les séquences. La transformation permet plusieurs chaînes latérales ; participer à des réactions catalytiques pour obtenir des effets catalytiques plus efficaces et spécifiques.

La plupart des algorithmes actuels de prédiction de la structure des protéines se concentrent principalement sur l'analyse structurelle de la chaîne principale, mais la prédiction de la structure de la chaîne latérale des protéines reste un problème qui n'a pas été complètement surmonté. Qu’il s’agisse d’algorithmes populaires de prédiction de la structure des protéines tels qu’AlphaFold2 ou d’algorithmes axés sur la prédiction de la structure des chaînes latérales tels que DLPacker et RosettaPacker, la précision ou la vitesse ne sont pas satisfaisantes. Cela impose également des limites à la conception des protéines.

Les méthodes traditionnelles, telles que RosettaPacker, utilisent principalement des méthodes d'optimisation énergétique, en regroupant d'abord la distribution des atomes de la chaîne latérale, puis en recherchant dans le groupe des chaînes latérales un acide aminé spécifique pour trouver la combinaison avec la plus petite énergie. Ces méthodes diffèrent principalement du choix du chercheur en matière de bibliothèques de rotamères, de fonctions énergétiques et de procédures de minimisation de l'énergie, avec une précision limitée par l'utilisation d'heuristiques de recherche et de procédures d'échantillonnage discret. Il existe également dans l'industrie des méthodes de prédiction de chaîne latérale basées sur l'apprentissage profond, telles que DLPacker, qui formule PSCP comme un problème de conversion d'image en image et adopte une structure de modèle U-net. Cependant, la précision et la rapidité des prévisions ne sont toujours pas idéales.

Method

AttnPacker est une méthode d'apprentissage en profondeur de bout en bout pour prédire les coordonnées des chaînes latérales des protéines. Il simule conjointement les interactions des chaînes latérales, avec des structures de chaînes latérales directement prédites qui sont plus physiquement réalisables, avec moins de collisions atomiques et des longueurs et angles de liaison plus idéaux.

Plus précisément, AttnPacker introduit une architecture de convertisseur de carte de profondeur qui exploite les aspects géométriques et relationnels de PSCP. Inspiré par AlphaFold2, Molecular Heart propose des mises à jour de triangles sensibles à la position pour optimiser les caractéristiques par paires à l'aide d'un cadre basé sur des graphiques pour calculer l'attention des triangles et les mises à jour multiplicatives. Avec cette approche, AttnPacker dispose de beaucoup moins de mémoire et d'un modèle de capacité plus élevée. De plus, Molecular Heart explore plusieurs mécanismes d'attention équivariants SE (3) et propose une architecture de transformateur équivariant pour l'apprentissage à partir de points 3D.

全球首创 :分子之心开源新AI算法,攻克蛋白质侧链预测与序列设计难题

AttnPacker exécute le processus. Les coordonnées et la séquence du squelette protéique sont utilisées comme entrée, et la carte de caractéristiques spatiales et la base équivariable sont dérivées sur la base des informations de coordonnées. La carte de caractéristiques est traitée par le module de transformation graphique invariant, puis transmise à un transformateur TFN équivariant qui génère les coordonnées de chaîne latérale prédites, les scores de confiance pour chaque résidu et les séquences de conception facultatives. Les coordonnées prédites sont post-traitées pour supprimer tous les conflits spatiaux et garantir une géométrie idéalisée.

Effet

En termes de performances de prédiction, AttnPacker montre des améliorations en termes de précision et d'efficacité pour les structures de base naturelles et non naturelles. Dans le même temps, la faisabilité physique est assurée, les écarts par rapport aux longueurs et angles de liaison idéaux sont négligeables et un encombrement stérique atomique minimal est produit.

Molecular Heart effectue des tests comparatifs sur AttnPacker et les méthodes de pointe actuelles - SCWRL4, FASPR, RosettaPacker et DLPacker sur les ensembles de données de base de protéines naturelles et non natives CASP13 et CASP14. Les résultats montrent qu'AttnPacker surpasse considérablement les méthodes traditionnelles de prédiction des chaînes latérales des protéines sur les squelettes natifs CASP13 et CASP14, avec des RMSD de reconstruction moyens inférieurs de plus de 18 % à la méthode sous-optimale sur chaque ensemble de tests. AttnPacker surpasse également la méthode d'apprentissage en profondeur DLPacker, réduisant le RMSD moyen de plus de 11 % tout en améliorant considérablement la précision des dièdres de la sidechain. En plus de la précision, AttnPacker a beaucoup moins de collisions atomiques que les autres méthodes.

全球首创 :分子之心开源新AI算法,攻克蛋白质侧链预测与序列设计难题

Les résultats de prédiction de la structure de la chaîne latérale de chaque algorithme sur les protéines cibles CASP13 et CASP14 lorsque la structure naturelle de la chaîne principale est donnée. Les astérisques indiquent que les valeurs moyennes de conflit sont inférieures à la structure native : 56,0, 5,9 et 0,4 pour CASP13 et 80,4, 7,9 et 2,5 pour CASP14.

Sur les backbones non natifs CASP13 et CASP14, AttnPacker est également nettement meilleur que les autres méthodes, et les collisions atomiques sont également nettement inférieures à celles des autres méthodes.

全球首创 :分子之心开源新AI算法,攻克蛋白质侧链预测与序列设计难题

Les résultats de prédiction de la structure de la chaîne latérale de chaque algorithme sur les protéines cibles CASP13 et CASP14 lorsque la structure du squelette non naturelle est donnée. Les astérisques indiquent que les valeurs moyennes de conflit sont inférieures aux structures natives correspondantes : 34,6, 2,2, 0,5 pour CASP13 et 40,0, 2,7, 0,7 pour CASP14.

Abandonne de manière innovante les bibliothèques de rotamères discrètes et les étapes de recherche conformationnelle et d'échantillonnage coûteuses en termes de calcul, et combine directement la géométrie 3D de la chaîne principale pour calculer toutes les coordonnées de la chaîne latérale en parallèle. Par rapport à la méthode basée sur l'apprentissage profond DLPacker et à la méthode informatique traditionnelle RosettaPacker, AttnPacker a considérablement amélioré l'efficacité informatique et réduit le temps d'inférence de plus de 100 fois.

Comparaison temporelle des différentes méthodes PSCP. Reconstruction des temps relatifs des atomes de la chaîne latérale pour les 83 protéines cibles CASP13.

AttnPacker fonctionne tout aussi bien dans la conception de protéines. Molecular Heart a formé une variante d'AttnPacker pour la co-conception qui atteint des taux de récupération de séquence native comparables aux méthodes de pointe actuelles tout en produisant également des assemblages très précis. La validation de la simulation Rosetta montre que les structures conçues par AttnPacker produisent généralement des énergies Rosetta subnatives (inférieures).

全球首创 :分子之心开源新AI算法,攻克蛋白质侧链预测与序列设计难题

En utilisant les indicateurs ESMFold scTM et plDDT pour comparer la séquence protéique native et la séquence générée par AttnPacker afin d'évaluer la qualité de la génération d'AttnPacker, les résultats ont montré une forte corrélation.

En plus de son efficacité et de son efficience étonnantes, AttnPaker a également une valeur très pratique : il est très simple à utiliser. AttnPaker ne nécessite qu'un fichier de structure protéique pour s'exécuter. En revanche, OPUS-Rota4 (28) nécessite une représentation voxel de l'environnement atomique de DLPacker, une logique, une structure secondaire de trRosetta100 et des fichiers de contraintes de la sortie OPUS-CM. De plus, étant donné qu'AttnPacker prédit directement les coordonnées de la chaîne latérale, le résultat est entièrement différenciable, ce qui facilite les tâches de prédiction en aval telles que l'optimisation ou les interactions protéine-protéine. "Les avantages d'un bon effet de prédiction, d'une efficacité élevée et d'une facilité d'utilisation sont propices à une utilisation généralisée d'AttnPacker dans les domaines de la recherche et de l'industrie", a déclaré le professeur Xu Jinbo.

Summary

1 AttnPacker est un modèle équivariant SE (3) utilisé pour prédire directement les coordonnées de séquence et de chaîne latérale, qui peut être utilisé. Il s’agit d’un travail pionnier pour prédire les structures des chaînes latérales des protéines et peut également être utilisé pour la conception de séquences protéiques.

2 La précision d'AttnPacker est meilleure que les autres méthodes, son efficacité est grandement améliorée et elle est extrêmement simple à utiliser.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
Will R.E.P.O. Vous avez un jeu croisé?
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Ligne de commande de l'arrêt CentOS Ligne de commande de l'arrêt CentOS Apr 14, 2025 pm 09:12 PM

La commande de fermeture CENTOS est arrêtée et la syntaxe est la fermeture de [options] le temps [informations]. Les options incluent: -H Arrêtez immédiatement le système; -P éteignez l'alimentation après l'arrêt; -r redémarrer; -t temps d'attente. Les temps peuvent être spécifiés comme immédiats (maintenant), minutes (minutes) ou une heure spécifique (HH: mm). Des informations supplémentaires peuvent être affichées dans les messages système.

Comment vérifier la configuration de CentOS HDFS Comment vérifier la configuration de CentOS HDFS Apr 14, 2025 pm 07:21 PM

Guide complet pour vérifier la configuration HDFS dans les systèmes CentOS Cet article vous guidera comment vérifier efficacement la configuration et l'état de l'exécution des HDF sur les systèmes CentOS. Les étapes suivantes vous aideront à bien comprendre la configuration et le fonctionnement des HDF. Vérifiez la variable d'environnement Hadoop: Tout d'abord, assurez-vous que la variable d'environnement Hadoop est correctement définie. Dans le terminal, exécutez la commande suivante pour vérifier que Hadoop est installé et configuré correctement: HadoopVersion Check HDFS Fichier de configuration: Le fichier de configuration de base de HDFS est situé dans le répertoire / etc / hadoop / conf / le répertoire, où Core-site.xml et hdfs-site.xml sont cruciaux. utiliser

Quelles sont les méthodes de sauvegarde pour Gitlab sur Centos Quelles sont les méthodes de sauvegarde pour Gitlab sur Centos Apr 14, 2025 pm 05:33 PM

La politique de sauvegarde et de récupération de GitLab dans le système CentOS afin d'assurer la sécurité et la récupérabilité des données, Gitlab on CentOS fournit une variété de méthodes de sauvegarde. Cet article introduira plusieurs méthodes de sauvegarde courantes, paramètres de configuration et processus de récupération en détail pour vous aider à établir une stratégie complète de sauvegarde et de récupération de GitLab. 1. MANUEL BACKUP Utilisez le Gitlab-RakegitLab: Backup: Créer la commande pour exécuter la sauvegarde manuelle. Cette commande sauvegarde des informations clés telles que le référentiel Gitlab, la base de données, les utilisateurs, les groupes d'utilisateurs, les clés et les autorisations. Le fichier de sauvegarde par défaut est stocké dans le répertoire / var / opt / gitlab / backups. Vous pouvez modifier / etc / gitlab

Comment est la prise en charge du GPU pour Pytorch sur Centos Comment est la prise en charge du GPU pour Pytorch sur Centos Apr 14, 2025 pm 06:48 PM

Activer l'accélération du GPU Pytorch sur le système CentOS nécessite l'installation de versions CUDA, CUDNN et GPU de Pytorch. Les étapes suivantes vous guideront tout au long du processus: CUDA et CUDNN Installation détermineront la compatibilité de la version CUDA: utilisez la commande NVIDIA-SMI pour afficher la version CUDA prise en charge par votre carte graphique NVIDIA. Par exemple, votre carte graphique MX450 peut prendre en charge CUDA11.1 ou plus. Téléchargez et installez Cudatoolkit: visitez le site officiel de Nvidiacudatoolkit et téléchargez et installez la version correspondante selon la version CUDA la plus élevée prise en charge par votre carte graphique. Installez la bibliothèque CUDNN:

Explication détaillée du principe docker Explication détaillée du principe docker Apr 14, 2025 pm 11:57 PM

Docker utilise les fonctionnalités du noyau Linux pour fournir un environnement de fonctionnement d'application efficace et isolé. Son principe de travail est le suivant: 1. Le miroir est utilisé comme modèle en lecture seule, qui contient tout ce dont vous avez besoin pour exécuter l'application; 2. Le Système de fichiers Union (UnionFS) empile plusieurs systèmes de fichiers, ne stockant que les différences, l'économie d'espace et l'accélération; 3. Le démon gère les miroirs et les conteneurs, et le client les utilise pour l'interaction; 4. Les espaces de noms et les CGROUP implémentent l'isolement des conteneurs et les limitations de ressources; 5. Modes de réseau multiples prennent en charge l'interconnexion du conteneur. Ce n'est qu'en comprenant ces concepts principaux que vous pouvez mieux utiliser Docker.

CentOS installe MySQL CentOS installe MySQL Apr 14, 2025 pm 08:09 PM

L'installation de MySQL sur CENTOS implique les étapes suivantes: Ajout de la source MySQL YUM appropriée. Exécutez la commande YUM Install MySQL-Server pour installer le serveur MySQL. Utilisez la commande mysql_secure_installation pour créer des paramètres de sécurité, tels que la définition du mot de passe de l'utilisateur racine. Personnalisez le fichier de configuration MySQL selon les besoins. Écoutez les paramètres MySQL et optimisez les bases de données pour les performances.

Comment afficher les journaux Gitlab sous Centos Comment afficher les journaux Gitlab sous Centos Apr 14, 2025 pm 06:18 PM

Un guide complet pour consulter les journaux GitLab sous Centos System Cet article vous guidera comment afficher divers journaux GitLab dans le système CentOS, y compris les journaux principaux, les journaux d'exception et d'autres journaux connexes. Veuillez noter que le chemin du fichier journal peut varier en fonction de la version Gitlab et de la méthode d'installation. Si le chemin suivant n'existe pas, veuillez vérifier le répertoire d'installation et les fichiers de configuration de GitLab. 1. Afficher le journal GitLab principal Utilisez la commande suivante pour afficher le fichier journal principal de l'application GitLabRails: Commande: sudocat / var / log / gitlab / gitlab-rails / production.log Cette commande affichera le produit

Comment faire fonctionner la formation distribuée de Pytorch sur CentOS Comment faire fonctionner la formation distribuée de Pytorch sur CentOS Apr 14, 2025 pm 06:36 PM

La formation distribuée par Pytorch sur le système CentOS nécessite les étapes suivantes: Installation de Pytorch: La prémisse est que Python et PIP sont installés dans le système CentOS. Selon votre version CUDA, obtenez la commande d'installation appropriée sur le site officiel de Pytorch. Pour la formation du processeur uniquement, vous pouvez utiliser la commande suivante: pipinstalltorchtorchVisionTorChaudio Si vous avez besoin d'une prise en charge du GPU, assurez-vous que la version correspondante de CUDA et CUDNN est installée et utilise la version Pytorch correspondante pour l'installation. Configuration de l'environnement distribué: la formation distribuée nécessite généralement plusieurs machines ou des GPU multiples uniques. Lieu

See all articles