Éditeur | KX
Si nous comprenions parfaitement comment les molécules interagissent entre elles, il n'y aurait plus rien à apprendre sur la biologie, car tout phénomène biologique, y compris la façon dont nous percevons le monde, trouve son origine dans le comportement et les interactions des cellules. biomolécules à l’intérieur.
AlphaFold 3, récemment lancé, peut prédire la structure 3D de complexes biomoléculaires directement à partir des séquences de protéines, d'acides nucléiques et de leurs ligands. Cela marque un progrès significatif dans notre exploration à long terme de la façon dont les biomolécules interagissent.
AlphaFold 3 représente une avancée majeure dans la prédiction de la structure tridimensionnelle d'un complexe directement à partir de sa séquence, fournissant ainsi un aperçu des interactions biomoléculaires.
1.
Code d'une biomoléculeUne séquence unidimensionnelle (1D) d'une biomolécule (telle qu'une protéine ou un acide nucléique) qui spécifie une fonction cellulaire, semblable à un morceau de code qui spécifie un programme. Cette séquence représente le code dans un langage de programmation et est « compilée » en code en langage machine via un processus de pliage, formant une structure 3D unique.
- Exécution du programme
Le programme est exécuté par l'interaction entre les biomolécules repliées et d'autres molécules au sein de la cellule.
- Interactions de biomolécules
En raison de leur structure tridimensionnelle unique, les biomolécules n'interagiront qu'avec un petit nombre de molécules au sein de la cellule (telles que les sites d'ADN), et ces interactions déclencheront une série d'interactions soigneusement planifiées. transformations chimiques et structurelles qui définissent ensemble des programmes biochimiques (par exemple, transcription). Les produits des processus biochimiques, tels que l’ARN, représentent le résultat du programme en cours d’exécution.
- Encodage des séquences biologiques
Ainsi, en biologie, une séquence unidimensionnelle de biomolécules code le programme et les moyens pour compiler et exécuter le programme ; cette séquence code le logiciel et le matériel. Prédire les structures tridimensionnelles formées par des complexes de biomolécules sur la base de leurs séquences unidimensionnelles constitue une étape cruciale dans la compréhension de la manière dont les programmes biologiques sont exécutés, avec de profondes implications sur notre capacité à comprendre, manipuler rationnellement et concevoir des systèmes biologiques.
Illustration : « Computational Dogma » of Molecular Biology (Source : Paper) 1 AlphaFold 2
- Publié en 2020, un algorithme révolutionnaire de prédiction de la structure des protéines
- Excellente précision médiane Par rapport à d'autres méthodes
. - fournit des structures prédites de 200 millions de protéines connues
2. RoseTTAFold
- publié en 2021, un outil de prédiction de protéines basé sur l'apprentissage profond
- la précision de la prédiction est comparable à AlphaFold 2, plus rapide, avec des exigences de calcul inférieures
- Utiliser réseaux neuronaux multipistes pour une grande précision
3. AlphaFold Multimer
- Version modifiée d'AlphaFold 2
- Formé aux ensembles de données de complexes protéiques
- Prédiction améliorée des complexes protéine-protéine
4.
Sorti en mai 2023- Allez au-delà des outils professionnels pour prédire la structure 3D des complexes protéiques
- Améliorez considérablement la précision de la prédiction des complexes protéine-ligand et protéine-acide nucléique
-
Prédire les structures contenant de multiples modifications covalentes-
5 . Mise à jour technologique
Remplacez le module de structure par le module de diffusion- Prédisez directement les coordonnées cartésiennes des atomes individuels
- Étendez-vous à un espace chimique plus large
-
Illustration : Exemple illustratif du processus de diffusion qui alimente les AlphaFold 3. module de diffusion. (Source : article)
À titre d'illustration simplifiée d'AlphaFold 3 :
Imaginez prendre les coordonnées tridimensionnelles de chaque atome dans un complexe biomoléculaire typique. - Ajoutez-y de manière itérative de plus en plus de bruit gaussien jusqu'à obtenir un nuage d'atomes distribués de manière aléatoire dans l'espace (diffusion vers l'avant).
- Les modèles de diffusion utilisent des réseaux de neurones multicouches pour apprendre à inverser ce processus (diffusion inverse).
-
De cette façon, le module de diffusion d'AlphaFold 3 apprend à :
Prédire les coordonnées de chaque atome dans un complexe donné sans avoir besoin d'un cadre de résidus prédéfini. - Espace chimique plus large comprenant les acides nucléiques, les ions, les ligands et les modifications chimiques.
-
Autres améliorations :
Remplacement d'Evoformer par Pairformer, une architecture Transformer plus récente. - Moins d'accent sur la gestion du MSA.
- Mettre à jour les métriques pour s'adapter aux changements dans l'architecture du réseau.
-
Progrès et limites :
-
Progrès : Amélioration de la précision des prédictions, réduction du recours à l'alignement des séquences et accent accru sur les interactions des résidus.
-
Limitations : Parfois, la chiralité des molécules ne peut pas être simulée correctement, la structure des grands complexes protéine-acide nucléique ne peut pas être prédite et le modèle généré peut avoir des « hallucinations ».
Prédiction d'ARN :
- La précision de prédiction d'AlphaFold 3 pour les cibles d'ARN est supérieure à celle des autres méthodes, mais pas aussi précise que celle des meilleurs experts humains.
AlphaFold Server :
- fournit une interface conviviale, mais le code source et les fichiers exécutables ne sont pas publics.
- Le pseudocode remplace le code source, ce qui suscite des controverses et entrave le développement ultérieur. 1. Lorsque l'on considère les avancées en matière de prédiction de structure apportées par AlphaFold 3, il est important de se rappeler que l'objectif de la biologie structurale n'est pas de prédire la structure 3D des biomolécules et de leurs complexes, mais de prédire leur comportement et d'effectuer des analyses biologiques. se produit lorsque vous programmez.
- Pour progresser dans la prédiction du comportement moléculaire, nous devons réaliser que le problème de la prédiction de la structure n’est pas aussi évident qu’il y paraît. Les biomolécules et leurs complexes ne se replient pas en une seule structure mais forment plutôt un ensemble de milliers de conformations différentes, chacune avec des probabilités et des durées de vie différentes.
- Comprendre ces paysages conformationnels et la façon dont ils changent lorsque les biomolécules interagissent est essentiel pour prédire quantitativement les affinités et les taux cinétiques.
- Prédire des ensembles conformationnels à partir de séquences dans diverses conditions est un problème sur lequel nous devons maintenant nous concentrer pour acquérir une compréhension quantitative et prédictive du comportement moléculaire.
- Bien que l’utilisation d’AlphaFold 3 pour prédire les structures 3D libres et complexes de biomolécules en fonction de leurs séquences constitue une étape importante dans la compréhension du comportement moléculaire et de la bioinformatique, les expérimentateurs n’ont pas à craindre d’être laissés pour compte. Le domaine de la biologie structurale est sur le point de devenir encore plus dynamique.
Lien papier : https://www.nature.com/articles/s41594-024-01350-2
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!