Maison Périphériques technologiques IA Analyse multifonctionnelle de l'ARN, le modèle de langage ARN de l'équipe Baidu basé sur Transformer est publié dans la sous-journal Nature

Analyse multifonctionnelle de l'ARN, le modèle de langage ARN de l'équipe Baidu basé sur Transformer est publié dans la sous-journal Nature

Jun 10, 2024 pm 10:21 PM
理论

Analyse multifonctionnelle de lARN, le modèle de langage ARN de léquipe Baidu basé sur Transformer est publié dans la sous-journal Nature

Éditeur | Radis Core

Les modèles de langage pré-entraînés se sont montrés très prometteurs dans l'analyse des séquences nucléotidiques, mais il reste encore des défis à relever lors de l'utilisation d'un seul ensemble de poids pré-entraînés pour obtenir des modèles multifonctionnels qui fonctionnent bien dans différentes tâches. .

Baidu Big Data Lab (BDL) et l'équipe de l'Université Jiao Tong de Shanghai ont développé RNAErnie, un modèle de pré-entraînement centré sur l'ARN basé sur l'architecture Transformer.

Les chercheurs ont évalué le modèle à l'aide de sept ensembles de données et de cinq tâches, démontrant la supériorité de RNAErnie dans l'apprentissage supervisé et non supervisé.

RNAErnie dépasse la ligne de base en améliorant la précision de la classification de 1,8 %, la précision de la prédiction des interactions de 2,2 % et le score F1 de la prédiction de la structure de 3,3 %, démontrant sa robustesse et son adaptabilité.

L'étude s'intitule « Modélisation du langage ARN polyvalent avec pré-entraînement sensible aux motifs et réglage fin guidé par type » et a été publiée dans « Nature Machine Intelligence » le 13 mai 2024.

Analyse multifonctionnelle de lARN, le modèle de langage ARN de léquipe Baidu basé sur Transformer est publié dans la sous-journal Nature

L'ARN joue un rôle clé dans le dogme central de la biologie moléculaire, responsable de la transmission des informations génétiques contenues dans l'ADN aux protéines.

Les molécules d'ARN jouent un rôle essentiel dans divers processus cellulaires tels que l'expression, la régulation et la catalyse des gènes. Compte tenu de l’importance de l’ARN dans les systèmes biologiques, il existe un besoin croissant de méthodes d’analyse efficaces et précises des séquences d’ARN.

L'analyse traditionnelle de séquençage d'ARN repose sur des techniques expérimentales telles que le séquençage d'ARN et les puces à ADN, mais ces méthodes sont souvent coûteuses, prennent du temps et nécessitent de grandes quantités d'ARN.

Pour relever ces défis, les équipes du Baidu BDL et de l'Université Jiao Tong de Shanghai ont développé un modèle de langage ARN pré-entraîné : RNAErnie.

RNAErnie

Le modèle est construit sur le cadre de représentation améliorée de l'intégration des connaissances (ERNIE) et contient des blocs Transformer multicouches et multi-têtes, chacun avec une dimension d'état caché de 768. Le pré-entraînement est effectué à l’aide d’un vaste corpus composé d’environ 23 millions de séquences d’ARN soigneusement sélectionnées dans RNAcentral.

La stratégie de pré-entraînement basée sur les motifs proposée implique un masquage au niveau de la base, un masquage au niveau des sous-séquences et un masquage aléatoire au niveau du motif, qui capture efficacement les connaissances au niveau des sous-séquences et des motifs et enrichit la représentation des séquences d'ARN.

De plus, RNAErnie étiquette les types d'ARN à gros grains comme vocabulaires spéciaux et ajoute les étiquettes des types d'ARN à gros grains à la fin de chaque séquence d'ARN pendant la pré-entraînement. Ce faisant, le modèle a le potentiel de discerner les caractéristiques uniques de différents types d’ARN, facilitant ainsi l’adaptation du domaine à diverses tâches en aval.

Analyse multifonctionnelle de lARN, le modèle de langage ARN de léquipe Baidu basé sur Transformer est publié dans la sous-journal Nature

Illustration : Aperçu du modèle. (Source : article)

Plus précisément, le modèle RNAErnie se compose de 12 couches Transformer. Dans la phase de pré-formation sensible au sujet, RNAErnie est formé sur un ensemble de données d'environ 23 millions de séquences extraites de la base de données RNAcentral, en utilisant un apprentissage auto-supervisé et des masques aléatoires multi-niveaux sensibles au sujet.

Analyse multifonctionnelle de lARN, le modèle de langage ARN de léquipe Baidu basé sur Transformer est publié dans la sous-journal Nature

Illustration : Pré-formation adaptée au sujet et stratégie de réglage fin guidée par le type. (Source : article)

Dans l'étape de réglage fin guidé par les types, RNAErnie utilise d'abord les intégrations de sortie pour prédire d'éventuels types d'ARN à gros grains, puis utilise les types prédits comme informations auxiliaires pour affiner le modèle via des tâches. en-têtes spécifiques.

Cette approche permet au modèle de s'adapter à différents types d'ARN et améliore son utilité dans un large éventail de tâches d'analyse d'ARN.

Plus précisément, pour s'adapter aux changements de distribution entre l'ensemble de données pré-entraîné et le domaine cible, RNAErnie exploite l'adaptation de domaine pour combiner le backbone pré-entraîné avec les modules en aval dans trois architectures neuronales : le backbone gelé avec réseau de têtes entraînables (FBTH), colonne vertébrale entraînable avec têtes entraînables (TBTH) et empilage pour un réglage précis guidé par type (STACK).

De cette manière, la méthode proposée peut optimiser de bout en bout le backbone et les en-têtes spécifiques aux tâches, ou utiliser des intégrations extraites du backbone gelé pour affiner les en-têtes spécifiques aux tâches, en fonction de l'application en aval.

Évaluation des performances

Analyse multifonctionnelle de lARN, le modèle de langage ARN de léquipe Baidu basé sur Transformer est publié dans la sous-journal Nature

Illustration : RNAErnie capture des modèles d'ontologie à plusieurs niveaux. (Source : article)

Les chercheurs ont évalué la méthode et les résultats ont montré que RNAErnie surpassait l'état de l'art existant sur sept ensembles de données de séquences d'ARN couvrant plus de 17 000 motifs d'ARN majeurs, 20 types d'ARN et 50 000 séquences d'ARN.

Analyse multifonctionnelle de lARN, le modèle de langage ARN de léquipe Baidu basé sur Transformer est publié dans la sous-journal Nature

Illustration : performances de RNAErnie sur la tâche de prédiction de la structure secondaire de l'ARN à l'aide des ensembles de données ArchiveII600 et TS0. (Source : article)

Évalué à l'aide de 30 technologies traditionnelles de séquençage d'ARN, démontrant la généralisation et la robustesse de RNAErnie. L’équipe a utilisé l’exactitude, la précision, le rappel, le score F1, le MCC et l’AUC comme paramètres d’évaluation pour garantir une comparaison équitable des méthodes d’analyse RNA-seq.

Actuellement, il existe peu d'études sur l'application de l'architecture Transformer avec des connaissances externes améliorées à l'analyse des données de séquençage d'ARN. Le framework RNAErnie à partir de zéro intègre des stratégies d’intégration de séquences d’ARN et d’apprentissage auto-supervisé pour apporter des performances, une interprétabilité et un potentiel de généralisation supérieurs aux tâches d’ARN en aval.

De plus, RNAErnie peut être adapté à d'autres tâches en modifiant les sorties et en surveillant les signaux. RNAErnie est accessible au public et constitue un outil efficace pour comprendre l’analyse d’ARN guidée par type et les applications avancées.

Limitations

Bien que le modèle RNAErnie soit innovant dans l'analyse des séquences d'ARN, il fait encore face à certains défis.

Premièrement, le modèle est limité par la taille des séquences d’ARN qu’il peut analyser, car les séquences de plus de 512 nucléotides sont rejetées, négligeant potentiellement des informations structurelles et fonctionnelles importantes. Les méthodes de blocage développées pour gérer des séquences plus longues peuvent entraîner une perte supplémentaire d'informations sur les interactions à longue portée.

Deuxièmement, l'objet de cette étude est restreint, se concentrant uniquement sur les domaines d'ARN et ne s'étendant pas à des tâches telles que la prédiction des protéines d'ARN ou l'identification des sites de liaison. De plus, le modèle rencontre des difficultés pour prendre en compte les motifs structurels tridimensionnels de l'ARN, tels que les boucles et les jonctions, qui sont essentiels à la compréhension du fonctionnement de l'ARN.

Plus important encore, les conceptions d'architecture post-hoc existantes présentent également des limites potentielles.

Conclusion

Néanmoins, RNAErnie a un grand potentiel pour faire progresser l’analyse de l’ARN. Le modèle démontre sa polyvalence et son efficacité en tant que solution générale dans différentes tâches en aval.

De plus, les stratégies innovantes adoptées par RNAErnie devraient améliorer les performances d'autres modèles pré-entraînés en analyse d'ARN. Ces découvertes font de RNAErnie un atout précieux, fournissant aux chercheurs un outil puissant pour démêler les complexités de la recherche liée à l’ARN.

Lien papier :https://www.nature.com/articles/s42256-024-00836-4

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

<🎜>: Grow A Garden - Guide de mutation complet
3 Il y a quelques semaines By DDD
<🎜>: Bubble Gum Simulator Infinity - Comment obtenir et utiliser les clés royales
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌
Blue Prince: Comment se rendre au sous-sol
1 Il y a quelques mois By DDD
Nordhold: Système de fusion, expliqué
3 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Tutoriel Java
1664
14
Tutoriel PHP
1269
29
Tutoriel C#
1249
24
Repoussant les limites de la détection de défauts traditionnelle, « Defect Spectrum » permet pour la première fois une détection de défauts industriels d'une ultra haute précision et d'une sémantique riche. Repoussant les limites de la détection de défauts traditionnelle, « Defect Spectrum » permet pour la première fois une détection de défauts industriels d'une ultra haute précision et d'une sémantique riche. Jul 26, 2024 pm 05:38 PM

Dans la fabrication moderne, une détection précise des défauts est non seulement la clé pour garantir la qualité des produits, mais également la clé de l’amélioration de l’efficacité de la production. Cependant, les ensembles de données de détection de défauts existants manquent souvent de précision et de richesse sémantique requises pour les applications pratiques, ce qui rend les modèles incapables d'identifier des catégories ou des emplacements de défauts spécifiques. Afin de résoudre ce problème, une équipe de recherche de premier plan composée de l'Université des sciences et technologies de Hong Kong, Guangzhou et de Simou Technology a développé de manière innovante l'ensemble de données « DefectSpectrum », qui fournit une annotation à grande échelle détaillée et sémantiquement riche des défauts industriels. Comme le montre le tableau 1, par rapport à d'autres ensembles de données industrielles, l'ensemble de données « DefectSpectrum » fournit le plus grand nombre d'annotations de défauts (5 438 échantillons de défauts) et la classification de défauts la plus détaillée (125 catégories de défauts).

Formation avec des millions de données cristallines pour résoudre le problème de la phase cristallographique, la méthode d'apprentissage profond PhAI est publiée dans Science Formation avec des millions de données cristallines pour résoudre le problème de la phase cristallographique, la méthode d'apprentissage profond PhAI est publiée dans Science Aug 08, 2024 pm 09:22 PM

Editeur | KX À ce jour, les détails structurels et la précision déterminés par cristallographie, des métaux simples aux grandes protéines membranaires, sont inégalés par aucune autre méthode. Cependant, le plus grand défi, appelé problème de phase, reste la récupération des informations de phase à partir d'amplitudes déterminées expérimentalement. Des chercheurs de l'Université de Copenhague au Danemark ont ​​développé une méthode d'apprentissage en profondeur appelée PhAI pour résoudre les problèmes de phase cristalline. Un réseau neuronal d'apprentissage en profondeur formé à l'aide de millions de structures cristallines artificielles et de leurs données de diffraction synthétique correspondantes peut générer des cartes précises de densité électronique. L'étude montre que cette méthode de solution structurelle ab initio basée sur l'apprentissage profond peut résoudre le problème de phase avec une résolution de seulement 2 Angströms, ce qui équivaut à seulement 10 à 20 % des données disponibles à la résolution atomique, alors que le calcul ab initio traditionnel

Le modèle de dialogue NVIDIA ChatQA a évolué vers la version 2.0, avec la longueur du contexte mentionnée à 128 Ko Le modèle de dialogue NVIDIA ChatQA a évolué vers la version 2.0, avec la longueur du contexte mentionnée à 128 Ko Jul 26, 2024 am 08:40 AM

La communauté ouverte LLM est une époque où une centaine de fleurs fleurissent et s'affrontent. Vous pouvez voir Llama-3-70B-Instruct, QWen2-72B-Instruct, Nemotron-4-340B-Instruct, Mixtral-8x22BInstruct-v0.1 et bien d'autres. excellents interprètes. Cependant, par rapport aux grands modèles propriétaires représentés par le GPT-4-Turbo, les modèles ouverts présentent encore des lacunes importantes dans de nombreux domaines. En plus des modèles généraux, certains modèles ouverts spécialisés dans des domaines clés ont été développés, tels que DeepSeek-Coder-V2 pour la programmation et les mathématiques, et InternVL pour les tâches de langage visuel.

Google AI a remporté la médaille d'argent de l'Olympiade mathématique de l'OMI, le modèle de raisonnement mathématique AlphaProof a été lancé et l'apprentissage par renforcement est de retour. Google AI a remporté la médaille d'argent de l'Olympiade mathématique de l'OMI, le modèle de raisonnement mathématique AlphaProof a été lancé et l'apprentissage par renforcement est de retour. Jul 26, 2024 pm 02:40 PM

Pour l’IA, l’Olympiade mathématique n’est plus un problème. Jeudi, l'intelligence artificielle de Google DeepMind a réalisé un exploit : utiliser l'IA pour résoudre la vraie question de l'Olympiade mathématique internationale de cette année, l'OMI, et elle n'était qu'à un pas de remporter la médaille d'or. Le concours de l'OMI qui vient de se terminer la semaine dernière comportait six questions portant sur l'algèbre, la combinatoire, la géométrie et la théorie des nombres. Le système d'IA hybride proposé par Google a répondu correctement à quatre questions et a marqué 28 points, atteignant le niveau de la médaille d'argent. Plus tôt ce mois-ci, le professeur titulaire de l'UCLA, Terence Tao, venait de promouvoir l'Olympiade mathématique de l'IA (AIMO Progress Award) avec un prix d'un million de dollars. De manière inattendue, le niveau de résolution de problèmes d'IA s'était amélioré à ce niveau avant juillet. Posez les questions simultanément sur l'OMI. La chose la plus difficile à faire correctement est l'OMI, qui a la plus longue histoire, la plus grande échelle et la plus négative.

PRO | Pourquoi les grands modèles basés sur le MoE méritent-ils davantage d'attention ? PRO | Pourquoi les grands modèles basés sur le MoE méritent-ils davantage d'attention ? Aug 07, 2024 pm 07:08 PM

En 2023, presque tous les domaines de l’IA évoluent à une vitesse sans précédent. Dans le même temps, l’IA repousse constamment les limites technologiques de domaines clés tels que l’intelligence embarquée et la conduite autonome. Sous la tendance multimodale, le statut de Transformer en tant qu'architecture dominante des grands modèles d'IA sera-t-il ébranlé ? Pourquoi l'exploration de grands modèles basés sur l'architecture MoE (Mixture of Experts) est-elle devenue une nouvelle tendance dans l'industrie ? Les modèles de grande vision (LVM) peuvent-ils constituer une nouvelle avancée dans la vision générale ? ...Dans la newsletter des membres PRO 2023 de ce site publiée au cours des six derniers mois, nous avons sélectionné 10 interprétations spéciales qui fournissent une analyse approfondie des tendances technologiques et des changements industriels dans les domaines ci-dessus pour vous aider à atteindre vos objectifs dans le nouveau année. Cette interprétation provient de la Week50 2023

Afin de fournir un nouveau système de référence et d'évaluation de questions-réponses scientifiques et complexes pour les grands modèles, l'UNSW, Argonne, l'Université de Chicago et d'autres institutions ont lancé conjointement le cadre SciQAG. Afin de fournir un nouveau système de référence et d'évaluation de questions-réponses scientifiques et complexes pour les grands modèles, l'UNSW, Argonne, l'Université de Chicago et d'autres institutions ont lancé conjointement le cadre SciQAG. Jul 25, 2024 am 06:42 AM

L'ensemble de données ScienceAI Question Answering (QA) joue un rôle essentiel dans la promotion de la recherche sur le traitement du langage naturel (NLP). Des ensembles de données d'assurance qualité de haute qualité peuvent non seulement être utilisés pour affiner les modèles, mais également évaluer efficacement les capacités des grands modèles linguistiques (LLM), en particulier la capacité à comprendre et à raisonner sur les connaissances scientifiques. Bien qu’il existe actuellement de nombreux ensembles de données scientifiques d’assurance qualité couvrant la médecine, la chimie, la biologie et d’autres domaines, ces ensembles de données présentent encore certaines lacunes. Premièrement, le formulaire de données est relativement simple, et la plupart sont des questions à choix multiples. Elles sont faciles à évaluer, mais limitent la plage de sélection des réponses du modèle et ne peuvent pas tester pleinement la capacité du modèle à répondre aux questions scientifiques. En revanche, les questions et réponses ouvertes

Le taux de précision atteint 60,8 %. Le modèle de prédiction de rétrosynthèse chimique de l'Université du Zhejiang basé sur Transformer a été publié dans la sous-journal Nature. Le taux de précision atteint 60,8 %. Le modèle de prédiction de rétrosynthèse chimique de l'Université du Zhejiang basé sur Transformer a été publié dans la sous-journal Nature. Aug 06, 2024 pm 07:34 PM

Editeur | KX La rétrosynthèse est une tâche essentielle dans la découverte de médicaments et la synthèse organique, et l'IA est de plus en plus utilisée pour accélérer le processus. Les méthodes d’IA existantes ont des performances insatisfaisantes et une diversité limitée. En pratique, les réactions chimiques provoquent souvent des modifications moléculaires locales, avec un chevauchement considérable entre les réactifs et les produits. Inspirée par cela, l'équipe de Hou Tingjun de l'Université du Zhejiang a proposé de redéfinir la prédiction rétrosynthétique en une seule étape en tant que tâche d'édition de chaînes moléculaires, en affinant de manière itérative la chaîne moléculaire cible pour générer des composés précurseurs. Et un modèle rétrosynthétique basé sur l'édition, EditRetro, est proposé, qui permet d'obtenir des prédictions diverses et de haute qualité. Des expériences approfondies montrent que le modèle atteint d'excellentes performances sur l'ensemble de données de référence standard USPTO-50 K, avec une précision top 1 de 60,8 %.

Le point de vue de la nature : les tests de l'intelligence artificielle en médecine sont dans le chaos. Que faut-il faire ? Le point de vue de la nature : les tests de l'intelligence artificielle en médecine sont dans le chaos. Que faut-il faire ? Aug 22, 2024 pm 04:37 PM

Editeur | ScienceAI Sur la base de données cliniques limitées, des centaines d'algorithmes médicaux ont été approuvés. Les scientifiques se demandent qui devrait tester les outils et comment le faire au mieux. Devin Singh a vu un patient pédiatrique aux urgences subir un arrêt cardiaque alors qu'il attendait un traitement pendant une longue période, ce qui l'a incité à explorer l'application de l'IA pour réduire les temps d'attente. À l’aide des données de triage des salles d’urgence de SickKids, Singh et ses collègues ont construit une série de modèles d’IA pour fournir des diagnostics potentiels et recommander des tests. Une étude a montré que ces modèles peuvent accélérer les visites chez le médecin de 22,3 %, accélérant ainsi le traitement des résultats de près de 3 heures par patient nécessitant un examen médical. Cependant, le succès des algorithmes d’intelligence artificielle dans la recherche ne fait que le vérifier.

See all articles