


Analyse multifonctionnelle de l'ARN, le modèle de langage ARN de l'équipe Baidu basé sur Transformer est publié dans la sous-journal Nature
Éditeur | Radis Core
Les modèles de langage pré-entraînés se sont montrés très prometteurs dans l'analyse des séquences nucléotidiques, mais il reste encore des défis à relever lors de l'utilisation d'un seul ensemble de poids pré-entraînés pour obtenir des modèles multifonctionnels qui fonctionnent bien dans différentes tâches. .
Baidu Big Data Lab (BDL) et l'équipe de l'Université Jiao Tong de Shanghai ont développé RNAErnie, un modèle de pré-entraînement centré sur l'ARN basé sur l'architecture Transformer.
Les chercheurs ont évalué le modèle à l'aide de sept ensembles de données et de cinq tâches, démontrant la supériorité de RNAErnie dans l'apprentissage supervisé et non supervisé.
RNAErnie dépasse la ligne de base en améliorant la précision de la classification de 1,8 %, la précision de la prédiction des interactions de 2,2 % et le score F1 de la prédiction de la structure de 3,3 %, démontrant sa robustesse et son adaptabilité.
L'étude s'intitule « Modélisation du langage ARN polyvalent avec pré-entraînement sensible aux motifs et réglage fin guidé par type » et a été publiée dans « Nature Machine Intelligence » le 13 mai 2024.
L'ARN joue un rôle clé dans le dogme central de la biologie moléculaire, responsable de la transmission des informations génétiques contenues dans l'ADN aux protéines.
Les molécules d'ARN jouent un rôle essentiel dans divers processus cellulaires tels que l'expression, la régulation et la catalyse des gènes. Compte tenu de l’importance de l’ARN dans les systèmes biologiques, il existe un besoin croissant de méthodes d’analyse efficaces et précises des séquences d’ARN.
L'analyse traditionnelle de séquençage d'ARN repose sur des techniques expérimentales telles que le séquençage d'ARN et les puces à ADN, mais ces méthodes sont souvent coûteuses, prennent du temps et nécessitent de grandes quantités d'ARN.
Pour relever ces défis, les équipes du Baidu BDL et de l'Université Jiao Tong de Shanghai ont développé un modèle de langage ARN pré-entraîné : RNAErnie.
RNAErnie
Le modèle est construit sur le cadre de représentation améliorée de l'intégration des connaissances (ERNIE) et contient des blocs Transformer multicouches et multi-têtes, chacun avec une dimension d'état caché de 768. Le pré-entraînement est effectué à l’aide d’un vaste corpus composé d’environ 23 millions de séquences d’ARN soigneusement sélectionnées dans RNAcentral.
La stratégie de pré-entraînement basée sur les motifs proposée implique un masquage au niveau de la base, un masquage au niveau des sous-séquences et un masquage aléatoire au niveau du motif, qui capture efficacement les connaissances au niveau des sous-séquences et des motifs et enrichit la représentation des séquences d'ARN.
De plus, RNAErnie étiquette les types d'ARN à gros grains comme vocabulaires spéciaux et ajoute les étiquettes des types d'ARN à gros grains à la fin de chaque séquence d'ARN pendant la pré-entraînement. Ce faisant, le modèle a le potentiel de discerner les caractéristiques uniques de différents types d’ARN, facilitant ainsi l’adaptation du domaine à diverses tâches en aval.
Plus précisément, le modèle RNAErnie se compose de 12 couches Transformer. Dans la phase de pré-formation sensible au sujet, RNAErnie est formé sur un ensemble de données d'environ 23 millions de séquences extraites de la base de données RNAcentral, en utilisant un apprentissage auto-supervisé et des masques aléatoires multi-niveaux sensibles au sujet.
Illustration : Pré-formation adaptée au sujet et stratégie de réglage fin guidée par le type. (Source : article)
Dans l'étape de réglage fin guidé par les types, RNAErnie utilise d'abord les intégrations de sortie pour prédire d'éventuels types d'ARN à gros grains, puis utilise les types prédits comme informations auxiliaires pour affiner le modèle via des tâches. en-têtes spécifiques.
Cette approche permet au modèle de s'adapter à différents types d'ARN et améliore son utilité dans un large éventail de tâches d'analyse d'ARN.
Plus précisément, pour s'adapter aux changements de distribution entre l'ensemble de données pré-entraîné et le domaine cible, RNAErnie exploite l'adaptation de domaine pour combiner le backbone pré-entraîné avec les modules en aval dans trois architectures neuronales : le backbone gelé avec réseau de têtes entraînables (FBTH), colonne vertébrale entraînable avec têtes entraînables (TBTH) et empilage pour un réglage précis guidé par type (STACK).
De cette manière, la méthode proposée peut optimiser de bout en bout le backbone et les en-têtes spécifiques aux tâches, ou utiliser des intégrations extraites du backbone gelé pour affiner les en-têtes spécifiques aux tâches, en fonction de l'application en aval.
Évaluation des performances
Illustration : RNAErnie capture des modèles d'ontologie à plusieurs niveaux. (Source : article)
Les chercheurs ont évalué la méthode et les résultats ont montré que RNAErnie surpassait l'état de l'art existant sur sept ensembles de données de séquences d'ARN couvrant plus de 17 000 motifs d'ARN majeurs, 20 types d'ARN et 50 000 séquences d'ARN.
Illustration : performances de RNAErnie sur la tâche de prédiction de la structure secondaire de l'ARN à l'aide des ensembles de données ArchiveII600 et TS0. (Source : article)
Évalué à l'aide de 30 technologies traditionnelles de séquençage d'ARN, démontrant la généralisation et la robustesse de RNAErnie. L’équipe a utilisé l’exactitude, la précision, le rappel, le score F1, le MCC et l’AUC comme paramètres d’évaluation pour garantir une comparaison équitable des méthodes d’analyse RNA-seq.
Actuellement, il existe peu d'études sur l'application de l'architecture Transformer avec des connaissances externes améliorées à l'analyse des données de séquençage d'ARN. Le framework RNAErnie à partir de zéro intègre des stratégies d’intégration de séquences d’ARN et d’apprentissage auto-supervisé pour apporter des performances, une interprétabilité et un potentiel de généralisation supérieurs aux tâches d’ARN en aval.
De plus, RNAErnie peut être adapté à d'autres tâches en modifiant les sorties et en surveillant les signaux. RNAErnie est accessible au public et constitue un outil efficace pour comprendre l’analyse d’ARN guidée par type et les applications avancées.
Limitations
Bien que le modèle RNAErnie soit innovant dans l'analyse des séquences d'ARN, il fait encore face à certains défis.
Premièrement, le modèle est limité par la taille des séquences d’ARN qu’il peut analyser, car les séquences de plus de 512 nucléotides sont rejetées, négligeant potentiellement des informations structurelles et fonctionnelles importantes. Les méthodes de blocage développées pour gérer des séquences plus longues peuvent entraîner une perte supplémentaire d'informations sur les interactions à longue portée.
Deuxièmement, l'objet de cette étude est restreint, se concentrant uniquement sur les domaines d'ARN et ne s'étendant pas à des tâches telles que la prédiction des protéines d'ARN ou l'identification des sites de liaison. De plus, le modèle rencontre des difficultés pour prendre en compte les motifs structurels tridimensionnels de l'ARN, tels que les boucles et les jonctions, qui sont essentiels à la compréhension du fonctionnement de l'ARN.
Plus important encore, les conceptions d'architecture post-hoc existantes présentent également des limites potentielles.
Conclusion
Néanmoins, RNAErnie a un grand potentiel pour faire progresser l’analyse de l’ARN. Le modèle démontre sa polyvalence et son efficacité en tant que solution générale dans différentes tâches en aval.
De plus, les stratégies innovantes adoptées par RNAErnie devraient améliorer les performances d'autres modèles pré-entraînés en analyse d'ARN. Ces découvertes font de RNAErnie un atout précieux, fournissant aux chercheurs un outil puissant pour démêler les complexités de la recherche liée à l’ARN.
Lien papier :https://www.nature.com/articles/s42256-024-00836-4
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds











Dans la fabrication moderne, une détection précise des défauts est non seulement la clé pour garantir la qualité des produits, mais également la clé de l’amélioration de l’efficacité de la production. Cependant, les ensembles de données de détection de défauts existants manquent souvent de précision et de richesse sémantique requises pour les applications pratiques, ce qui rend les modèles incapables d'identifier des catégories ou des emplacements de défauts spécifiques. Afin de résoudre ce problème, une équipe de recherche de premier plan composée de l'Université des sciences et technologies de Hong Kong, Guangzhou et de Simou Technology a développé de manière innovante l'ensemble de données « DefectSpectrum », qui fournit une annotation à grande échelle détaillée et sémantiquement riche des défauts industriels. Comme le montre le tableau 1, par rapport à d'autres ensembles de données industrielles, l'ensemble de données « DefectSpectrum » fournit le plus grand nombre d'annotations de défauts (5 438 échantillons de défauts) et la classification de défauts la plus détaillée (125 catégories de défauts).

Editeur | KX À ce jour, les détails structurels et la précision déterminés par cristallographie, des métaux simples aux grandes protéines membranaires, sont inégalés par aucune autre méthode. Cependant, le plus grand défi, appelé problème de phase, reste la récupération des informations de phase à partir d'amplitudes déterminées expérimentalement. Des chercheurs de l'Université de Copenhague au Danemark ont développé une méthode d'apprentissage en profondeur appelée PhAI pour résoudre les problèmes de phase cristalline. Un réseau neuronal d'apprentissage en profondeur formé à l'aide de millions de structures cristallines artificielles et de leurs données de diffraction synthétique correspondantes peut générer des cartes précises de densité électronique. L'étude montre que cette méthode de solution structurelle ab initio basée sur l'apprentissage profond peut résoudre le problème de phase avec une résolution de seulement 2 Angströms, ce qui équivaut à seulement 10 à 20 % des données disponibles à la résolution atomique, alors que le calcul ab initio traditionnel

La communauté ouverte LLM est une époque où une centaine de fleurs fleurissent et s'affrontent. Vous pouvez voir Llama-3-70B-Instruct, QWen2-72B-Instruct, Nemotron-4-340B-Instruct, Mixtral-8x22BInstruct-v0.1 et bien d'autres. excellents interprètes. Cependant, par rapport aux grands modèles propriétaires représentés par le GPT-4-Turbo, les modèles ouverts présentent encore des lacunes importantes dans de nombreux domaines. En plus des modèles généraux, certains modèles ouverts spécialisés dans des domaines clés ont été développés, tels que DeepSeek-Coder-V2 pour la programmation et les mathématiques, et InternVL pour les tâches de langage visuel.

Pour l’IA, l’Olympiade mathématique n’est plus un problème. Jeudi, l'intelligence artificielle de Google DeepMind a réalisé un exploit : utiliser l'IA pour résoudre la vraie question de l'Olympiade mathématique internationale de cette année, l'OMI, et elle n'était qu'à un pas de remporter la médaille d'or. Le concours de l'OMI qui vient de se terminer la semaine dernière comportait six questions portant sur l'algèbre, la combinatoire, la géométrie et la théorie des nombres. Le système d'IA hybride proposé par Google a répondu correctement à quatre questions et a marqué 28 points, atteignant le niveau de la médaille d'argent. Plus tôt ce mois-ci, le professeur titulaire de l'UCLA, Terence Tao, venait de promouvoir l'Olympiade mathématique de l'IA (AIMO Progress Award) avec un prix d'un million de dollars. De manière inattendue, le niveau de résolution de problèmes d'IA s'était amélioré à ce niveau avant juillet. Posez les questions simultanément sur l'OMI. La chose la plus difficile à faire correctement est l'OMI, qui a la plus longue histoire, la plus grande échelle et la plus négative.

En 2023, presque tous les domaines de l’IA évoluent à une vitesse sans précédent. Dans le même temps, l’IA repousse constamment les limites technologiques de domaines clés tels que l’intelligence embarquée et la conduite autonome. Sous la tendance multimodale, le statut de Transformer en tant qu'architecture dominante des grands modèles d'IA sera-t-il ébranlé ? Pourquoi l'exploration de grands modèles basés sur l'architecture MoE (Mixture of Experts) est-elle devenue une nouvelle tendance dans l'industrie ? Les modèles de grande vision (LVM) peuvent-ils constituer une nouvelle avancée dans la vision générale ? ...Dans la newsletter des membres PRO 2023 de ce site publiée au cours des six derniers mois, nous avons sélectionné 10 interprétations spéciales qui fournissent une analyse approfondie des tendances technologiques et des changements industriels dans les domaines ci-dessus pour vous aider à atteindre vos objectifs dans le nouveau année. Cette interprétation provient de la Week50 2023

L'ensemble de données ScienceAI Question Answering (QA) joue un rôle essentiel dans la promotion de la recherche sur le traitement du langage naturel (NLP). Des ensembles de données d'assurance qualité de haute qualité peuvent non seulement être utilisés pour affiner les modèles, mais également évaluer efficacement les capacités des grands modèles linguistiques (LLM), en particulier la capacité à comprendre et à raisonner sur les connaissances scientifiques. Bien qu’il existe actuellement de nombreux ensembles de données scientifiques d’assurance qualité couvrant la médecine, la chimie, la biologie et d’autres domaines, ces ensembles de données présentent encore certaines lacunes. Premièrement, le formulaire de données est relativement simple, et la plupart sont des questions à choix multiples. Elles sont faciles à évaluer, mais limitent la plage de sélection des réponses du modèle et ne peuvent pas tester pleinement la capacité du modèle à répondre aux questions scientifiques. En revanche, les questions et réponses ouvertes

Editeur | KX La rétrosynthèse est une tâche essentielle dans la découverte de médicaments et la synthèse organique, et l'IA est de plus en plus utilisée pour accélérer le processus. Les méthodes d’IA existantes ont des performances insatisfaisantes et une diversité limitée. En pratique, les réactions chimiques provoquent souvent des modifications moléculaires locales, avec un chevauchement considérable entre les réactifs et les produits. Inspirée par cela, l'équipe de Hou Tingjun de l'Université du Zhejiang a proposé de redéfinir la prédiction rétrosynthétique en une seule étape en tant que tâche d'édition de chaînes moléculaires, en affinant de manière itérative la chaîne moléculaire cible pour générer des composés précurseurs. Et un modèle rétrosynthétique basé sur l'édition, EditRetro, est proposé, qui permet d'obtenir des prédictions diverses et de haute qualité. Des expériences approfondies montrent que le modèle atteint d'excellentes performances sur l'ensemble de données de référence standard USPTO-50 K, avec une précision top 1 de 60,8 %.

Editeur | ScienceAI Sur la base de données cliniques limitées, des centaines d'algorithmes médicaux ont été approuvés. Les scientifiques se demandent qui devrait tester les outils et comment le faire au mieux. Devin Singh a vu un patient pédiatrique aux urgences subir un arrêt cardiaque alors qu'il attendait un traitement pendant une longue période, ce qui l'a incité à explorer l'application de l'IA pour réduire les temps d'attente. À l’aide des données de triage des salles d’urgence de SickKids, Singh et ses collègues ont construit une série de modèles d’IA pour fournir des diagnostics potentiels et recommander des tests. Une étude a montré que ces modèles peuvent accélérer les visites chez le médecin de 22,3 %, accélérant ainsi le traitement des résultats de près de 3 heures par patient nécessitant un examen médical. Cependant, le succès des algorithmes d’intelligence artificielle dans la recherche ne fait que le vérifier.
