Table des matières
Introduction
Aperçu de la recherche
Plus de résultats expérimentaux
Conclusion
À propos de l'auteur
Maison Périphériques technologiques IA Ouvrir-source ! Les Chinois de Hong Kong, le MIT et Fudan proposent le premier modèle de base de l'ARN

Ouvrir-source ! Les Chinois de Hong Kong, le MIT et Fudan proposent le premier modèle de base de l'ARN

Apr 09, 2023 pm 03:11 PM
模型 开源

Contrairement au domaine des protéines, la recherche dans le domaine de l'ARN manque souvent de données d'annotation suffisantes. Par exemple, les données 3D ne contiennent que plus de 1 000 ARN. Cela limite considérablement le développement de méthodes d’apprentissage automatique dans les tâches de prédiction structure-fonction de l’ARN.

Afin de compenser le manque de données annotées, cet article présente un modèle de base qui peut fournir de riches connaissances structurelles et fonctionnelles pour divers types de recherche sur l'ARN - le modèle de fondation de l'ARN (ARN-FM). En tant que premier modèle de base d'ARN au monde formé de manière non supervisée sur la base de 23 millions de séquences d'ARN non marquées, RNA-FM exploite les modèles évolutifs et structurels contenus dans les séquences d'ARN.

Il convient de noter que RNA-FM n'a besoin que de correspondre à un simple modèle en aval ou de fournir uniquement une intégration, et il peut atteindre de bien meilleures performances que SOTA dans de nombreuses tâches en aval, telles que l'amélioration de la prédiction de la structure secondaire de 20 % et de la distance. la prédiction cartographique peut être améliorée de 30 %. Des expériences à grande échelle ont prouvé que le modèle est hautement généralisable et peut même être utilisé pour le COVID-19 et les fragments régulateurs de l’ARNm.

Ouvrir-source ! Les Chinois de Hong Kong, le MIT et Fudan proposent le premier modèle de base de lARN

  • Préimpression papier : https://arxiv.org/abs/2204.00300
  • Code et modèle : https://github.com/ml4bio/RNA - FM
  • Serveur : https://proj.cse.cuhk.edu.hk/rnafm

Introduction

Ces dernières années, les méthodes de calcul biologique basées sur l'apprentissage profond ont fait des percées dans le domaine de protéines L'étape la plus célèbre est le cadre de prédiction de la structure 3D des protéines de bout en bout AlphaFold2 développé par l'équipe Google DeepMind. Cependant, les protéines ne sont qu'un type parmi de nombreuses molécules biologiques (ADN/ARN), en tant que source de production de protéines, elles contiennent plus d'informations de base que ces dernières et ont une valeur de recherche plus importante.

De manière générale, les protéines sont les produits de la traduction de l'ARN utilisé pour le codage, c'est-à-dire qu'un ARNm fixe peut être traduit en une séquence protéique fixe. En fait, cette partie de l’ARN codant ne représente que 2 % de toutes les séquences d’ARN, et les 98 % restants sont des ARN non codants (ARNnc). Bien que les ARNnc ne soient pas directement « traduits » en protéines, ils se replient en structures tertiaires dotées de fonctions spécifiques et jouent un rôle régulateur dans le processus de traduction de l’ARNm ou d’autres fonctions biologiques. Par conséquent, l’analyse de la structure et de la fonction des ARNnc est une recherche plus fondamentale et plus complexe que l’analyse des protéines.

Cependant, par rapport au domaine des protéines où les méthodes informatiques sont plus matures, la prédiction de la structure et de la fonction basée sur l'ARN en est encore à ses débuts, et les méthodes informatiques initialement applicables au domaine des protéines sont difficiles à migrer directement vers le domaine de l'ARN. . La principale limitation de ces méthodes informatiques est que l’annotation des données ARN est généralement difficile à obtenir et nécessite beaucoup de ressources expérimentales et de temps pour compléter l’annotation d’une petite quantité de données. La plupart des méthodes informatiques nécessitent une grande quantité de données annotées. pour que la supervision atteigne des performances élevées. Bien qu’il n’y ait pas beaucoup de données annotées, le domaine de l’ARN a en réalité accumulé beaucoup de données de séquences non annotées. La méthode de cet article consiste à utiliser ces données non étiquetées pour fournir des informations supplémentaires efficaces pour diverses tâches en aval.

Sur la base de cette considération, Les équipes du laboratoire d'intelligence artificielle de Hong Kong, du MIT, de Fudan et de Shanghai ont proposé un modèle de base Un modèle de base d'ARN formé sur 23 millions de séquences d'ARN pur non marquées de manière non supervisée (ARN-FM) . Bien que les données ne fournissent pas d’informations d’annotation pendant le processus de formation, RNA-FM exploite toujours les modèles évolutifs et structurels contenus dans ces séquences d’ARN de manière non supervisée.

Si RNA-FM peut être appliqué efficacement aux tâches de prédiction de la structure et des fonctions de l'ARN en aval, ces méthodes informatiques bénéficieront sûrement des connaissances résumées par RNA-FM, améliorant ainsi les performances. Le cadre de pré-formation en amont, de migration en aval et d'application de RNA-FM est présenté dans la figure ci-dessous.

Ouvrir-source ! Les Chinois de Hong Kong, le MIT et Fudan proposent le premier modèle de base de lARN

Aperçu de la recherche

Afin de confirmer si l'ARN-FM pré-entraîné a acquis des « connaissances » à partir d'une grande quantité de données non étiquetées et quel type de « connaissances » il a appris, l'article a mené une série de tests d'intégration Analyse .

Tout d'abord, une simple comparaison de regroupement de diverses caractéristiques a été effectuée directement via UMAP, et il a été constaté que les intégrations d'ARN-FM pré-entraînés formaient des groupes d'espèces d'ARN plus évidents que les autres intégrations. Cela signifie que l’intégration de l’ARN-FM contient des informations structurelles ou fonctionnelles permettant de distinguer les espèces d’ARN.

Ensuite, l'article utilise également l'inférence de trajectoire pour prédire l'évolution des ARNlnc de différentes espèces grâce à l'intégration d'ARN-FM. D'après le diagramme ci-dessous, le pseudo-temps d'évolution prévu entre les espèces est à peu près cohérent avec les informations réelles sur l'évolution des espèces, ce qui indique que l'incorporation d'ARN-FM contient également une partie des informations évolutives.

Il convient de noter qu'il s'agit d'informations communautaires sur les espèces d'ARN ou d'informations évolutives sur lncRNA, l'ARN-FM n'a pas été directement exposé à ces étiquettes pendant la formation. RNA-FM découvre des modèles liés à la structure, à la fonction et à l'évolution à partir de séquences pures de manière entièrement auto-supervisée.

Ouvrir-source ! Les Chinois de Hong Kong, le MIT et Fudan proposent le premier modèle de base de lARN


Plus de résultats expérimentaux

En plus d'analyser directement l'intégration de l'ARN-FM, l'article tente également d'introduire l'ARN-FM dans diverses tâches de prédiction de la structure de l'ARN en aval, y compris Structure secondaire, la prédiction des contacts, la prédiction des distances et la prédiction des structures tertiaires ont toutes réalisé des améliorations significatives.

Particulièrement dans la prédiction de la structure secondaire, l'article utilise RNA-FM comme épine dorsale et seulement un simple réseau ResNet comme modèle en aval, surpassant les 12 autres états de l'état sur deux ensembles de données publics -art La méthode est 3 à 5 points de pourcentage meilleure que le meilleur UFold sur le score F1. Dans la comparaison directe avec UFold, RNA-FM surpasse UFold dans la plupart des catégories d'ARN. Si RNA-FM est combiné avec E2Efold, une amélioration supplémentaire des performances de 5 % peut être obtenue.

Ouvrir-source ! Les Chinois de Hong Kong, le MIT et Fudan proposent le premier modèle de base de lARN

Afin de vérifier la valeur d'application pratique du modèle, l'article utilise RNA-FM pour effectuer une analyse complète des données COVID-19 , y compris l'utilisation de RNA-FM pour prédire avec précision le COVID -19 éléments régulateurs clés du génome de référence (29 870 nt) et utiliser l’intégration d’ARN-FM pour prédire approximativement les tendances évolutives des principales variantes du COVID-19. Ouvrir-source ! Les Chinois de Hong Kong, le MIT et Fudan proposent le premier modèle de base de lARN

De manière générale, la structure d'une molécule détermine sa fonction. Puisque l'ARN-FM peut parfaitement accomplir la tâche de prédiction de la structure de l'ARN, l'ARN-FM peut-il également être utilisé pour améliorer les résultats de la prédiction de la fonction ?

Par conséquent, l'article tente en outre d'introduire l'ARN-FM dans les tâches de prédiction de la fonction de l'ARN en aval, telles que l'utilisation de l'intégration de l'ARN-FM pour prédire les rôles des protéines ARN.

Des expériences ont prouvé que l'introduction de l'intégration d'ARN-FM a amélioré les performances du modèle et, dans certains cas, a permis d'obtenir des résultats de prédiction qui correspondent aux informations de structure secondaire réelles en entrée.

Ouvrir-source ! Les Chinois de Hong Kong, le MIT et Fudan proposent le premier modèle de base de lARN

Afin d'explorer si l'ARN-FM basé sur la formation d'ARNnc peut être généralisé à d'autres ARN, l'articletente enfin d'utiliser l'ARN-FM pour prédire la fonction de l'expression des protéines sur la base du 5'UTR sur l'ARNm. Bien que l'ARNm n'appartienne pas à l'ARNnc, le 5'UTR qu'il contient est une région qui n'est pas traduite mais qui a des fonctions régulatrices, ce qui est cohérent avec les caractéristiques de l'ARNnc et n'apparaît pas dans les données d'entraînement.

Comme vous pouvez le voir sur la figure ci-dessous, les modèles qui incluent l'intégration RNA-FM sont toujours meilleurs que les modèles qui n'en incluent pas. Bien que l’amélioration des performances soit relativement limitée, elle montre en partie que RNA-FM possède également une certaine capacité de généralisation sur les données non-ncRNA.

Ouvrir-source ! Les Chinois de Hong Kong, le MIT et Fudan proposent le premier modèle de base de lARN

Conclusion

En général, cet article pré-entraîne le modèle de langage RNA-FM avec des données de séquence d'ARN non étiquetées et effectue une vérification complète sur une série de tâches différentes telles que la structure ou la fonction par des méthodes directes ou indirectes, prouvant que l'ARN. -FM peut en effet améliorer efficacement les performances des méthodes de calcul dans les tâches en aval.

L'émergence de l'ARN-FM a atténué dans une certaine mesure la situation actuelle des données annotées par l'ARN et a fourni à d'autres chercheurs une interface pratique pour accéder à de grandes quantités de données non étiquetées. Elle servira de modèle de base dans le domaine de l'ARN. . Apporter un soutien et une aide solides à diverses recherches dans ce domaine.

À propos de l'auteur

Cet article a deux co-premiers auteurs. Chen Jiayang est assistant de recherche à l'Université chinoise de Hong Kong. Hu Zhihang est doctorant à l'Université chinoise de Hong Kong.

Cet article a deux auteurs correspondants. Sun Siqi, jeune chercheur au Laboratoire des systèmes complexes intelligents de l'Université de Fudan et au Laboratoire d'intelligence artificielle de Shanghai, page d'accueil https://intersun.github.io.

Li Yu, professeur adjoint à l'Université chinoise de Hong Kong, professeur adjoint invité au MIT James Collins Lab, chercheur scientifique au Broad Institute du MIT et de Harvard, chercheur invité au Wyss Institute de l'université de Harvard, Forbes 30 Under 30 Liste Asie – Promotion 2022, Santé et Science. Page d'accueil : https://liyu95.com.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Commandes de chat et comment les utiliser
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Le modèle MoE open source le plus puissant au monde est ici, avec des capacités chinoises comparables à celles du GPT-4, et le prix ne représente que près d'un pour cent de celui du GPT-4-Turbo. Le modèle MoE open source le plus puissant au monde est ici, avec des capacités chinoises comparables à celles du GPT-4, et le prix ne représente que près d'un pour cent de celui du GPT-4-Turbo. May 07, 2024 pm 04:13 PM

Imaginez un modèle d'intelligence artificielle qui non seulement a la capacité de surpasser l'informatique traditionnelle, mais qui permet également d'obtenir des performances plus efficaces à moindre coût. Ce n'est pas de la science-fiction, DeepSeek-V2[1], le modèle MoE open source le plus puissant au monde est ici. DeepSeek-V2 est un puissant mélange de modèle de langage d'experts (MoE) présentant les caractéristiques d'une formation économique et d'une inférence efficace. Il est constitué de 236B paramètres, dont 21B servent à activer chaque marqueur. Par rapport à DeepSeek67B, DeepSeek-V2 offre des performances plus élevées, tout en économisant 42,5 % des coûts de formation, en réduisant le cache KV de 93,3 % et en augmentant le débit de génération maximal à 5,76 fois. DeepSeek est une entreprise explorant l'intelligence artificielle générale

L'IA bouleverse la recherche mathématique ! Le lauréat de la médaille Fields et mathématicien sino-américain a dirigé 11 articles les mieux classés | Aimé par Terence Tao L'IA bouleverse la recherche mathématique ! Le lauréat de la médaille Fields et mathématicien sino-américain a dirigé 11 articles les mieux classés | Aimé par Terence Tao Apr 09, 2024 am 11:52 AM

L’IA change effectivement les mathématiques. Récemment, Tao Zhexuan, qui a prêté une attention particulière à cette question, a transmis le dernier numéro du « Bulletin de l'American Mathematical Society » (Bulletin de l'American Mathematical Society). En se concentrant sur le thème « Les machines changeront-elles les mathématiques ? », de nombreux mathématiciens ont exprimé leurs opinions. L'ensemble du processus a été plein d'étincelles, intense et passionnant. L'auteur dispose d'une équipe solide, comprenant Akshay Venkatesh, lauréat de la médaille Fields, le mathématicien chinois Zheng Lejun, l'informaticien de l'Université de New York Ernest Davis et de nombreux autres universitaires bien connus du secteur. Le monde de l’IA a radicalement changé. Vous savez, bon nombre de ces articles ont été soumis il y a un an.

Google est ravi : les performances de JAX surpassent Pytorch et TensorFlow ! Cela pourrait devenir le choix le plus rapide pour la formation à l'inférence GPU Google est ravi : les performances de JAX surpassent Pytorch et TensorFlow ! Cela pourrait devenir le choix le plus rapide pour la formation à l'inférence GPU Apr 01, 2024 pm 07:46 PM

Les performances de JAX, promu par Google, ont dépassé celles de Pytorch et TensorFlow lors de récents tests de référence, se classant au premier rang sur 7 indicateurs. Et le test n’a pas été fait sur le TPU présentant les meilleures performances JAX. Bien que parmi les développeurs, Pytorch soit toujours plus populaire que Tensorflow. Mais à l’avenir, des modèles plus volumineux seront peut-être formés et exécutés sur la base de la plate-forme JAX. Modèles Récemment, l'équipe Keras a comparé trois backends (TensorFlow, JAX, PyTorch) avec l'implémentation native de PyTorch et Keras2 avec TensorFlow. Premièrement, ils sélectionnent un ensemble de

Bonjour, Atlas électrique ! Le robot Boston Dynamics revient à la vie, des mouvements étranges à 180 degrés effraient Musk Bonjour, Atlas électrique ! Le robot Boston Dynamics revient à la vie, des mouvements étranges à 180 degrés effraient Musk Apr 18, 2024 pm 07:58 PM

Boston Dynamics Atlas entre officiellement dans l’ère des robots électriques ! Hier, l'Atlas hydraulique s'est retiré "en larmes" de la scène de l'histoire. Aujourd'hui, Boston Dynamics a annoncé que l'Atlas électrique était au travail. Il semble que dans le domaine des robots humanoïdes commerciaux, Boston Dynamics soit déterminé à concurrencer Tesla. Après la sortie de la nouvelle vidéo, elle a déjà été visionnée par plus d’un million de personnes en seulement dix heures. Les personnes âgées partent et de nouveaux rôles apparaissent. C'est une nécessité historique. Il ne fait aucun doute que cette année est l’année explosive des robots humanoïdes. Les internautes ont commenté : Les progrès des robots ont fait ressembler la cérémonie d'ouverture de cette année à des êtres humains, et le degré de liberté est bien plus grand que celui des humains. Mais n'est-ce vraiment pas un film d'horreur ? Au début de la vidéo, Atlas est allongé calmement sur le sol, apparemment sur le dos. Ce qui suit est à couper le souffle

KAN, qui remplace MLP, a été étendu à la convolution par des projets open source KAN, qui remplace MLP, a été étendu à la convolution par des projets open source Jun 01, 2024 pm 10:03 PM

Plus tôt ce mois-ci, des chercheurs du MIT et d'autres institutions ont proposé une alternative très prometteuse au MLP – KAN. KAN surpasse MLP en termes de précision et d’interprétabilité. Et il peut surpasser le MLP fonctionnant avec un plus grand nombre de paramètres avec un très petit nombre de paramètres. Par exemple, les auteurs ont déclaré avoir utilisé KAN pour reproduire les résultats de DeepMind avec un réseau plus petit et un degré d'automatisation plus élevé. Plus précisément, le MLP de DeepMind compte environ 300 000 paramètres, tandis que le KAN n'en compte qu'environ 200. KAN a une base mathématique solide comme MLP est basé sur le théorème d'approximation universelle, tandis que KAN est basé sur le théorème de représentation de Kolmogorov-Arnold. Comme le montre la figure ci-dessous, KAN a

Recommandé : Excellent projet de détection et de reconnaissance des visages open source JS Recommandé : Excellent projet de détection et de reconnaissance des visages open source JS Apr 03, 2024 am 11:55 AM

La technologie de détection et de reconnaissance des visages est déjà une technologie relativement mature et largement utilisée. Actuellement, le langage d'application Internet le plus utilisé est JS. La mise en œuvre de la détection et de la reconnaissance faciale sur le front-end Web présente des avantages et des inconvénients par rapport à la reconnaissance faciale back-end. Les avantages incluent la réduction de l'interaction réseau et de la reconnaissance en temps réel, ce qui réduit considérablement le temps d'attente des utilisateurs et améliore l'expérience utilisateur. Les inconvénients sont les suivants : il est limité par la taille du modèle et la précision est également limitée ; Comment utiliser js pour implémenter la détection de visage sur le web ? Afin de mettre en œuvre la reconnaissance faciale sur le Web, vous devez être familier avec les langages et technologies de programmation associés, tels que JavaScript, HTML, CSS, WebRTC, etc. Dans le même temps, vous devez également maîtriser les technologies pertinentes de vision par ordinateur et d’intelligence artificielle. Il convient de noter qu'en raison de la conception du côté Web

Les robots Tesla travaillent dans les usines, Musk : Le degré de liberté des mains atteindra 22 cette année ! Les robots Tesla travaillent dans les usines, Musk : Le degré de liberté des mains atteindra 22 cette année ! May 06, 2024 pm 04:13 PM

La dernière vidéo du robot Optimus de Tesla est sortie, et il peut déjà fonctionner en usine. À vitesse normale, il trie les batteries (les batteries 4680 de Tesla) comme ceci : Le responsable a également publié à quoi cela ressemble à une vitesse 20 fois supérieure - sur un petit "poste de travail", en sélectionnant et en sélectionnant et en sélectionnant : Cette fois, il est publié L'un des points forts de la vidéo est qu'Optimus réalise ce travail en usine, de manière totalement autonome, sans intervention humaine tout au long du processus. Et du point de vue d'Optimus, il peut également récupérer et placer la batterie tordue, en se concentrant sur la correction automatique des erreurs : concernant la main d'Optimus, le scientifique de NVIDIA Jim Fan a donné une évaluation élevée : la main d'Optimus est l'un des robots à cinq doigts du monde. le plus adroit. Ses mains ne sont pas seulement tactiles

FisheyeDetNet : le premier algorithme de détection de cible basé sur une caméra fisheye FisheyeDetNet : le premier algorithme de détection de cible basé sur une caméra fisheye Apr 26, 2024 am 11:37 AM

La détection de cibles est un problème relativement mature dans les systèmes de conduite autonome, parmi lesquels la détection des piétons est l'un des premiers algorithmes à être déployés. Des recherches très complètes ont été menées dans la plupart des articles. Cependant, la perception de la distance à l’aide de caméras fisheye pour une vue panoramique est relativement moins étudiée. En raison de la distorsion radiale importante, la représentation standard du cadre de délimitation est difficile à mettre en œuvre dans les caméras fisheye. Pour alléger la description ci-dessus, nous explorons les conceptions étendues de boîtes englobantes, d'ellipses et de polygones généraux dans des représentations polaires/angulaires et définissons une métrique de segmentation d'instance mIOU pour analyser ces représentations. Le modèle fisheyeDetNet proposé avec une forme polygonale surpasse les autres modèles et atteint simultanément 49,5 % de mAP sur l'ensemble de données de la caméra fisheye Valeo pour la conduite autonome.

See all articles