


Multifunktionale RNA-Analyse, das auf Transformer basierende RNA-Sprachmodell des Baidu-Teams wird in der Unterzeitschrift „Nature' veröffentlicht
Editor |. Radish Core
Vorab trainierte Sprachmodelle haben sich bei der Analyse von Nukleotidsequenzen als vielversprechend erwiesen, aber es gibt immer noch Herausforderungen bei der Verwendung eines einzigen vorab trainierten Gewichtssatzes, um multifunktionale Modelle zu erstellen, die bei verschiedenen Aufgaben gut funktionieren .
Baidu Big Data Lab (BDL) und das Team der Shanghai Jiao Tong University haben RNAErnie entwickelt, ein RNA-zentriertes Pre-Training-Modell basierend auf der Transformer-Architektur.
Die Forscher bewerteten das Modell anhand von sieben Datensätzen und fünf Aufgaben und zeigten die Überlegenheit von RNAErnie sowohl beim überwachten als auch beim unbeaufsichtigten Lernen.
RNAErnie übertrifft die Basislinie, indem es die Klassifizierungsgenauigkeit um 1,8 %, die Genauigkeit der Interaktionsvorhersage um 2,2 % und den F1-Score der Strukturvorhersage um 3,3 % verbessert, was seine Robustheit und Anpassungsfähigkeit demonstriert.
Die Studie trägt den Titel „Mehrzweck-RNA-Sprachmodellierung mit motivbewusstem Vortraining und typgesteuerter Feinabstimmung“ und wurde am 13. Mai 2024 in „Nature Machine Intelligence“ veröffentlicht.
RNA spielt im zentralen Dogma der Molekularbiologie eine Schlüsselrolle und ist für die Übertragung genetischer Informationen in der DNA auf Proteine verantwortlich.
RNA-Moleküle spielen eine wichtige Rolle bei verschiedenen zellulären Prozessen wie Genexpression, Regulation und Katalyse. Angesichts der Bedeutung von RNA in biologischen Systemen besteht ein wachsender Bedarf an effizienten und genauen Analysemethoden für RNA-Sequenzen.
Die traditionelle RNA-Seq-Analyse basiert auf experimentellen Techniken wie RNA-Sequenzierung und Microarrays, aber diese Methoden sind oft kostspielig, zeitaufwändig und erfordern große Mengen an RNA-Input.
Um diese Herausforderungen anzugehen, haben die Teams von Baidu BDL und der Shanghai Jiao Tong University ein vorab trainiertes RNA-Sprachmodell entwickelt: RNAErnie.
RNAErnie
Das Modell basiert auf dem ERNIE-Framework (Enhanced Representation of Knowledge Integration) und enthält mehrschichtige und mehrköpfige Transformer-Blöcke mit jeweils einer verborgenen Zustandsdimension von 768. Das Vortraining wird mit einem umfangreichen Korpus durchgeführt, der aus etwa 23 Millionen RNA-Sequenzen besteht, die sorgfältig von RNAcentral ausgewählt wurden.
Die vorgeschlagene motivbewusste Pre-Training-Strategie umfasst Maskierung auf Basisebene, Maskierung auf Subsequenzebene und Zufallsmaskierung auf Motivebene, wodurch Wissen auf Subsequenz- und Motivebene effektiv erfasst und die Darstellung von RNA-Sequenzen bereichert wird.
Darüber hinaus markiert RNAErnie grobkörnige RNA-Typen als spezielle Vokabulare und hängt die Markierungen grobkörniger RNA-Typen während des Vortrainings an das Ende jeder RNA-Sequenz an. Auf diese Weise hat das Modell das Potenzial, einzigartige Merkmale verschiedener RNA-Typen zu erkennen und so die Domänenanpassung an verschiedene nachgelagerte Aufgaben zu erleichtern.
Konkret besteht das RNAErnie-Modell aus 12 Transformer-Schichten. In der themenbewussten Vortrainingsphase wird RNAErnie anhand eines Datensatzes von etwa 23 Millionen Sequenzen trainiert, die aus der RNAcentral-Datenbank extrahiert wurden, wobei selbstüberwachtes Lernen und themenbewusste mehrstufige Zufallsmasken zum Einsatz kommen.
Illustration: Themenbewusste Vorschulung und typgeleitete Feinabstimmungsstrategie. (Quelle: Papier)
In der typgesteuerten Feinabstimmungsphase verwendet RNAErnie zunächst die Ausgabeeinbettungen, um mögliche grobkörnige RNA-Typen vorherzusagen, und verwendet dann die vorhergesagten Typen als Hilfsinformationen, um das Modell durch Aufgaben zu verfeinern. spezifische Header.
Dieser Ansatz ermöglicht die Anpassung des Modells an verschiedene RNA-Typen und verbessert seinen Nutzen bei einer Vielzahl von RNA-Analyseaufgaben.
Genauer gesagt, um sich an Verteilungsänderungen zwischen dem vorab trainierten Datensatz und der Zieldomäne anzupassen, nutzt RNAErnie die Domänenanpassung, um das vorab trainierte Backbone mit Downstream-Modulen in drei neuronalen Architekturen zu kombinieren: Frozen Backbone with Trainable Heads Net (FBTH), trainierbares Rückgrat mit trainierbaren Köpfen (TBTH) und Stapelung für typgesteuerte Feinabstimmung (STACK).
Auf diese Weise kann die vorgeschlagene Methode je nach Downstream-Anwendung das Backbone und aufgabenspezifische Header durchgängig optimieren oder aus dem eingefrorenen Backbone extrahierte Einbettungen verwenden, um aufgabenspezifische Header zu optimieren.
Leistungsbewertung
Abbildung: RNAErnie erfasst mehrstufige Ontologiemuster. (Quelle: Paper)
Forscher haben die Methode evaluiert und die Ergebnisse zeigten, dass RNAErnie den aktuellen Stand der Technik bei sieben RNA-Sequenzdatensätzen übertrifft, die mehr als 17.000 wichtige RNA-Motive, 20 RNA-Typen und 50.000 RNA-Sequenzen abdecken.
Abbildung: RNAErnies Leistung bei der Aufgabe zur Vorhersage der RNA-Sekundärstruktur unter Verwendung der Datensätze ArchiveII600 und TS0. (Quelle: Papier)
Bewertet mit 30 gängigen RNA-Sequenzierungstechnologien, was die Verallgemeinerung und Robustheit von RNAErnie demonstriert. Das Team verwendete Genauigkeit, Präzision, Erinnerung, F1-Score, MCC und AUC als Bewertungsmetriken, um einen fairen Vergleich der RNA-seq-Analysemethoden sicherzustellen.
Derzeit gibt es nur wenige Studien zur Anwendung der Transformer-Architektur mit erweitertem externem Wissen auf die RNA-seq-Datenanalyse. Das von Grund auf neu entwickelte RNAErnie-Framework integriert die Einbettung von RNA-Sequenzen und selbstüberwachte Lernstrategien, um überlegene Leistung, Interpretierbarkeit und Generalisierungspotenzial für nachgelagerte RNA-Aufgaben zu bieten.
Darüber hinaus kann RNAErnie durch Modifizieren von Ausgängen und Überwachungssignalen an andere Aufgaben angepasst werden. RNAErnie ist öffentlich verfügbar und ein effizientes Werkzeug zum Verständnis der typgesteuerten RNA-Analyse und erweiterter Anwendungen.
Einschränkungen
Obwohl das RNAErnie-Modell in der RNA-Sequenzanalyse innovativ ist, steht es dennoch vor einigen Herausforderungen.
Erstens ist das Modell durch die Größe der RNA-Sequenzen, die es analysieren kann, begrenzt, da Sequenzen, die länger als 512 Nukleotide sind, verworfen werden und möglicherweise wichtige strukturelle und funktionelle Informationen übersehen werden. Blockierungsmethoden, die für die Verarbeitung längerer Sequenzen entwickelt wurden, können zu einem weiteren Verlust von Informationen über Interaktionen über große Entfernungen führen.
Zweitens ist der Fokus dieser Studie eng und konzentriert sich nur auf RNA-Domänen und erstreckt sich nicht auf Aufgaben wie die Vorhersage von RNA-Proteinen oder die Identifizierung von Bindungsstellen. Darüber hinaus stößt das Modell auf Schwierigkeiten, die dreidimensionalen Strukturmotive der RNA zu berücksichtigen, wie z. B. Schleifen und Verbindungen, die für das Verständnis der RNA-Funktion von entscheidender Bedeutung sind.
Noch wichtiger ist, dass bestehende Post-hoc-Architekturentwürfe auch potenzielle Einschränkungen aufweisen.
Fazit
Dennoch hat RNAErnie großes Potenzial, die RNA-Analyse voranzutreiben. Das Modell demonstriert seine Vielseitigkeit und Wirksamkeit als allgemeine Lösung für verschiedene nachgelagerte Aufgaben.
Darüber hinaus wird erwartet, dass die innovativen Strategien von RNAErnie die Leistung anderer vorab trainierter Modelle in der RNA-Analyse verbessern werden. Diese Erkenntnisse machen RNAErnie zu einem wertvollen Gut, das Forschern ein leistungsstarkes Werkzeug zur Verfügung stellt, um die Komplexität der RNA-bezogenen Forschung zu entschlüsseln.
Link zum Papier:https://www.nature.com/articles/s42256-024-00836-4
Das obige ist der detaillierte Inhalt vonMultifunktionale RNA-Analyse, das auf Transformer basierende RNA-Sprachmodell des Baidu-Teams wird in der Unterzeitschrift „Nature' veröffentlicht. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen











In der modernen Fertigung ist die genaue Fehlererkennung nicht nur der Schlüssel zur Sicherstellung der Produktqualität, sondern auch der Kern für die Verbesserung der Produktionseffizienz. Allerdings mangelt es vorhandenen Datensätzen zur Fehlererkennung häufig an der Genauigkeit und dem semantischen Reichtum, die für praktische Anwendungen erforderlich sind, was dazu führt, dass Modelle bestimmte Fehlerkategorien oder -orte nicht identifizieren können. Um dieses Problem zu lösen, hat ein Spitzenforschungsteam bestehend aus der Hong Kong University of Science and Technology Guangzhou und Simou Technology innovativ den „DefectSpectrum“-Datensatz entwickelt, der eine detaillierte und semantisch reichhaltige groß angelegte Annotation von Industriedefekten ermöglicht. Wie in Tabelle 1 gezeigt, bietet der Datensatz „DefectSpectrum“ im Vergleich zu anderen Industriedatensätzen die meisten Fehleranmerkungen (5438 Fehlerproben) und die detaillierteste Fehlerklassifizierung (125 Fehlerkategorien).

Herausgeber |KX Bis heute sind die durch die Kristallographie ermittelten Strukturdetails und Präzision, von einfachen Metallen bis hin zu großen Membranproteinen, mit keiner anderen Methode zu erreichen. Die größte Herausforderung, das sogenannte Phasenproblem, bleibt jedoch die Gewinnung von Phaseninformationen aus experimentell bestimmten Amplituden. Forscher der Universität Kopenhagen in Dänemark haben eine Deep-Learning-Methode namens PhAI entwickelt, um Kristallphasenprobleme zu lösen. Ein Deep-Learning-Neuronales Netzwerk, das mithilfe von Millionen künstlicher Kristallstrukturen und den entsprechenden synthetischen Beugungsdaten trainiert wird, kann genaue Elektronendichtekarten erstellen. Die Studie zeigt, dass diese Deep-Learning-basierte Ab-initio-Strukturlösungsmethode das Phasenproblem mit einer Auflösung von nur 2 Angström lösen kann, was nur 10 bis 20 % der bei atomarer Auflösung verfügbaren Daten im Vergleich zur herkömmlichen Ab-initio-Berechnung entspricht

Die offene LLM-Community ist eine Ära, in der hundert Blumen blühen und konkurrieren. Sie können Llama-3-70B-Instruct, QWen2-72B-Instruct, Nemotron-4-340B-Instruct, Mixtral-8x22BInstruct-v0.1 und viele andere sehen hervorragende Darsteller. Allerdings weisen offene Modelle im Vergleich zu den proprietären Großmodellen GPT-4-Turbo in vielen Bereichen noch erhebliche Lücken auf. Zusätzlich zu allgemeinen Modellen wurden einige offene Modelle entwickelt, die sich auf Schlüsselbereiche spezialisieren, wie etwa DeepSeek-Coder-V2 für Programmierung und Mathematik und InternVL für visuelle Sprachaufgaben.

Für KI ist die Mathematikolympiade kein Problem mehr. Am Donnerstag hat die künstliche Intelligenz von Google DeepMind eine Meisterleistung vollbracht: Sie nutzte KI, um meiner Meinung nach die eigentliche Frage der diesjährigen Internationalen Mathematikolympiade zu lösen, und war nur einen Schritt davon entfernt, die Goldmedaille zu gewinnen. Der IMO-Wettbewerb, der gerade letzte Woche zu Ende ging, hatte sechs Fragen zu Algebra, Kombinatorik, Geometrie und Zahlentheorie. Das von Google vorgeschlagene hybride KI-System beantwortete vier Fragen richtig und erzielte 28 Punkte und erreichte damit die Silbermedaillenstufe. Anfang dieses Monats hatte der UCLA-Professor Terence Tao gerade die KI-Mathematische Olympiade (AIMO Progress Award) mit einem Millionenpreis gefördert. Unerwarteterweise hatte sich das Niveau der KI-Problemlösung vor Juli auf dieses Niveau verbessert. Beantworten Sie die Fragen meiner Meinung nach gleichzeitig. Am schwierigsten ist es meiner Meinung nach, da sie die längste Geschichte, den größten Umfang und die negativsten Fragen haben

Im Jahr 2023 entwickeln sich fast alle Bereiche der KI in beispielloser Geschwindigkeit weiter. Gleichzeitig verschiebt die KI ständig die technologischen Grenzen wichtiger Bereiche wie der verkörperten Intelligenz und des autonomen Fahrens. Wird der Status von Transformer als Mainstream-Architektur großer KI-Modelle durch den multimodalen Trend erschüttert? Warum ist die Erforschung großer Modelle auf Basis der MoE-Architektur (Mixture of Experts) zu einem neuen Trend in der Branche geworden? Können Large Vision Models (LVM) ein neuer Durchbruch im allgemeinen Sehvermögen sein? ...Aus dem PRO-Mitglieder-Newsletter 2023 dieser Website, der in den letzten sechs Monaten veröffentlicht wurde, haben wir 10 spezielle Interpretationen ausgewählt, die eine detaillierte Analyse der technologischen Trends und industriellen Veränderungen in den oben genannten Bereichen bieten, um Ihnen dabei zu helfen, Ihre Ziele in der Zukunft zu erreichen Jahr vorbereitet sein. Diese Interpretation stammt aus Week50 2023

Herausgeber | Der Frage-Antwort-Datensatz (QA) von ScienceAI spielt eine entscheidende Rolle bei der Förderung der Forschung zur Verarbeitung natürlicher Sprache (NLP). Hochwertige QS-Datensätze können nicht nur zur Feinabstimmung von Modellen verwendet werden, sondern auch effektiv die Fähigkeiten großer Sprachmodelle (LLMs) bewerten, insbesondere die Fähigkeit, wissenschaftliche Erkenntnisse zu verstehen und zu begründen. Obwohl es derzeit viele wissenschaftliche QS-Datensätze aus den Bereichen Medizin, Chemie, Biologie und anderen Bereichen gibt, weisen diese Datensätze immer noch einige Mängel auf. Erstens ist das Datenformular relativ einfach, die meisten davon sind Multiple-Choice-Fragen. Sie sind leicht auszuwerten, schränken jedoch den Antwortauswahlbereich des Modells ein und können die Fähigkeit des Modells zur Beantwortung wissenschaftlicher Fragen nicht vollständig testen. Im Gegensatz dazu offene Fragen und Antworten

Herausgeber | KX-Retrosynthese ist eine entscheidende Aufgabe in der Arzneimittelforschung und organischen Synthese, und KI wird zunehmend eingesetzt, um den Prozess zu beschleunigen. Bestehende KI-Methoden weisen eine unbefriedigende Leistung und eine begrenzte Vielfalt auf. In der Praxis verursachen chemische Reaktionen häufig lokale molekulare Veränderungen mit erheblichen Überschneidungen zwischen Reaktanten und Produkten. Davon inspiriert schlug das Team von Hou Tingjun an der Zhejiang-Universität vor, die einstufige retrosynthetische Vorhersage als eine Aufgabe zur Bearbeitung molekularer Ketten neu zu definieren und dabei die Zielmolekülkette iterativ zu verfeinern, um Vorläuferverbindungen zu erzeugen. Außerdem wird ein bearbeitungsbasiertes retrosynthetisches Modell EditRetro vorgeschlagen, mit dem qualitativ hochwertige und vielfältige Vorhersagen erzielt werden können. Umfangreiche Experimente zeigen, dass das Modell beim Standard-Benchmark-Datensatz USPTO-50 K eine hervorragende Leistung mit einer Top-1-Genauigkeit von 60,8 % erzielt.

Herausgeber | ScienceAI Basierend auf begrenzten klinischen Daten wurden Hunderte medizinischer Algorithmen genehmigt. Wissenschaftler diskutieren darüber, wer die Werkzeuge testen soll und wie dies am besten geschieht. Devin Singh wurde Zeuge, wie ein pädiatrischer Patient in der Notaufnahme einen Herzstillstand erlitt, während er lange auf eine Behandlung wartete, was ihn dazu veranlasste, den Einsatz von KI zu erforschen, um Wartezeiten zu verkürzen. Mithilfe von Triage-Daten aus den Notaufnahmen von SickKids erstellten Singh und Kollegen eine Reihe von KI-Modellen, um mögliche Diagnosen zu stellen und Tests zu empfehlen. Eine Studie zeigte, dass diese Modelle die Zahl der Arztbesuche um 22,3 % verkürzen können und die Verarbeitung der Ergebnisse pro Patient, der einen medizinischen Test benötigt, um fast drei Stunden beschleunigt. Der Erfolg von Algorithmen der künstlichen Intelligenz in der Forschung bestätigt dies jedoch nur
