


Das Forschungsteam der Chinesischen Akademie der Wissenschaften veröffentlichte zwei wichtige Arbeiten: die Veröffentlichung des ersten groß angelegten Modells der Lebensgrundlagen verschiedener Arten und die Veröffentlichung eines neuen KI-Modells zur Vorhersage des Zellschicksals

Autor |. Multidisziplinäres Forschungsteam, Chinesische Akademie der Wissenschaften
Herausgeber |. ScienceAI
Das Humangenomprojekt, bekannt als eines der drei größten wissenschaftlichen Projekte der Menschheit im 20. Jahrhundert, hat eine eingehende Analyse eingeleitet der Geheimnisse des Lebens. Aufgrund der mehrdimensionalen und hochdynamischen Natur von Lebensprozessen ist es für traditionelle experimentelle Forschungsmethoden schwierig, die zugrunde liegenden allgemeinen Gesetze des genetischen Codes systematisch und genau zu entschlüsseln. Es ist dringend erforderlich, leistungsstarke Computertechnologie einzusetzen, um Darstellungsmodellierung und Wissen zu erreichen Entdeckung genetischer Daten.
Derzeit hat die Technologie der künstlichen Intelligenz mit großen Modellen als Kern Revolutionen in Bereichen wie Computer Vision und natürlichem Sprachverständnis ausgelöst und ein tiefgreifendes Verständnis von Daten und Wissen demonstriert. Es wird erwartet, dass sie im Bereich der biowissenschaftlichen Forschung angewendet wird um Gene systematisch und genau zu entschlüsseln
Vor kurzem hat das „Xcompass Consortium“, bestehend aus einem multidisziplinären interdisziplinären Forschungsteam der Chinesischen Akademie der Wissenschaften, erfolgreich wichtige Durchbrüche in der künstlichen Intelligenz erzielt, die die biowissenschaftliche Forschung stärkt Aufbau des weltweit ersten artenübergreifenden Biowissenschaften-Grundmodells – GeneCompass. Dieses Modell integriert die Transkriptomdaten von mehr als 126 Millionen Einzelzellen von Menschen und Mäusen, integriert vier Arten von Vorwissen, einschließlich Promotorsequenzen und Gen-Koexpressionsbeziehungen, und verfügt über ein grundlegendes Modellparametervolumen von 130 Millionen, wodurch die Vorhersage von Genen realisiert wird Das umfassende Lernen und Verstehen regulatorischer Gesetze unterstützt gleichzeitig die Vorhersage von Zellzustandsänderungen und die genaue Analyse verschiedener Lebensprozesse und zeigt das große Potenzial künstlicher Intelligenz bei der Stärkung der biowissenschaftlichen Forschung.
Die Studie trägt den Titel „GeneCompass: Deciphering Universal Gene Regulatory Mechanisms with Knowledge-Informed Cross-Species Foundation Model“ und wurde auf bioRxiv veröffentlicht. 🔜 Dieses Modell kann Kernfaktoren für die Umwandlung des Zellschicksals genau identifizieren und ist in der Lage, Störungen des Transkriptionsfaktors zu simulieren.
Die Studie trägt den Titel „CellPolaris: Decoding Cell Fate through Generalization Transfer Learning of Gene Regulatory Networks
bioRxiv veröffentlicht.
Link zum Papier: https://www.biorxiv.org/content/10.1101/2023.09.25.559244v1
GeneCompass: Das erste groß angelegte Modell der Lebensgrundlagen verschiedener ArtenUm unser Verständnis der wesentlichen Lebensgesetze zu verbessern und die Diagnose und Behandlung verschiedener schwerer Krankheiten zu verbessern, ist eine eingehende Erforschung der Genregulation erforderlich Mechanismen, die im Leben allgegenwärtig sind. Herkömmliche Forschungsmethoden haben jedoch einen geringen Durchsatz, sind auf einen einzelnen Modellorganismus beschränkt und können keine komplexen Genregulationsmechanismen aufdecken. In den letzten Jahren haben Durchbrüche in der Einzelzell-Omics-Technologie eine große Anzahl von Genexpressionsprofildaten verschiedener Arten hervorgebracht Zellen, die eine Grundlage für die Interpretation von Genen bilden. -Geninteraktionen bilden die Grundlage für Daten. Gleichzeitig kann die Entwicklung des Deep Learning, insbesondere die Entstehung großer generativer Modelle, die nichtlinearen Regulierungsmechanismen riesiger Datenmengen in verschiedenen Zellzuständen umfassend zusammenfassen, was der biowissenschaftlichen Forschung beispiellose Möglichkeiten eröffnet.
Ein großes Modell der Grundlagen des Lebens verschiedener Arten, einschließlich 120 Millionen Zellzahlen und 130 Millionen ParameternDas Team sammelte Open-Source-Einzelzell-Transkriptomdaten verschiedener Arten und erstellte nach Vorverarbeitungsprozessen wie Screening, Reinigung und Normalisierung die größten bekannten hochwertigen Trainingsdaten, darunter mehr als 126 Millionen Zellen in Mäusen und Menschen Die Sammlung scCompass-126M verwendet eine Deep-Learning-Architektur, die auf dem Transformer-Selbstaufmerksamkeitsmechanismus basiert und die langfristige dynamische Korrelation zwischen verschiedenen Genen in verschiedenen Zellhintergründen erfassen kann. Die Modellparametergröße erreicht 130 Millionen. Um eine hochauflösende Charakterisierung von Lebensprozessen zu erreichen, kodiert GeneCompass erstmals Genzahlen und Expressionsniveaus doppelt und ermöglicht so eine effektive und empfindliche Extraktion von Korrelationen zwischen Genen. Dies ermöglicht GeneCompass eine genauere Analyse von Gen-Gen-Interaktionen unter einer Vielzahl spezifischer Bedingungen, wie z. B. Zelltypen und Störungszuständen.
Das Einbetten von Vorwissen während des Vortrainings kann die Modellleistung effektiv verbessern.
Das Modell fügt Menschen hinzu, indem es vier biologische Vorkenntnisse effektiv integriert: Promotorsequenz, bekanntes Genregulationsnetzwerk, Informationen zur Genfamilie und Annotationsinformationen zur Gen-Koexpressionsbeziehung Die Kodierung verbessert das Verständnis komplexer Merkmalskorrelationen zwischen biologischen Daten. Durch Schulung und Integration von Dateninformationen und Vorkenntnissen verschiedener Arten soll GeneCompass die Effizienz und Genauigkeit der traditionellen biologischen Forschung verbessern und neue Einstiegspunkte für komplexe lebenswissenschaftliche Probleme schaffen, die noch nicht gelöst werden können.
Der Skalierungseffekt veranlasst das Modelltraining, um die konservativen Gesetze der biologischen Evolution zu erfassen.
Das Team stellte fest, dass das Modell, das vorab anhand großräumiger artenübergreifender Daten trainiert wurde, dem Skalierungsgesetz für die Unteraufgabe einer einzelnen Art entsprach : Das heißt, je größer die Multi-Spezies-Vortrainingsdaten im Maßstab sind, desto bessere vorab trainierte Darstellungen können erzeugt und die Leistung bei nachgelagerten Aufgaben weiter verbessert werden. Dieser Befund zeigt, dass zwischen den Arten konservierte Genregulationsmuster bestehen und dass diese Muster durch vorab trainierte Modelle gelernt und verstanden werden können. Gleichzeitig bedeutet dies auch, dass mit der Erweiterung der Arten und Daten eine weitere Verbesserung der Modellleistung zu erwarten ist
Leistungsvorteile bei mehreren Aufgaben Demonstrieren Sie die leistungsstarken Generalisierungsfähigkeiten grundlegender großer Modelle
Als bisher größtes vorab trainiertes Basislebensmodell mit Wissenseinbettung kann GeneCompass Transferlernen für mehrere nachgelagerte Aufgaben zwischen verschiedenen Arten implementieren und im Zelltyp verwendet werden Annotation, quantitative Genstörungsvorhersage, Arzneimittelsensitivitätsanalyse usw. In Bezug auf die Leistung erzielt es eine bessere Leistung als bestehende Methoden. Dies verdeutlicht vollständig die strategischen Vorteile des Vortrainings auf der Grundlage von unbeschrifteten Big Data für mehrere Arten und der anschließenden Verwendung verschiedener Teilaufgabendaten zur Modellfeinabstimmung. Es wird erwartet, dass es sich zu einer universellen Lösung für die Analyse und Vorhersage verschiedener biologischer Probleme im Zusammenhang mit Genen entwickelt -Zelleigenschaften.
Zellpolarisierung: Transferlernen entschlüsselt Genregulationsnetzwerke und sagt Zellschicksaländerungen voraus
Verwendung von Transferlernen zur Generierung zellspezifischer Genregulationsnetzwerke
Das Team entwickelte außerdem eine Reihe von generalisierten, auf Transferlernen basierenden Das Genregulationsnetzwerk erstellt ein KI-Modell namens CellPolaris. Das Modell sortiert zunächst Hunderte von Sätzen von Transkriptom- und Chromatin-Zugänglichkeitsdaten in passenden Zellszenarien, um ein qualitativ hochwertiges Genregulationsnetzwerk aufzubauen, und verwendet dann das verallgemeinerte Transferlernmodell, um mehr Gene in Zellszenarien zu generieren, die ausschließlich Transkriptomdaten verwenden . Anschließend entwickelten wir unter Verwendung des generierten, hochzuverlässigen Genregulationsnetzwerks ein Tool zur Identifizierung zentraler Transkriptionsfaktoren für Zellschicksalsübergänge und ein Simulationstool für Transkriptionsfaktorstörungen auf der Grundlage eines probabilistischen grafischen Modells. Dieses Modell kann die Kernfaktoren der Zellschicksalumwandlung effektiv identifizieren und die Simulation der Transkriptionsfaktorstörung realisieren. Es hat einen wichtigen Anwendungswert bei der Analyse von Genregulationsmechanismen und der Entdeckung krankheitsverursachender Gene.
Das vom CellPolaris-Modell generierte Genregulationsnetzwerk bietet eine Fülle von Molekülen Interaktionsinformationen können als Vorwissen für große Deep-Learning-Modelle verwendet werden. Die durch Deep-Learning-Großmodelle erzeugten niedrigdimensionalen Einbettungsvektoren werden wichtige Informationen für die Analyse von Genregulationsmechanismen und die Entdeckung krankheitsverursachender Gene liefern.
Die beiden oben genannten Studien wurden vom Team der „Compass Alliance“ durchgeführt. Das Team der „Compass Alliance“ besteht derzeit hauptsächlich aus dem Joint Computer Network Information Center des Instituts für Zoologie, der Chinesischen Akademie der Wissenschaften, dem Institut für Automatisierung Das Ziel der Allianz besteht darin, ein neues Paradigma der Life-Science-Forschung zu etablieren, das auf digitaler Intelligenz basiert und die wesentlichen Gesetze des Lebens analysiert.
Künstliche Intelligenz × [Biologie, Neurowissenschaften, Mathematik, Physik, Chemie, Materialien]
Das obige ist der detaillierte Inhalt vonDas Forschungsteam der Chinesischen Akademie der Wissenschaften veröffentlichte zwei wichtige Arbeiten: die Veröffentlichung des ersten groß angelegten Modells der Lebensgrundlagen verschiedener Arten und die Veröffentlichung eines neuen KI-Modells zur Vorhersage des Zellschicksals. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Diffusion kann nicht nur besser imitieren, sondern auch „erschaffen“. Das Diffusionsmodell (DiffusionModel) ist ein Bilderzeugungsmodell. Im Vergleich zu bekannten Algorithmen wie GAN und VAE im Bereich der KI verfolgt das Diffusionsmodell einen anderen Ansatz. Seine Hauptidee besteht darin, dem Bild zunächst Rauschen hinzuzufügen und es dann schrittweise zu entrauschen. Das Entrauschen und Wiederherstellen des Originalbilds ist der Kernbestandteil des Algorithmus. Der endgültige Algorithmus ist in der Lage, aus einem zufälligen verrauschten Bild ein Bild zu erzeugen. In den letzten Jahren hat das phänomenale Wachstum der generativen KI viele spannende Anwendungen in der Text-zu-Bild-Generierung, Videogenerierung und mehr ermöglicht. Das Grundprinzip dieser generativen Werkzeuge ist das Konzept der Diffusion, ein spezieller Sampling-Mechanismus, der die Einschränkungen bisheriger Methoden überwindet.

Kimi: In nur einem Satz, in nur zehn Sekunden ist ein PPT fertig. PPT ist so nervig! Um ein Meeting abzuhalten, benötigen Sie einen PPT; um einen wöchentlichen Bericht zu schreiben, müssen Sie einen PPT vorlegen, auch wenn Sie jemanden des Betrugs beschuldigen PPT. Das College ähnelt eher dem Studium eines PPT-Hauptfachs. Man schaut sich PPT im Unterricht an und macht PPT nach dem Unterricht. Als Dennis Austin vor 37 Jahren PPT erfand, hatte er vielleicht nicht damit gerechnet, dass PPT eines Tages so weit verbreitet sein würde. Wenn wir über unsere harte Erfahrung bei der Erstellung von PPT sprechen, treiben uns Tränen in die Augen. „Es dauerte drei Monate, ein PPT mit mehr als 20 Seiten zu erstellen, und ich habe es Dutzende Male überarbeitet. Als ich das PPT sah, musste ich mich übergeben.“ war PPT.“ Wenn Sie ein spontanes Meeting haben, sollten Sie es tun

Am frühen Morgen des 20. Juni (Pekinger Zeit) gab CVPR2024, die wichtigste internationale Computer-Vision-Konferenz in Seattle, offiziell die besten Beiträge und andere Auszeichnungen bekannt. In diesem Jahr wurden insgesamt 10 Arbeiten ausgezeichnet, darunter zwei beste Arbeiten und zwei beste studentische Arbeiten. Darüber hinaus gab es zwei Nominierungen für die beste Arbeit und vier Nominierungen für die beste studentische Arbeit. Die Top-Konferenz im Bereich Computer Vision (CV) ist die CVPR, die jedes Jahr zahlreiche Forschungseinrichtungen und Universitäten anzieht. Laut Statistik wurden in diesem Jahr insgesamt 11.532 Arbeiten eingereicht, von denen 2.719 angenommen wurden, was einer Annahmequote von 23,6 % entspricht. Laut der statistischen Analyse der CVPR2024-Daten des Georgia Institute of Technology befassen sich die meisten Arbeiten aus Sicht der Forschungsthemen mit der Bild- und Videosynthese und -generierung (Imageandvideosyn

Als weit verbreitete Programmiersprache ist die C-Sprache eine der grundlegenden Sprachen, die für diejenigen erlernt werden müssen, die sich mit Computerprogrammierung befassen möchten. Für Anfänger kann das Erlernen einer neuen Programmiersprache jedoch etwas schwierig sein, insbesondere aufgrund des Mangels an entsprechenden Lernwerkzeugen und Lehrmaterialien. In diesem Artikel werde ich fünf Programmiersoftware vorstellen, die Anfängern den Einstieg in die C-Sprache erleichtert und Ihnen einen schnellen Einstieg ermöglicht. Die erste Programmiersoftware war Code::Blocks. Code::Blocks ist eine kostenlose integrierte Open-Source-Entwicklungsumgebung (IDE) für

Wir wissen, dass LLM auf großen Computerclustern unter Verwendung umfangreicher Daten trainiert wird. Auf dieser Website wurden viele Methoden und Technologien vorgestellt, die den LLM-Trainingsprozess unterstützen und verbessern. Was wir heute teilen möchten, ist ein Artikel, der tief in die zugrunde liegende Technologie eintaucht und vorstellt, wie man einen Haufen „Bare-Metals“ ohne Betriebssystem in einen Computercluster für das LLM-Training verwandelt. Dieser Artikel stammt von Imbue, einem KI-Startup, das allgemeine Intelligenz durch das Verständnis der Denkweise von Maschinen erreichen möchte. Natürlich ist es kein einfacher Prozess, einen Haufen „Bare Metal“ ohne Betriebssystem in einen Computercluster für das Training von LLM zu verwandeln, aber Imbue hat schließlich erfolgreich ein LLM mit 70 Milliarden Parametern trainiert der Prozess akkumuliert

Schnellstart mit PyCharm Community Edition: Detailliertes Installations-Tutorial, vollständige Analyse Einführung: PyCharm ist eine leistungsstarke integrierte Python-Entwicklungsumgebung (IDE), die einen umfassenden Satz an Tools bereitstellt, mit denen Entwickler Python-Code effizienter schreiben können. In diesem Artikel wird die Installation der PyCharm Community Edition im Detail vorgestellt und spezifische Codebeispiele bereitgestellt, um Anfängern den schnellen Einstieg zu erleichtern. Schritt 1: PyCharm Community Edition herunterladen und installieren Um PyCharm verwenden zu können, müssen Sie es zunächst von der offiziellen Website herunterladen

Titel: Ein Muss für technische Anfänger: Schwierigkeitsanalyse der C-Sprache und Python, die spezifische Codebeispiele erfordert. Im heutigen digitalen Zeitalter ist Programmiertechnologie zu einer immer wichtigeren Fähigkeit geworden. Ob Sie in Bereichen wie Softwareentwicklung, Datenanalyse, künstliche Intelligenz arbeiten oder einfach nur aus Interesse Programmieren lernen möchten, die Wahl einer geeigneten Programmiersprache ist der erste Schritt. Unter vielen Programmiersprachen sind C-Sprache und Python zwei weit verbreitete Programmiersprachen, jede mit ihren eigenen Merkmalen. In diesem Artikel werden die Schwierigkeitsgrade der C-Sprache und von Python analysiert

Herausgeber des Machine Power Report: Yang Wen Die Welle der künstlichen Intelligenz, repräsentiert durch große Modelle und AIGC, hat unsere Lebens- und Arbeitsweise still und leise verändert, aber die meisten Menschen wissen immer noch nicht, wie sie sie nutzen sollen. Aus diesem Grund haben wir die Kolumne „KI im Einsatz“ ins Leben gerufen, um detailliert vorzustellen, wie KI durch intuitive, interessante und prägnante Anwendungsfälle für künstliche Intelligenz genutzt werden kann, und um das Denken aller anzuregen. Wir heißen Leser auch willkommen, innovative, praktische Anwendungsfälle einzureichen. Videolink: https://mp.weixin.qq.com/s/2hX_i7li3RqdE4u016yGhQ Vor kurzem wurde der Lebens-Vlog eines allein lebenden Mädchens auf Xiaohongshu populär. Eine Animation im Illustrationsstil, gepaart mit ein paar heilenden Worten, kann in nur wenigen Tagen leicht erlernt werden.
