


Die neue multimodale Datenanalyse- und Generierungsmethode JAMIE des UW-Chinese-Teams verbessert die Vorhersagefähigkeiten für Zelltyp und -funktion erheblich
In den letzten Jahren konnten wir mit der rasanten Entwicklung der Einzelzelltechnologie verschiedene Eigenschaften einzelner Zellen messen, um multimodale Einzelzelldaten zu erhalten (wie scRNA-seq, scATAC-seq, Patch-seq). ).
Diese Daten helfen uns, ein tieferes Verständnis zellulärer Funktionen und molekularer Mechanismen zu erlangen. Beispielsweise haben Forscher kürzlich Methoden des maschinellen Lernens eingesetzt, um die Beziehung zwischen multimodalen Daten einzelner Zellen zu analysieren und die biologischen Mechanismen zu verstehen, die an Zelltypen und Krankheiten beteiligt sind.
Allerdings ist die Erfassung multimodaler Einzelzellendaten oft kostspielig und es kommt häufig zu Modalverlusten. Bestehende Methoden des maschinellen Lernens erfordern in der Regel vollständig abgestimmte multimodale Daten zum Füllen und Einbetten von Daten und sind nicht für Situationen geeignet, in denen Modalitäten fehlen.
Um dieses Problem zu lösen, entwickelte Wang Daifengs Labor an der University of Wisconsin-Madison eine Open-Source-Methode für maschinelles Lernen, die auf gemeinsamen Variations-Autoencodern basiert – Joint Variational Autoencoders for Multimodal Imputation and Embedding (JAMIE).
JAMIE kann für die integrierte Analyse multimodaler Einzelzellendaten verwendet werden, wie z. B. Datenausrichtung, Einbettung und Ergänzung fehlender Daten, um Zelltypen und -funktionen besser vorherzusagen.
Diese Arbeit wurde kürzlich in Nature Machine Intelligence veröffentlicht.
Papieradresse: https://www.nature.com/articles/s42256-023-00663-z
Projektadresse: https://github.com/daifengwanglab /JAMIE: Einführung in die JAMIE-Methode
Wie in Abbildung 1 dargestellt, speist JAMIE zur Durchführung einer modalübergreifenden Imputation Daten in einen Encoder ein und verarbeitet dann die Latentraumergebnisse über den gegenüberliegenden Decoder.
JAMIE kombiniert die wiederverwendbare und flexible Latentraumgenerierung von Autoencodern mit der automatischen Korrespondenzschätzung von Ausrichtungsmethoden und ermöglicht so die Verarbeitung multimodaler Daten mit unvollständiger Korrespondenz.
Abbildung 1. Übersicht über die JAMIE-Methode
Im Einzelnen kann JAMIE in die folgenden zwei Schritte unterteilt werden: Vorverarbeitung der Eingabedaten. Nehmen wir als Beispiel den bimodalen Modus und gehen davon aus, dass die den Modi entsprechenden Datenmatrizen bzw. sind. Beachten Sie, dass hier die Merkmalsabmessungen und die Summe unterschiedlich sein können und auch die Anzahl der Stichproben unterschiedlich sein kann. Durch die Vorverarbeitung wird jede Zeile jeder Matrix so normalisiert, dass sie einen Mittelwert von 0 und eine Varianz von 1 aufweist. Wenn entsprechende Daten vorhanden sind, kann der Benutzer eine modale Korrelationsmatrix bereitstellen, um die Leistung zu verbessern. Dies bedeutet, dass die Stichprobe im Modal vollständig der Stichprobe im Modal entspricht, dass keine bekannte Entsprechung vorliegt und dass eine teilweise Übereinstimmung vorliegt Korrespondenz.
Verwenden Sie den gemeinsamen Variations-Autoencoder, um den latenten Ähnlichkeitsraum jeder Modalität zu lernen: und , wobei (Standard, vom Benutzer anpassbar) die Dimension des latenten Raums ist. Während des Trainingsprozesses minimiert JAMIE die folgende Verlustfunktion:
Für spezifische Ausdrücke der einzelnen Punkte sehen Sie sich bitte den Originaltext des Papiers an. Die Gewichtungen des zweiten, dritten und vierten Elements im Verhältnis zum ersten Element können vom Benutzer angepasst werden. JAMIE bietet auch Standardgewichtungen, die für häufige Situationen geeignet sind.
Die folgende Tabelle zeigt den Vergleich des Modells und Anwendungsbereichs von JAMIE mit den aktuellen State-of-the-Art-Methoden. JAMIE vereint die Funktionen mehrerer verschiedener Integrations- und Interpolationsmethoden in einer einzigen Architektur und ermöglicht so die Interpolation fehlender Modalitäten, die Kompatibilität von Nicht-Omics-Daten und die Möglichkeit, multimodale Daten mit nur teilweiser Übereinstimmung zu verarbeiten.
Tabelle 1. Vergleich verschiedener multimodaler Integrations- und fehlender modaler Füllmethoden. Durch eine einzige Architektur integriert JAMIE Funktionen aus mehreren verschiedenen Integrations- und Interpolationsmethoden. NLMA: Nonlinear Manifold Alignment [15], UnionCom [7], CCA: Canonical Correlation Analysis [15, 16], BABEL [5].
Hauptanwendungen von JAMIE
Integration und Phänotypvorhersage multimodaler Daten
Die Integration multimodaler Daten kann die Klassifizierungsleistung verbessern, das phänotypische Wissen und das Verständnis komplexer biologischer Mechanismen verbessern.
Angesichts zweier Datensätze und entsprechender Beziehungen kann JAMIE latente Raumdaten basierend auf dem trainierten Encoder generieren und basierend darauf Clustering oder Klassifizierung durchführen.
Clustering basierend auf latenten Raumdaten hat mehrere Vorteile, wie zum Beispiel die Einbeziehung beider Modalitäten in die Feature-Generierung. JAMIE kann dann Probenkorrespondenzen vorhersagen, beispielsweise die Vorhersage des Zelltyps.
Bei teilweise beschrifteten Datensätzen sollten Zellen im selben Cluster ähnliche Typen haben.
JAMIE trennt die Eigenschaften verschiedener Datentypen im Prozess der Generierung latenter Raumdaten, sodass komplexe Clustering- oder Klassifizierungsalgorithmen normalerweise nicht erforderlich sind, um bessere Ergebnisse zu erzielen.
Für hochdimensionale Daten verwendet JAMIE UMAP [32] zur Visualisierung der Zelltyp-Clusterbildung.
Kreuzmodale Datenimputation
Viele aktuelle kreuzmodale Imputationsmethoden können nicht nachweisen, dass sie die zugrunde liegenden biologischen Mechanismen für Imputationszwecke gelernt haben.
Im Vergleich zu Feedforward-Netzwerken oder linearen Regressionsmethoden kann JAMIE die zugrunde liegenden biologischen Mechanismen besser erlernen, um fehlende Daten auf der Grundlage strengerer mathematischer Grundlagen vorherzusagen.
Abbildung 2 zeigt JAMIES Prozess zur modalübergreifenden Datenbefüllung. JAMIE trainiert zunächst die Kodierungs- und Dekodierungsmodelle anhand der Trainingsdaten.
Für neue Daten verwendet JAMIE zunächst den aus den Daten erlernten Encoder, um sie in den latenten Raum zu projizieren, um sie zu erhalten, erhält sie dann durch Aggregation latenter Raummerkmale und dekodiert sie schließlich über den entsprechenden Decoder in fehlende Musterdaten.
JAMIE nutzt latenten Raum, um die Korrespondenz zwischen Zellen vorherzusagen, was dabei helfen kann, die Beziehung zwischen Datenmerkmalen und Phänotypen zu verstehen.
Abbildung 2. JAMIE-Cross-Modal-Interpolation
Erklärung der latenten Raummerkmale und Füllmerkmale
Um das zu erklären Modell übernimmt JAMIE SHAP (SHapley Additive Erläuterungen)[18].
SHAP bewertet die Bedeutung einzelner Eingabemerkmale durch Stichprobenmodulation der einzelnen vom Modell generierten Vorhersagen. Dies kann für eine Vielzahl interessanter Anwendungen genutzt werden.
Wenn die Zielvariable leicht nach Phänotyp getrennt werden kann, kann SHAP relevante Merkmale für weitere Untersuchungen identifizieren. Wenn wir außerdem eine Imputation durchführen, kann SHAP die vom Modell gelernten modalübergreifenden Verbindungen aufdecken.
Lernen Sie anhand eines Modells und eines Beispiels den SHAP-Wert, sodass sich der Hintergrundmerkmalsvektor befindet.
Wenn , dann ist die Summe der SHAP-Werte und der Hintergrundausgabe gleich, wobei jeder proportional zur Auswirkung auf die Modellausgabe ist.
Eine weitere nützliche Technik besteht darin, eine Schlüsselmetrik für die Klassifizierung (z. B. LTA [7, 19]) oder die Imputation (z. B. Korrespondenz zwischen unterstellten Merkmalen und gemessenen Merkmalen) auszuwählen und sie einzeln im Modell zu verwenden. Die Metrik ist ausgewertet, indem jedes Merkmal entfernt (durch Hintergrundwerte ersetzt) wird.
Wenn sich dann die Schlüsselmetrik verschlechtert, deutet dies darauf hin, dass die entfernten Features für die Ergebnisse des Modells wichtiger sind.
Experimentelle Ergebnisse
JAMIE verwendete zur Verifizierung vier häufig verwendete multimodale Einzelzellen-Datensätze.
(1) Simulierte multimodale Daten (300 Proben, 3 Zelltypen), generiert durch Gaußsche Verteilungsstichprobe verzweigter Mannigfaltigkeiten aus MMD-MA;
(2) aus dem visuellen Kortex der Maus (Patch-seq-Genexpression und elektrophysiologische Daten). Charakterisierungsdaten einzelner neuronaler Zellen im motorischen Kortex der Maus (1.208 Proben, 9 Zelltypen) und im motorischen Kortex der Maus (1.208 Proben, 9 Zelltypen); Zugänglichkeitsdaten für 8.981 Proben im sich entwickelnden menschlichen Gehirn (21 Schwangerschaftswochen, die 7 Hauptzelltypen in der menschlichen Großhirnrinde abdecken); die COLO-320DM-Colon-Adenokarzinom-Zelllinie.
Die Auswertung ergab, dass JAMIE deutlich besser ist als andere Methoden (Vergleich der Ergebnisse der Verzweigungsmannigfaltigkeitssimulationsdaten von MMD-MA in Abbildung 3 und Vergleich der Ergebnisse der visuellen Cortex-Daten der Maus in Abbildung 4) und der multimodalen Methode Vorrang einräumt Füllen wichtiger Funktionen und Bereitstellung potenziell neuer mechanistischer Erkenntnisse bei zellulärer Auflösung.
In Abbildung 3 werden die simulierten multimodalen Datenergebnisse verglichen, indem der UMAP-Algorithmus auf die räumlichen Rohdaten angewendet und entsprechend verschiedenen Zelltypen eingefärbt wird. b. UMAP des JAMIE-Latentraums. c. JAMIE und bestehende Techniken (CCA[15,16], LMA[15], MMD-MA[8], NLMA[15] und UnionCom[7]) bei Verwendung aller verfügbaren Korrespondenzinformationen für die Zelltyptrennung. Die x-Achse ist der Anteil der Stichproben, die näher am wahren Mittelwert liegen, und die y-Achse ist der LTA[7,19]-Wert. Im Modus 1 wird die kumulative Verteilung des 1-JS-Abstands berechnet, um die Ähnlichkeit der gemessenen und interpolierten Werte zu bewerten. Jede farbige Linie stellt die Ähnlichkeit eines bestimmten Zelltyps dar, während die schwarze Linie die durchschnittliche Ähnlichkeit zwischen den Zelltypen darstellt.
Neu formuliert: Der Vergleich der Genexpression und der elektrophysiologischen Signatur führt zu Ergebnissen im visuellen Kortex der Maus, wobei UMAP im ursprünglichen Raum verwendet wird und verschiedene Zelltypen gefärbt werden. Abbildung 4 zeigt die Vergleichsergebnisse. b. UMAP des JAMIE-Latentraums. c. JAMIE und bestehende Techniken (CCA[15,16], LMA[15], MMD-MA[8], NLMA[15] und UnionCom[7]) bei Verwendung aller verfügbaren Korrespondenzinformationen für die Zelltyptrennung. Die x-Achse ist der Anteil der Stichproben, die näher am wahren Mittelwert liegen, und die y-Achse ist der LTA[7,19]-Wert. Im Modus 1 wird die kumulative Verteilung der Ähnlichkeit zwischen gemessenen und interpolierten Werten untersucht, die aus der 1-JS-Distanz berechnet werden. Jede farbige Linie stellt die Ähnlichkeit eines Zelltyps dar, während die schwarze Linie die durchschnittliche Ähnlichkeit verschiedener Zelltypen darstellt.
Zusammenfassend ist JAMIE ein neues tiefes neuronales Netzwerkmodell für die integrierte Vorhersage multimodaler Einzelzellendaten. Es eignet sich für komplexe, gemischte oder teilweise entsprechende multimodale Daten und wird durch eine neuartige latente Einbettungsaggregationsmethode implementiert, die auf einer Joint Variational Autoencoder (VAE)-Struktur basiert. Neben der oben genannten überlegenen Leistung verfügt JAMIE auch über effiziente Rechenfunktionen und einen geringen Speicherbedarf. Darüber hinaus können vorab trainierte Modelle und erlernte modalübergreifende latente Einbettungen in nachgelagerten Analysen wiederverwendet werden. Natürlich nimmt das Training von Variational Autoencodern (VAEs) bei größeren Datensätzen viel Zeit in Anspruch. Daher tragen frühere Methoden zur Funktionsauswahl wie die automatische PCA in JAMIE dazu bei, den Zeitaufwand zu verringern. Da VAE Rekonstruktionsverluste verwendet, ist die Datenvorverarbeitung auch von entscheidender Bedeutung, um zu verhindern, dass große oder wiederholte Features unverhältnismäßig große oder wiederholte Features beeinträchtigen und niedrigdimensionale eingebettete Features beeinträchtigen. Für eine spezifische modalübergreifende Imputation muss die Vielfalt des Trainingsdatensatzes sorgfältig berücksichtigt werden, um eine Verzerrung des endgültigen Modells und eine negative Auswirkung auf seine Generalisierungsfähigkeit zu vermeiden. JAMIE kann möglicherweise auch erweitert werden, um Datensätze aus unterschiedlichen Quellen anstelle unterschiedlicher Modalitäten, wie etwa Genexpressionsdaten unter unterschiedlichen Bedingungen, abzugleichen. Die Autoren des Papiers sind Noah Cohen Kalafut (Doktorand im Fachbereich Informatik), Huang Xiang (leitender Forscher) und Wang Daifeng (PI). Abteilung für Biostatistik und Medizinische Informatik, Abteilung für Informatik, University of Wisconsin-Madison und Weisman Research Center. Der korrespondierende Autor ist Professor Wang Daifeng. Das 1973 gegründete Weisman Center treibt seit einem halben Jahrhundert die Forschung in den Bereichen menschliche Entwicklung, neurologische Entwicklungsstörungen und neurodegenerative Erkrankungen voran. Einführung in die Autoren
Das obige ist der detaillierte Inhalt vonDie neue multimodale Datenanalyse- und Generierungsmethode JAMIE des UW-Chinese-Teams verbessert die Vorhersagefähigkeiten für Zelltyp und -funktion erheblich. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Der Sprung in den Kryptowährungsmarkt hat bei den Anlegern Panik verursacht, und Dogecoin (DOGE) ist zu einem der am stärksten getroffenen Bereiche geworden. Der Preis fiel stark, und die Gesamtwertsperrung der dezentralen Finanzierung (DEFI) (TVL) verzeichnete ebenfalls einen signifikanten Rückgang. Die Verkaufswelle von "Black Monday" fegte den Kryptowährungsmarkt, und Dogecoin war der erste, der getroffen wurde. Die Defitvl fiel auf 2023 und der Währungspreis fiel im vergangenen Monat um 23,78%. Die Defitvl von Dotecoin fiel auf ein Tiefpunkt von 2,72 Millionen US -Dollar, hauptsächlich aufgrund eines Rückgangs des SOSO -Wertindex um 26,37%. Andere große Defi -Plattformen wie die langweilige DAO und Thorchain, TVL, fielen ebenfalls um 24,04% bzw. 20.

Zu den Top -Börsen gehören: 1. Binance, das weltweit größte Handelsvolumen, unterstützt 600 Währungen und die Spot -Handhabungsgebühr beträgt 0,1%. 2. OKX, eine ausgewogene Plattform, unterstützt 708 Handelspaare, und die dauerhafte Vertragsabwicklungsgebühr beträgt 0,05%. 3. Gate.io deckt 2700 kleine Währungen ab, und die Gebühr für die Spot-Handhabung beträgt 0,1%-0,3%; 4. Coinbase, der US -Konformitäts -Benchmark, die Spot -Handhabungsgebühr beträgt 0,5%; 5. Kraken, die Top -Sicherheit und regelmäßige Reserveprüfung.

Börsen spielen eine wichtige Rolle auf dem heutigen Kryptowährungsmarkt. Sie sind nicht nur Plattformen, an denen Investoren handeln, sondern auch wichtige Quellen für Marktliquidität und Preisentdeckung. Der weltweit größte virtuelle Währungsbörsen gehören zu den Top Ten, und diese Börsen sind nicht nur im Handelsvolumen weit voraus, sondern haben auch ihre eigenen Vorteile in Bezug auf Benutzererfahrung, Sicherheit und innovative Dienste. Börsen, die über die Liste stehen, haben normalerweise eine große Benutzerbasis und einen umfangreichen Markteinfluss, und deren Handelsvolumen und Vermögenstypen sind häufig mit anderen Börsen schwer zu erreichen.

Binance ist der Overlord des Global Digital Asset Trading -Ökosystems, und seine Merkmale umfassen: 1. Das durchschnittliche tägliche Handelsvolumen übersteigt 150 Milliarden US -Dollar, unterstützt 500 Handelspaare, die 98% der Mainstream -Währungen abdecken. 2. Die Innovationsmatrix deckt den Markt für Derivate, das Web3 -Layout und den Bildungssystem ab; 3. Die technischen Vorteile sind Millisekunden -Matching -Engines mit Spitzenvolumina von 1,4 Millionen Transaktionen pro Sekunde. 4. Compliance Progress hält 15 Länderlizenzen und legt konforme Einheiten in Europa und den Vereinigten Staaten ein.

Auf dem volatilen Kryptowährungsmarkt suchen Anleger nach Alternativen, die über die beliebten Währungen hinausgehen. Obwohl bekannte Kryptowährungen wie Solana (SOL), Cardano (ADA), XRP und Doge (DOGE) auch Herausforderungen wie Marktgefühle, regulatorische Unsicherheit und Skalierbarkeit gegenübersehen. Ein neues aufstrebendes Projekt, Rexasfinance (RXS), entsteht jedoch. Es stützt sich nicht auf Prominenteffekte oder Hype, sondern konzentriert sich auf die Kombination der realen Vermögenswerte (RWA) mit Blockchain-Technologie, um den Anlegern eine innovative Möglichkeit zum Investieren zu bieten. Diese Strategie hofft, eines der erfolgreichsten Projekte von 2025 zu sein. Rexasfi

Die dezentrale Social -Media -Plattform Tox hat eine strategische Partnerschaft mit Omnilabs erreicht, die führend in Lösungen für künstliche Intelligenzinfrastrukturlösungen ist, um künstliche Intelligenzfunktionen in das Web3 -Ökosystem zu integrieren. Diese Partnerschaft wird vom offiziellen X -Konto von Tox veröffentlicht und zielt darauf ab, eine fairere und intelligentere Online -Umgebung aufzubauen. Omnilabs ist bekannt für seine intelligenten autonomen Systeme, wobei die AIAAS-Fähigkeit (AI-AS-a-Service) zahlreiche Defi- und NFT-Protokolle unterstützt. Die Infrastruktur verwendet KI-Agenten für Echtzeitentscheidungen, automatisierte Prozesse und eingehende Datenanalyse, um sich nahtlos in das dezentrale Ökosystem zu integrieren, um die Blockchain-Plattform zu stärken. Die Zusammenarbeit mit TOX wird die KI -Tools von Omnilabs umfangreicher machen, indem sie in dezentrale soziale Netzwerke integriert werden.

Die Plattformen, die im Jahr 2025 im Leveraged Trading, Security und Benutzererfahrung hervorragende Leistung haben, sind: 1. OKX, geeignet für Hochfrequenzhändler und bieten bis zu 100-fache Hebelwirkung; 2. Binance, geeignet für Mehrwährungshändler auf der ganzen Welt und bietet 125-mal hohe Hebelwirkung; 3. Gate.io, geeignet für professionelle Derivate Spieler, die 100 -fache Hebelwirkung bietet; 4. Bitget, geeignet für Anfänger und Sozialhändler, die bis zu 100 -fache Hebelwirkung bieten; 5. Kraken, geeignet für stetige Anleger, die fünfmal Hebelwirkung liefert; 6. Bybit, geeignet für Altcoin -Entdecker, die 20 -fache Hebelwirkung bietet; 7. Kucoin, geeignet für kostengünstige Händler, die 10-fache Hebelwirkung bietet; 8. Bitfinex, geeignet für das Seniorenspiel

Worldcoin (WLD) fällt auf dem Kryptowährungsmarkt mit seinen einzigartigen biometrischen Überprüfungs- und Datenschutzschutzmechanismen auf, die die Aufmerksamkeit vieler Investoren auf sich ziehen. WLD hat mit seinen innovativen Technologien, insbesondere in Kombination mit OpenAI -Technologie für künstliche Intelligenz, außerdem unter Altcoins gespielt. Aber wie werden sich die digitalen Vermögenswerte in den nächsten Jahren verhalten? Lassen Sie uns den zukünftigen Preis von WLD zusammen vorhersagen. Die Preisprognose von 2025 WLD wird voraussichtlich im Jahr 2025 ein signifikantes Wachstum in WLD erzielen. Die Marktanalyse zeigt, dass der durchschnittliche WLD -Preis 1,31 USD mit maximal 1,36 USD erreichen kann. In einem Bärenmarkt kann der Preis jedoch auf rund 0,55 US -Dollar fallen. Diese Wachstumserwartung ist hauptsächlich auf Worldcoin2 zurückzuführen.
