Als neue Methode der Glykoproteomik entwickelte Fudan ein hybrides End-to-End-Framework auf Basis von Transformer und GNN, veröffentlicht im Nature-Unterjournal

WBOY
Freigeben: 2024-08-06 08:31:22
Original
347 Leute haben es durchsucht

Als neue Methode der Glykoproteomik entwickelte Fudan ein hybrides End-to-End-Framework auf Basis von Transformer und GNN, veröffentlicht im Nature-Unterjournal

Herausgeber |. Rettichschale

Die Proteinglykosylierung ist eine posttranslationale Modifikation von Proteinen durch Zuckergruppen, die eine wichtige Rolle bei verschiedenen physiologischen und pathologischen Funktionen von Zellen spielt.

Glykoproteomik ist die Untersuchung der Proteinglykosylierung innerhalb des Proteoms, wobei Flüssigkeitschromatographie in Verbindung mit Tandem-Massenspektrometrie (MS/MS)-Technologie verwendet wird, um kombinierte Informationen über Glykosylierungsstellen, Glykosylierungsniveaus und Zuckerstrukturen zu erhalten.

Allerdings haben aktuelle Datenbanksuchmethoden für die Glykoproteomik aufgrund des begrenzten Vorkommens strukturbestimmender Ionen häufig Schwierigkeiten bei der Bestimmung von Glykanstrukturen. Obwohl spektrale Suchmethoden die Fragmentierungsintensität nutzen können, um die strukturelle Identifizierung von Glykopeptiden zu erleichtern, behindern Schwierigkeiten beim Aufbau von Spektralbibliotheken ihre Anwendung.

In der neuesten Studie schlugen Forscher der Fudan-Universität DeepGP vor, ein hybrides Deep-Learning-Framework, das auf Transformer- und graphischen neuronalen Netzen basiert, zur Vorhersage von MS/MS-Spektren und Retentionszeiten (RT) von Glykopeptiden.

Zwei graphische neuronale Netzwerkmodule werden verwendet, um verzweigte Zuckerstrukturen zu erfassen und jeweils Zuckerionenstärken vorherzusagen. Darüber hinaus wurde eine Pre-Training-Strategie implementiert, um den Mangel an glykoproteomischen Daten zu beheben.

Diese Studie trägt den Titel „Deep Learning Prediction of Glycopeptide Tandem Mass Spectra Powers Glycoproteomics“ und wurde am 30. Juli 2024 in „Nature Machine Intelligence“ veröffentlicht.

Als neue Methode der Glykoproteomik entwickelte Fudan ein hybrides End-to-End-Framework auf Basis von Transformer und GNN, veröffentlicht im Nature-Unterjournal

Posttranslationale Proteinmodifikationen (PTMs) erhöhen die Komplexität des Proteoms erheblich. Als eines der wichtigsten PTMs betrifft die Glykosylierung mehr als 50 % der Säugetierproteine ​​und spielt eine Schlüsselrolle bei vielen physiologischen und pathologischen Prozessen.

Während des Glykosylierungsprozesses werden Zuckermoleküle an die Seitenketten bestimmter Aminosäurereste gebunden, was zu struktureller Heterogenität führt, was zu einer Diversität der Glykopeptid-Isomere führt und die Schwierigkeit der Identifizierung erhöht.

Flüssigkeitschromatographie-Tandem-Massenspektrometrie (LC-MS/MS) ist die primäre Technik zur Identifizierung von Glykopeptiden anhand von Fragmentionen und Molekulargewicht in Kombination mit RT. Das Masse-Ladungs-Verhältnis (m/z) allein reicht nicht aus, um die Zuckerstruktur zu bestimmen. Daher verwenden Wissenschaftler spektrale Matching-Methoden, um die Identifizierungsempfindlichkeit zu verbessern. Der Aufbau von Glycopeptid-MS/MS-Spektralbibliotheken ist jedoch kostspielig und komplex.

In den letzten Jahren hat Deep Learning Fortschritte bei der Vorhersage des Peptid-MS/MS-Spektrums gemacht. Allerdings schränkt die relativ geringe Anzahl aktueller Glycopeptidomics-Datensätze und das Fehlen standardisierter Protokolle zur Generierung von Glycopeptid-Massenspektrometriedaten die Verfügbarkeit geeigneter Daten für das Deep-Learning-Modelltraining ein.

Zu diesem Zweck schlagen Forscher der Fudan-Universität DeepGP vor, ein auf Deep Learning basierendes hybrides End-to-End-Framework für vollständige N-Glykopeptid-MS/MS-Spektren und RT-Vorhersage. Das Deep-Learning-Framework besteht aus einem vorab trainierten Transformer-Modul und zwei Graph Neural Network (GNN)-Modulen.

Als neue Methode der Glykoproteomik entwickelte Fudan ein hybrides End-to-End-Framework auf Basis von Transformer und GNN, veröffentlicht im Nature-Unterjournal

Abbildung: Modellarchitektur und Glykopeptid-MS/MS-Spektralvorhersage. Das DeepGP-Modell akzeptiert Glykopeptide als Eingabe. Vorläuferladungszustand

    Der Zucker Die Struktur wird durch GNN eingebettet, um das Glykopeptid in ein Diagramm umzuwandeln:
  • Knoten: Monosaccharid

      Abbildung: Unterscheidung ähnlicher Glykanzusammensetzungen in synthetischen Datensätzen basierend auf DeepGP. (Quelle: Papier)
    1. Zwei GNN-Module erfassen die Zuckerstruktur und sagen die Intensität von Zuckerionen voraus.
    2. Forscher evaluierten drei GNN-Architekturen, darunter das Graph Convolutional Network (GCN), das Graph Isomorphism Network (GIN) und das Graph Attention Network (GAT) für die Zuckerinterkalation und B/Y-Ionenintensitätsvorhersage.
    3. GCN nutzt Faltungsoperationen, um Knotendarstellungen zu erhalten, und implementiert ein Nachrichtenübermittlungsprotokoll, um die Darstellungen benachbarter Knoten zu aggregieren. GAT kombiniert einen Aufmerksamkeitsmechanismus, der es dem Modell ermöglicht, sich auf die relevantesten Teile der Eingabe zu konzentrieren .
    4. Experimentelle Ergebnisse zeigen, dass GCN bei der Zuckereinbettungsaufgabe am besten abschneidet, während GIN bei der B/Y-Ionenintensitätsvorhersageaufgabe gut abschneidet, daher wurden GCN und GIN für die entsprechende Analyse ausgewählt.
    5. Abbildung: DeepGP-Leistung bei der MS/MS-Vorhersage. (Quelle: Papier)
  • Strategie vor dem Training, um den Mangel an Glykoproteomikdaten zu lindern

    • DeepGP verwendet eine große Menge unbeschrifteter Daten in natürlicher Sprache für das Vortraining, ähnlich wie Modelle wie BERT. Das Vortraining ermöglicht es dem Modell, vor dem formellen Training über eine Wissensbasis zu verfügen, wodurch seine Leistung im Umgang mit kleinen annotierten Daten verbessert wird.

      Als neue Methode der Glykoproteomik entwickelte Fudan ein hybrides End-to-End-Framework auf Basis von Transformer und GNN, veröffentlicht im Nature-Unterjournal

      Testen mehrerer biologischer Datensätze

    Die Forscher demonstrierten die hohe Genauigkeit von DeepGP bei MS/MS- und RT-Vorhersagen anhand von Maus- und menschlichen Probendatensätzen.

    Als neue Methode der Glykoproteomik entwickelte Fudan ein hybrides End-to-End-Framework auf Basis von Transformer und GNN, veröffentlicht im Nature-Unterjournal

    Abbildung: DeepGP kombiniert mit pGlyco3 (einer Glykopeptid-Suchmethode) zur Glykopeptid-Identifizierung. (Quelle: Papier)

    Umfassendes Benchmarking von DeepGP anhand synthetischer und biologischer Datensätze bestätigt seine Wirksamkeit bei der Unterscheidung ähnlicher Glykane. DeepGP verbessert in Kombination mit Datenbanksuchen die Empfindlichkeit der Glykopeptiderkennung.

    Link zum Papier:
    https://www.nature.com/articles/s42256-024-00875-x

Das obige ist der detaillierte Inhalt vonAls neue Methode der Glykoproteomik entwickelte Fudan ein hybrides End-to-End-Framework auf Basis von Transformer und GNN, veröffentlicht im Nature-Unterjournal. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:jiqizhixin.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage
Über uns Haftungsausschluss Sitemap
Chinesische PHP-Website:Online-PHP-Schulung für das Gemeinwohl,Helfen Sie PHP-Lernenden, sich schnell weiterzuentwickeln!