Herausgeber |. Die Vorhersage der Proteinkomplexstruktur spielt eine wichtige Rolle bei der Arzneimittelentwicklung, dem Antikörperdesign und anderen Anwendungen. Aufgrund der begrenzten Vorhersagegenauigkeit stimmen die Vorhersageergebnisse jedoch häufig nicht mit den experimentellen Ergebnissen überein.
Ein Forschungsteam der Peking-Universität, des Changping-Labors und der Harvard-Universität schlug ColabDock vor, ein allgemeines Framework, das Deep-Learning-Strukturvorhersagemodelle verwendet, um experimentelle Einschränkungen verschiedener Formen und Quellen zu integrieren, ohne dass weitere umfangreiche Umschulungen oder Feinabstimmungen erforderlich sind.
ColabDock übertrifft HADDOCK und ClusPro mit AlphaFold2 als Strukturvorhersagemodell, nicht nur bei komplexen Strukturvorhersagen mit simulierten Resten und Oberflächenbeschränkungen, sondern auch bei Strukturvorhersagen mit NMR-chemischen Verschiebungsstörungen und kovalenter Markierung auf diese Weise.
Außerdem kann es bei der Vorhersage der Antikörper-Antigen-Schnittstelle helfen, indem Einschränkungen beim Schnittstellen-Scan simuliert werden.
Die Studie trägt den Titel „
Integrierte Strukturvorhersage des Protein-Protein-Dockings mit experimentellen Beschränkungen unter Verwendung von ColabDock“ und wurde am 5. August 2024 in „Nature Machine Intelligence“ veröffentlicht.
Protein-Docking liefert wichtige Strukturinformationen zum Verständnis biologischer Mechanismen. Obwohl sich tiefe Modelle bei der Vorhersage von Proteinstrukturen schnell entwickelt haben, führen die meisten Modelle Vorhersagen im Free-Docking-Verfahren durch, was zu Inkonsistenzen zwischen experimentellen Einschränkungen und vorhergesagten Strukturen führen kann.
Um dieses Problem zu lösen, schlugen Forschungsteams der Peking-Universität, des Changping-Labors und anderer Institutionen einen allgemeinen Rahmen für die Vorhersage komplexer Konformationen mit eingeschränkten Bedingungen vor – ColabDock, ein allgemeines Protein-Protein-Andocken, das von spärlichen experimentellen Einschränkungen gesteuert wird.
Durch Gradienten-Backpropagation integriert diese Methode effektiv experimentell eingeschränkte Prioritäten und die Energielandschaft datengesteuerter Proteinstruktur-Vorhersagemodelle und sucht automatisch nach Konformationen, die beides erfüllen, während Konflikte oder Mehrdeutigkeiten in Einschränkungen toleriert werden.
ColabDock kann verschiedene Formen und Quellen experimenteller Einschränkungen nutzen, ohne dass weitere umfangreiche Umschulungen oder Feinabstimmungen erforderlich sind.
Abbildung: ColabDocks Arbeitsablauf. (Quelle: Papier)
In der Generierungsphase verwendet ColabDock ColabDesign, ein Protein-Design-Framework, das auf Basis von AlphaFold2 entwickelt wurde. Eingabesequenzprofile werden im Logit-Raum optimiert, um Strukturvorhersagemodelle zu steuern und komplexe Strukturen auf der Grundlage gegebener experimenteller Einschränkungen und Vorlagen zu generieren und gleichzeitig pLDDT- und pAE-Messungen zu maximieren.
In der Vorhersagephase wird die Struktur basierend auf der generierten komplexen Struktur und der vorgegebenen Vorlage vorhergesagt. Für jedes Ziel führt ColabDock mehrere Durchläufe durch und generiert unterschiedliche Konformationen. Die endgültige Konformation wurde durch einen SVM-Algorithmus (Ranked Support Vector Machine) ausgewählt.
Robuste LeistungAls Proof of Concept übernahmen die Forscher AlphaFold2 als Strukturvorhersagemodell in ColabDock. Natürlich können hier auch andere datengetriebene Deep-Learning-Modelle eingesetzt werden, wie zum Beispiel RoseTTAFold2 und AF-Multimer.
Die Forscher testeten ColabDock anhand synthetischer Datensätze und verschiedener Arten experimenteller Einschränkungen, darunter NMR-chemische Verschiebungsstörung (CSP), kovalente Markierung (CL) und simuliertes Deep Mutation Scanning (DMS).
Abbildung: ColabDocks Leistung beim Validierungssatz. (Quelle: Paper)
ColabDock wertet zwei Arten von Einschränkungen aus, nämlich 1v1- und MvN-Einschränkungen. Ersteres liegt auf der Rückstand-Rückstand-Ebene und Beispiele umfassen Einschränkungen von XL-MS. Letzteres liegt auf der Grenzflächenebene und ist für NMR- und CL-Experimente relevant.
Testergebnisse zu synthetischen Datensätzen zeigen, dass ColabDock eine zufriedenstellende Leistung erzielt. Darüber hinaus verbessert sich erwartungsgemäß die Leistung von ColabDock mit zunehmender Anzahl von Einschränkungen.
Selbst mit wenigen Einschränkungen übertrifft ColabDock AF-Multimer bei Benchmark-Datensätzen und den gleichen Rahmeneinstellungen und konvergiert zu weniger Konformationen, wenn mehr Einschränkungen bereitgestellt werden, was die effektive Anwendung zusätzlicher Informationen demonstriert.
Abbildung: Vergleich von ColabDock, HADDOCK und ClusPro am Benchmark-Set. (Quelle: Papier)
Im Vergleich zu HADDOCK und ClusPro schneidet ColabDock besser ab, wenn die Einschränkungsqualität höher ist. Bei beiden experimentellen Datensätzen übertrifft ColabDock immer noch HADDOCK und ClusPro, unabhängig von der Anzahl und Qualität der bereitgestellten Einschränkungen.
Abbildung: Leistungs- und Einschränkungsanalyse von ColabDock im CSP-Set. (Quelle: Papier)
Abschließend bewerteten die Forscher die Leistung verschiedener Docking-Methoden anhand des Antikörper-Antigen-Datensatzes. ColabDock prognostizierte einen viel höheren Anteil an Strukturen mittlerer oder höherer Qualität als HADDOCK und ClusPro.
Abbildung: Vergleich von ColabDock, HADDOCK und ClusPro auf dem Antikörper-Antigen-Benchmark-Set. (Quelle: Papier)
Dies zeigt, dass ColabDock potenziellen Anwendungswert beim Antikörperdesign hat. Darüber hinaus zeigt ColabDock im neu veröffentlichten unvoreingenommenen Datensatz immer noch eine vergleichbare oder sogar bessere Leistung als AF-Multimer.
Einschränkungen und Fazit
ColabDock weist auch einige Einschränkungen auf. Derzeit kann ColabDock nur Entfernungen akzeptieren, die kleiner als 22 Å sind, was durch die Obergrenze der Entfernungskarte in AlphaFold2 bestimmt wird. Aufgrund dieser Einschränkung ist das Modell nur auf eine kleine Teilmenge der XL-MS-Reagenzien anwendbar.
Ohne fragmentbasierte Optimierung kann ColabDock aufgrund des begrenzten Speichers nur Komplexe mit weniger als 1.200 Resten auf einer NVIDIA A100-Grafikverarbeitungseinheit (GPU) verarbeiten.
Zudem kann diese Methode insbesondere bei großen Proteinkomplexen sehr zeitaufwändig sein. Die Verwendung der bfloat16-Gleitkommaformatversion von AlphaFold2 soll dazu beitragen, Speicherplatz zu sparen und Berechnungen zu beschleunigen.
Ich glaube, dass ColabDock in Zukunft, nachdem Forscher es iterativ optimiert haben, als einheitliches Framework dazu beitragen kann, die Lücke zwischen experimenteller und rechnergestützter Proteinwissenschaft zu schließen.
Papierlink:https://www.nature.com/articles/s42256-024-00873-z
Das obige ist der detaillierte Inhalt vonIn der Fachzeitschrift „Nature' führt das allgemeine KI-Framework des Teams der Peking-Universität eine umfassende Strukturvorhersage für das Protein-Protein-Andocken durch und schließt so die Lücke zwischen Experiment und Berechnung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!