


Das Team der Chinesischen Akademie der Wissenschaften erstellt einen einheitlichen Rahmen zur Verbesserung der Vorhersagegenauigkeit enzymkinetischer Parameter
Herausgeber |. Rettichhaut
Die Vorhersage enzymkinetischer Parameter ist für das Design und die Optimierung von Enzymen in der Biotechnologie und bei industriellen Anwendungen von entscheidender Bedeutung. Die begrenzte Leistung aktueller Vorhersagetools bei verschiedenen Aufgaben schränkt jedoch ihre praktische Anwendung ein.
Forscher der Chinesischen Akademie der Wissenschaften haben kürzlich UniKP vorgeschlagen, ein einheitliches Framework, das auf vorab trainierten Sprachmodellen basiert und zur Vorhersage enzymkinetischer Parameter verwendet werden kann, einschließlich der Enzymumsatzzahl (kcat), der Michaelis-Menten-Konstante (Km) und der katalytischen Effizienz (kcat/Km), diese Parameter werden aus der Proteinsequenz und der Substratstruktur erhalten.
Es wird auch ein zweischichtiges Framework basierend auf UniKP (EF-UniKP) vorgeschlagen, das kcat-Werte unter Berücksichtigung von Umweltfaktoren wie pH-Wert und Temperatur stabil vorhersagen kann. Gleichzeitig untersuchte das Forschungsteam systematisch vier repräsentative Neugewichtungsmethoden, um Vorhersagefehler bei hochwertigen Vorhersageaufgaben erfolgreich zu reduzieren.
Die Studie trägt den Titel „UniKP: ein einheitliches Framework für die Vorhersage enzymkinetischer Parameter“ und wurde am 11. Dezember 2023 in der Zeitschrift „Nature Communications“ veröffentlicht.
Die Untersuchung der katalytischen Effizienz von Enzymen auf bestimmten Substraten ist ein wichtiges Thema in der Biologie und hat tiefgreifende Auswirkungen auf die Enzymevolution, das Stoffwechsel-Engineering und die synthetische Biologie. In-vitro-Experimentaldaten zur Messung von kcat und Km sowie der maximalen Umsatzrate und der Michaelis-Menten-Konstante können als Indikatoren zur Messung der Effizienz von Enzymen bei der Katalyse spezifischer Reaktionen und zum Vergleich der relativen katalytischen Aktivitäten verschiedener Enzyme verwendet werden.
Derzeit beruht die Messung enzymkinetischer Parameter hauptsächlich auf experimentellen Messungen, die zeitaufwändig, kostspielig und arbeitsintensiv sind, was zu einer kleinen Datenbank experimentell gemessener kinetischer Parameterwerte führt. Beispielsweise enthält die Sequenzdatenbank UniProt über 230 Millionen Enzymsequenzen, während die Enzymdatenbanken BRENDA und SABIO-RK Zehntausende experimentell gemessene kcat-Werte enthalten. Die Integration von Uniprot-Identifikatoren in diese Enzymdatenbanken erleichtert die Verbindung zwischen gemessenen Parametern und Proteinsequenzen. Allerdings ist der Umfang dieser Verbindungen im Vergleich zur Anzahl der Enzymsequenzen immer noch viel kleiner, was den Fortschritt bei nachgelagerten Anwendungen wie der gerichteten Evolution und dem Metabolic Engineering begrenzt.
Framework zur Vorhersage enzymkinetischer Parameter
In dieser Studie haben Forscher der Chinesischen Akademie der Wissenschaften ein neues Framework namens UniKP vorgeschlagen, das auf vorab trainierten Sprachmodellen basiert und darauf abzielt, die Genauigkeit der Vorhersage enzymkinetischer Parameter zu verbessern . Zu diesen Parametern gehören kcat, Km und kcat/Km, die anhand der Enzymsequenz und der Substratstruktur vorhergesagt werden können. Die Forscher führten einen umfassenden Vergleich von 16 verschiedenen Modellen für maschinelles Lernen und zwei Deep-Learning-Modellen durch und stellten fest, dass UniKP hinsichtlich der Vorhersagegenauigkeit gut abschneidet. Diese Forschung soll neue Werkzeuge und Methoden für Forschung und Anwendungen im Bereich der Enzymkinetik liefern.
Abbildung: UniKP-Übersicht. (Quelle: Papier)
Im Vergleich zum vorherigen hochmodernen Modell DLKcat zeigt UniKP eine überlegene Leistung bei der kcat-Vorhersageaufgabe mit einem durchschnittlichen Bestimmtheitsmaß von 0,68, was einer Verbesserung von 20 % entspricht. Die Forscher spekulieren, dass das vorab trainierte Modell erheblich zur Leistung von UniKP beiträgt, indem es unbeaufsichtigte Informationen aus der gesamten Datenbank nutzt, um leicht zu erlernende Darstellungen von Enzymsequenzen und Substratstrukturen zu erstellen.
Die Analyse des Modelllernens zeigt, dass Proteininformationen eine dominierende Rolle spielen, möglicherweise aufgrund der Komplexität der Enzymstruktur im Vergleich zur Substratstruktur. Darüber hinaus kann UniKP kleine Unterschiede in den kcat-Werten zwischen Enzymen und ihren Mutanten effektiv erfassen, einschließlich experimentell gemessener Fälle, was für das Enzymdesign und die Enzymmodifikation von entscheidender Bedeutung ist. Der Unterschied zwischen dem R^2 der von UniKP vorhergesagten Werte und dem R^2 der gmean-Methode für Regionen mit hoher und niedriger Identität zeigt die Fähigkeit von UniKP, tiefer miteinander verbundene Informationen zu extrahieren und somit bei diesen Aufgaben gute Ergebnisse zu erzielen.
Zweischichtiges Framework EF-UniKP
Die meisten aktuellen Modelle berücksichtigen keine Umweltfaktoren, was eine wesentliche Einschränkung bei der Simulation realer experimenteller Bedingungen darstellt. Um dieses Problem zu lösen, schlugen die Forscher ein zweischichtiges Framework EF-UniKP vor, das Umweltfaktoren berücksichtigt. Basierend auf zwei neu erstellten Datensätzen mit pH- bzw. Temperaturinformationen zeigt EF-UniKP eine verbesserte Leistung im Vergleich zum ursprünglichen UniKP. Dabei handelt es sich um eine genaue, vom Organismus unabhängige und kontextabhängige kcat-Vorhersage mit hohem Durchsatz. Darüber hinaus besteht das Potenzial, diesen Ansatz auf andere Faktoren wie Co-Substrat und NaCl-Konzentration zu erweitern.
Abbildung: Zweischichtiges Framework unter Berücksichtigung von Umweltfaktoren. (Quelle: Papier)
Allerdings berücksichtigen bestehende Modelle die Wechselwirkung zwischen diesen Faktoren aufgrund fehlender umfassender Daten nicht. Mit der Weiterentwicklung experimenteller Techniken, einschließlich der Automatisierung von Biocast-Laboren und sich ständig weiterentwickelnden Methoden, rechnen Forscher mit einer Zunahme enzymkinetischer Daten. Dieser Zustrom hat nicht nur das Fachgebiet bereichert, sondern auch die Genauigkeit von Vorhersagemodellen verbessert.
Aufgrund des hohen Ungleichgewichts des kcat-Datensatzes, das zu höheren Fehlern bei Vorhersagen hoher kcat-Werte führt, untersuchte das Team systematisch vier repräsentative Neugewichtungsmethoden, um dieses Problem zu lindern. Die Ergebnisse zeigen, dass die Hyperparametereinstellungen jeder Methode entscheidend für die Verbesserung der Vorhersagen hoher kcat-Werte sind.
Das Team bestätigte die starke Allgemeingültigkeit des aktuellen Rahmenwerks sowohl bei der Vorhersage der Michaelis-Konstante (Km) als auch bei der kcat/Km-Vorhersage. UniKP erreicht Spitzenleistungen bei der Vorhersage von Km-Werten und übertrifft, was noch beeindruckender ist, die kombinierten Ergebnisse aktueller Modelle auf dem neuesten Stand der Technik bei der Vorhersage von kcat/Km-Werten. Darüber hinaus validierten die Forscher das UniKP-Framework auf der Grundlage experimentell gemessener kcat/Km-Werte und kcat/Km-Werten, die mithilfe von kcat- und Km-Vorhersagemodellen für den kcat/Km-Datensatz berechnet wurden.
Es ist erwähnenswert, dass die beobachtete Korrelation zwischen den aus UniKP kcat / UniKP Km abgeleiteten Werten und dem experimentellen kcat / Km relativ gering ist (PCC = −0,01). Dieser Unterschied kann auf die unterschiedlichen Datensätze zurückzuführen sein, die bei der Erstellung der jeweiligen Modelle verwendet wurden, und erfordert daher die Entwicklung eines anderen Modells zur Vorhersage der kcat/Km-Werte. Mit dem Aufkommen einheitlicher Datensätze, die kcat- und Km-Werte enthalten, wird in Zukunft erwartet, dass die Rechenausgabe der kcat- und Km-Modelle weitgehend mit der Ausgabe des dedizierten kcat/Km-Modells übereinstimmt.
Konkrete Anwendungen im Enzymabbau und in der Evolution
UniKPs Anwendung im Tyrosin-Ammoniak-Lyase (TAL)-Enzymabbau und in der gerichteten Evolution zeigt sein Potenzial, die Forschung in der synthetischen Biologie und Biochemie zu revolutionieren. Diese Studie zeigt, dass UniKP hochaktive TALs effektiv erkennt und die katalytische Effizienz bestehender TALs schnell verbessert, wobei RgTAL-489T einen kcat/Km-Wert aufweist, der 3,5-mal höher ist als der des Wildtyp-Enzyms.
Darüber hinaus war das abgeleitete Framework EF-UniKP stets in der Lage, hochaktive TAL-Enzyme mit extrem hoher Genauigkeit zu identifizieren, wobei der kcat/Km-Wert von TrTAL aus Tephrocybe rancida 2,6-mal höher war als der des Wildtyp-Enzyms. Die Ergebnisse zeigten, dass die kcat- und kcat/Km-Werte der fünf Sequenzen diejenigen des Wildtyp-Enzyms übertrafen.
Durch die Beschleunigung des Enzymentdeckungs- und -optimierungsprozesses wird UniKP voraussichtlich zu einem leistungsstarken Werkzeug für die Weiterentwicklung der Biokatalyse, der Arzneimittelentwicklung, des Metabolic Engineering und anderer Bereiche, die auf enzymkatalysierten Prozessen basieren.
Einschränkungen und Ausblick
Die aktuelle Version von UniKP weist jedoch noch einige Einschränkungen auf. Während UniKP beispielsweise in der Lage ist, zwischen experimentell gemessenen kcat-Werten eines Enzyms und seinen Varianten zu unterscheiden, sind die vorhergesagten kcat-Werte nicht genau genug. Dies kann auf unzureichende Datensätze im Vergleich zur Anzahl bekannter Proteinsequenzen und Substratstrukturen zurückzuführen sein.
Während die Neugewichtungsmethode die durch den unausgeglichenen kcat-Datensatz verursachte Vorhersageverzerrung bis zu einem gewissen Grad abmildern kann (~6,5 % Verbesserung), können durch synthetische Minority-Oversampling-Techniken und andere Stichprobensynthesemethoden signifikantere Verbesserungen erzielt werden.
Ein zentrales Ziel der synthetischen Biologie ist die Entwicklung digitaler Zellen, die die Art und Weise, wie Wissenschaftler Biologie studieren, revolutionieren werden. Eine wichtige Voraussetzung für diese Studie ist die sorgfältige Bestimmung der enzymatischen Parameter für alle Enzyme innerhalb des Stoffwechselwegs. Künstliche Intelligenz-gestützte Werkzeuge beleuchten diese Herausforderung und bieten eine Hochdurchsatzmethode zur Vorhersage der Enzymkinetik.
Obwohl der Fehler der UniKP-Prädiktoren im Vergleich zu früheren Modellen verringert ist, bleibt die Ungenauigkeit ein erhebliches Hindernis für die Erstellung genauer Stoffwechselmodelle. Durch die Einbeziehung einer zunehmenden Anzahl experimentell ermittelter kcat- und Km-Werte kann die Modellgenauigkeit verbessert werden.
Als nächstes wollen die Forscher modernste Algorithmen wie Transferlernen, Verstärkungslernen und andere Small-Shot-Lernalgorithmen kombinieren, um unausgeglichene Datensätze effektiv zu verarbeiten. Darüber hinaus möchte das Team weitere Anwendungen erforschen, darunter die Evolution von Enzymen und die globale Analyse von Organismen.
Link zum Papier: https://www.nature.com/articles/s41467-023-44113-1
Das obige ist der detaillierte Inhalt vonDas Team der Chinesischen Akademie der Wissenschaften erstellt einen einheitlichen Rahmen zur Verbesserung der Vorhersagegenauigkeit enzymkinetischer Parameter. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



In der modernen Fertigung ist die genaue Fehlererkennung nicht nur der Schlüssel zur Sicherstellung der Produktqualität, sondern auch der Kern für die Verbesserung der Produktionseffizienz. Allerdings mangelt es vorhandenen Datensätzen zur Fehlererkennung häufig an der Genauigkeit und dem semantischen Reichtum, die für praktische Anwendungen erforderlich sind, was dazu führt, dass Modelle bestimmte Fehlerkategorien oder -orte nicht identifizieren können. Um dieses Problem zu lösen, hat ein Spitzenforschungsteam bestehend aus der Hong Kong University of Science and Technology Guangzhou und Simou Technology innovativ den „DefectSpectrum“-Datensatz entwickelt, der eine detaillierte und semantisch reichhaltige groß angelegte Annotation von Industriedefekten ermöglicht. Wie in Tabelle 1 gezeigt, bietet der Datensatz „DefectSpectrum“ im Vergleich zu anderen Industriedatensätzen die meisten Fehleranmerkungen (5438 Fehlerproben) und die detaillierteste Fehlerklassifizierung (125 Fehlerkategorien).

Die offene LLM-Community ist eine Ära, in der hundert Blumen blühen und konkurrieren. Sie können Llama-3-70B-Instruct, QWen2-72B-Instruct, Nemotron-4-340B-Instruct, Mixtral-8x22BInstruct-v0.1 und viele andere sehen hervorragende Darsteller. Allerdings weisen offene Modelle im Vergleich zu den proprietären Großmodellen GPT-4-Turbo in vielen Bereichen noch erhebliche Lücken auf. Zusätzlich zu allgemeinen Modellen wurden einige offene Modelle entwickelt, die sich auf Schlüsselbereiche spezialisieren, wie etwa DeepSeek-Coder-V2 für Programmierung und Mathematik und InternVL für visuelle Sprachaufgaben.

Herausgeber |KX Bis heute sind die durch die Kristallographie ermittelten Strukturdetails und Präzision, von einfachen Metallen bis hin zu großen Membranproteinen, mit keiner anderen Methode zu erreichen. Die größte Herausforderung, das sogenannte Phasenproblem, bleibt jedoch die Gewinnung von Phaseninformationen aus experimentell bestimmten Amplituden. Forscher der Universität Kopenhagen in Dänemark haben eine Deep-Learning-Methode namens PhAI entwickelt, um Kristallphasenprobleme zu lösen. Ein Deep-Learning-Neuronales Netzwerk, das mithilfe von Millionen künstlicher Kristallstrukturen und den entsprechenden synthetischen Beugungsdaten trainiert wird, kann genaue Elektronendichtekarten erstellen. Die Studie zeigt, dass diese Deep-Learning-basierte Ab-initio-Strukturlösungsmethode das Phasenproblem mit einer Auflösung von nur 2 Angström lösen kann, was nur 10 bis 20 % der bei atomarer Auflösung verfügbaren Daten im Vergleich zur herkömmlichen Ab-initio-Berechnung entspricht

Für KI ist die Mathematikolympiade kein Problem mehr. Am Donnerstag hat die künstliche Intelligenz von Google DeepMind eine Meisterleistung vollbracht: Sie nutzte KI, um meiner Meinung nach die eigentliche Frage der diesjährigen Internationalen Mathematikolympiade zu lösen, und war nur einen Schritt davon entfernt, die Goldmedaille zu gewinnen. Der IMO-Wettbewerb, der gerade letzte Woche zu Ende ging, hatte sechs Fragen zu Algebra, Kombinatorik, Geometrie und Zahlentheorie. Das von Google vorgeschlagene hybride KI-System beantwortete vier Fragen richtig und erzielte 28 Punkte und erreichte damit die Silbermedaillenstufe. Anfang dieses Monats hatte der UCLA-Professor Terence Tao gerade die KI-Mathematische Olympiade (AIMO Progress Award) mit einem Millionenpreis gefördert. Unerwarteterweise hatte sich das Niveau der KI-Problemlösung vor Juli auf dieses Niveau verbessert. Beantworten Sie die Fragen meiner Meinung nach gleichzeitig. Am schwierigsten ist es meiner Meinung nach, da sie die längste Geschichte, den größten Umfang und die negativsten Fragen haben

Herausgeber | ScienceAI Basierend auf begrenzten klinischen Daten wurden Hunderte medizinischer Algorithmen genehmigt. Wissenschaftler diskutieren darüber, wer die Werkzeuge testen soll und wie dies am besten geschieht. Devin Singh wurde Zeuge, wie ein pädiatrischer Patient in der Notaufnahme einen Herzstillstand erlitt, während er lange auf eine Behandlung wartete, was ihn dazu veranlasste, den Einsatz von KI zu erforschen, um Wartezeiten zu verkürzen. Mithilfe von Triage-Daten aus den Notaufnahmen von SickKids erstellten Singh und Kollegen eine Reihe von KI-Modellen, um mögliche Diagnosen zu stellen und Tests zu empfehlen. Eine Studie zeigte, dass diese Modelle die Zahl der Arztbesuche um 22,3 % verkürzen können und die Verarbeitung der Ergebnisse pro Patient, der einen medizinischen Test benötigt, um fast drei Stunden beschleunigt. Der Erfolg von Algorithmen der künstlichen Intelligenz in der Forschung bestätigt dies jedoch nur

Herausgeber | Der Frage-Antwort-Datensatz (QA) von ScienceAI spielt eine entscheidende Rolle bei der Förderung der Forschung zur Verarbeitung natürlicher Sprache (NLP). Hochwertige QS-Datensätze können nicht nur zur Feinabstimmung von Modellen verwendet werden, sondern auch effektiv die Fähigkeiten großer Sprachmodelle (LLMs) bewerten, insbesondere die Fähigkeit, wissenschaftliche Erkenntnisse zu verstehen und zu begründen. Obwohl es derzeit viele wissenschaftliche QS-Datensätze aus den Bereichen Medizin, Chemie, Biologie und anderen Bereichen gibt, weisen diese Datensätze immer noch einige Mängel auf. Erstens ist das Datenformular relativ einfach, die meisten davon sind Multiple-Choice-Fragen. Sie sind leicht auszuwerten, schränken jedoch den Antwortauswahlbereich des Modells ein und können die Fähigkeit des Modells zur Beantwortung wissenschaftlicher Fragen nicht vollständig testen. Im Gegensatz dazu offene Fragen und Antworten

Im Jahr 2023 entwickeln sich fast alle Bereiche der KI in beispielloser Geschwindigkeit weiter. Gleichzeitig verschiebt die KI ständig die technologischen Grenzen wichtiger Bereiche wie der verkörperten Intelligenz und des autonomen Fahrens. Wird der Status von Transformer als Mainstream-Architektur großer KI-Modelle durch den multimodalen Trend erschüttert? Warum ist die Erforschung großer Modelle auf Basis der MoE-Architektur (Mixture of Experts) zu einem neuen Trend in der Branche geworden? Können Large Vision Models (LVM) ein neuer Durchbruch im allgemeinen Sehvermögen sein? ...Aus dem PRO-Mitglieder-Newsletter 2023 dieser Website, der in den letzten sechs Monaten veröffentlicht wurde, haben wir 10 spezielle Interpretationen ausgewählt, die eine detaillierte Analyse der technologischen Trends und industriellen Veränderungen in den oben genannten Bereichen bieten, um Ihnen dabei zu helfen, Ihre Ziele in der Zukunft zu erreichen Jahr vorbereitet sein. Diese Interpretation stammt aus Week50 2023

Herausgeber |. KX Im Bereich der Arzneimittelforschung und -entwicklung ist die genaue und effektive Vorhersage der Bindungsaffinität von Proteinen und Liganden für das Arzneimittelscreening und die Arzneimitteloptimierung von entscheidender Bedeutung. Aktuelle Studien berücksichtigen jedoch nicht die wichtige Rolle molekularer Oberflächeninformationen bei Protein-Ligand-Wechselwirkungen. Auf dieser Grundlage schlugen Forscher der Universität Xiamen ein neuartiges Framework zur multimodalen Merkmalsextraktion (MFE) vor, das erstmals Informationen über Proteinoberfläche, 3D-Struktur und -Sequenz kombiniert und einen Kreuzaufmerksamkeitsmechanismus verwendet, um verschiedene Modalitäten zu vergleichen Ausrichtung. Experimentelle Ergebnisse zeigen, dass diese Methode bei der Vorhersage von Protein-Ligand-Bindungsaffinitäten Spitzenleistungen erbringt. Darüber hinaus belegen Ablationsstudien die Wirksamkeit und Notwendigkeit der Proteinoberflächeninformation und der multimodalen Merkmalsausrichtung innerhalb dieses Rahmens. Verwandte Forschungen beginnen mit „S
