Herausgeber |. KX
Retrosynthese ist eine entscheidende Aufgabe in der Arzneimittelforschung und organischen Synthese, und KI wird zunehmend eingesetzt, um den Prozess zu beschleunigen.
Bestehende KI-Methoden weisen eine unbefriedigende Leistung und eine begrenzte Vielfalt auf. In der Praxis verursachen chemische Reaktionen häufig lokale molekulare Veränderungen mit erheblichen Überschneidungen zwischen Reaktanten und Produkten.
Davon inspiriert schlug Hou Tingjuns Team an der Zhejiang-Universität vor, die einstufige retrosynthetische Vorhersage als eine Aufgabe zur Bearbeitung von Molekülketten neu zu definieren und die Zielmolekülkette iterativ zu verfeinern, um Vorläuferverbindungen zu erzeugen. Außerdem wird ein editierungsbasiertes retrosynthetisches Modell EditRetro vorgeschlagen, mit dem qualitativ hochwertige und vielfältige Vorhersagen erzielt werden können.
Umfangreiche Experimente zeigen, dass das Modell beim Standard-Benchmark-Datensatz USPTO-50 K eine hervorragende Leistung mit einer Top-1-Genauigkeit von 60,8 % erzielt.
Die Ergebnisse zeigen, dass EditRetro gute Generalisierungsfähigkeiten und Robustheit aufweist, was sein Potenzial im Bereich der KI-gesteuerten Planung chemischer Synthesen unterstreicht.
Verwandte Forschung mit dem Titel „Retrosynthesevorhersage mit einem iterativen String-Editing-Modell“ wurde am 30. Juli in „Nature Communications“ veröffentlicht.
Link zum Papier: https://www.nature.com/articles/s41467-024-50617-1
Die Gestaltung molekularer Synthesepfade ist eine wichtige Aufgabe in der organischen Synthese, die für die Biomedizin und Pharmazeutika wichtig ist und es ist in verschiedenen Bereichen wie der Materialindustrie von großer Bedeutung.
Die retrosynthetische Analyse ist die am weitesten verbreitete Methode zur Entwicklung synthetischer Routen. Dabei werden etablierte Reaktionen genutzt, um Moleküle iterativ in einfachere, leichter zu synthetisierende Vorläufer zu zerlegen.
In den letzten Jahren hat die KI-gesteuerte Retrosynthese die Erforschung komplexerer Moleküle erleichtert und den Zeit- und Arbeitsaufwand für die Entwicklung synthetischer Experimente erheblich reduziert. Die Vorhersage der Retrosynthese in einem Schritt ist ein wichtiger Bestandteil der Retrosyntheseplanung. Derzeit gibt es mehrere Deep-Learning-basierte Methoden mit hervorragenden Ergebnissen. Diese Methoden lassen sich grob in drei Kategorien einteilen: vorlagenbasierte Methoden, vorlagenfreie Methoden und halbvorlagenbasierte Methoden.
Hier konzentrieren sich die Forscher auf die templatfreie retrosynthetische Vorhersage. schlagen vor, das Problem als molekulare String-Editierungsaufgabe neu zu definieren und EditRetro vorzuschlagen, ein editierungsbasiertes Retrosynthesemodell, das qualitativ hochwertige und vielfältige Vorhersagen erzielen kann.
Abbildung: Schematische Darstellung der vorgeschlagenen EditRetro-Methode basierend auf der molekularen String-Retrosynthese. (Quelle: Papier)
Das Kernkonzept dieser Forschung besteht darin, Reaktantenketten durch einen iterativen Bearbeitungsprozess unter Verwendung von Levenshtein-Operationen zu erzeugen. Der Ansatz ist von den jüngsten Fortschritten bei bearbeitungsbasierten Sequenzgenerierungsmodellen inspiriert. Insbesondere werden Operationen von EDITOR verwendet, einem bearbeitungsbasierten Transformer, der für die neuronale maschinelle Übersetzung entwickelt wurde.
EditRetro-Übersicht
Das EditRetro-Modell enthält drei Bearbeitungsvorgänge, nämlich Sequenzneupositionierung, Platzhaltereinfügung und Markereinfügung, um Reaktantenketten zu generieren. Es wird durch ein Transformer-Modell implementiert, das aus einem Encoder und drei Decodern besteht, die beide aus gestapelten Transformer-Blöcken bestehen.
EditRetro-Modell verbessert die Erzeugungseffizienz durch seinen nicht-autoregressiven Decoder. Obwohl EditRetro zusätzliche Decoder zur iterativen Vorhersage von Bearbeitungsvorgängen enthält, führt es Bearbeitungsvorgänge innerhalb jedes Decoders parallel durch (d. h. nicht-autoregressive Generierung).
Wenn ein Zielmolekül angegeben wird, nimmt der Encoder dessen Zeichenfolge als Eingabe und generiert die entsprechende versteckte Darstellung, die dann als Eingabe für das Queraufmerksamkeitsmodul des Decoders verwendet wird. Ebenso verwendet der Decoder bei der ersten Iteration auch die Produktzeichenfolge als Eingabe. Während jeder Decodierungsiteration werden die drei Decoder nacheinander ausgeführt.
Besser als der Ausgangswert, erzeugen Sie genaue Reaktanten
Die Forscher bewerteten die vorgeschlagene Methode anhand der öffentlichen Benchmark-Datensätze USPTO-50K und USPTO-FULL. Umfangreiche experimentelle Ergebnisse zeigen, dass diese Methode andere Basislinien hinsichtlich der Vorhersagegenauigkeit übertrifft, einschließlich der hochmodernen sequenzbasierten Methode R-SMILES und der auf Diagrammbearbeitung basierenden Methode Graph2Edits.
EditRetro Umfangreiche Experimente mit dem Benchmark-Retrosynthese-Datensatz USPTO-50K zeigen, dass EditRetro mit einer Top-1-Exakt-Matching-Genauigkeit von 60,8 % eine überlegene Leistung erzielt.
Darüber hinaus erreichte die Top-1-Exakt-Matching-Genauigkeit im größeren USPTO-FULL-Datensatz 52,2 %, was ihre Wirksamkeit bei vielfältigeren und anspruchsvolleren chemischen Reaktionen beweist.
EditRetro zeigt auch in Bezug auf RoundTrip- und MaxFrag-Genauigkeit eine bessere Leistung als Basismethoden. Dies zeigt, dass EditRetro chemische Regeln effektiv lernen kann.
Darüber hinaus bietet EditRetro durch ein gut gestaltetes Inferenzmodul vielfältige Vorhersagen. Dieses Modul kombiniert Relocation-Sampling und Sequenzerweiterung, um vielfältige und sich ändernde Vorhersagen zu generieren. Bei der Neupositionierungsstichprobe werden Vorhersagen zu Neupositionierungsmaßnahmen erfasst, wodurch die Identifizierung unterschiedlicher Reaktionsorte ermöglicht wird. Die Sequenzverbesserung generiert unterschiedliche Bearbeitungspfade von verschiedenen Produktvarianten zu Reaktanten und erhöht dadurch die Vorhersagegenauigkeit und -vielfalt. Diese beiden Strategien wirken zusammen, um die Genauigkeit und Vielfalt der Vorhersagen zu erhöhen.
Weitere Experimente bestätigten die Überlegenheit von EditRetro bei einigen komplexeren Reaktionen, einschließlich chiraler Reaktionen, Ringöffnungs- und Ringbildungsreaktionen. Die Ergebnisse bestätigen die Überlegenheit von EditRetro in diesen anspruchsvollen Szenarien und demonstrieren seine Fähigkeit, verschiedene Arten chemischer Umwandlungen zu bewältigen.
Praktikabilität bei der mehrstufigen Syntheseplanung
Insbesondere die erfolgreiche Anwendung von EditRetro in vier mehrstufigen Retrosyntheseplanungsszenarien zeigt seine Praktikabilität.
Um den Nutzen von EditRetro bei der Syntheseplanung zu bewerten, wurden vollständige chemische Pfade durch sequentielle retrosynthetische Vorhersagen entworfen. Die Forscher wählten vier Zielverbindungen mit wichtigem pharmazeutischem Wert für die Bewertung aus: Febuxostat, Osimertinib, ein allosterischer Aktivator von GPX4 und der DDR1-Kinase-Inhibitor INS015_037.
Illustration: EditRetros mehrstufige retrosynthetische Vorhersage. (Quelle: Papier)
Alle vier Beispiele führten zu Retrosynthesewegen, die sehr gut mit den in der Literatur berichteten übereinstimmten, wobei die meisten Vorhersagen unter den ersten beiden rangierten. Von den 16 betrachteten Einzelschritten hatten 10 eine Vorhersagegenauigkeit von 1. Diese Ergebnisse zeigen das praktische Potenzial von EditRetro für praktische retrosynthetische Vorhersagen.
Diese Methode soll praktische Anwendungen im Bereich der Retrosyntheseplanung finden, indem sie wertvolle Erkenntnisse liefert und die Gestaltung effizienter Syntheserouten erleichtert.
Das obige ist der detaillierte Inhalt vonDie Genauigkeitsrate erreicht 60,8 %. Das auf Transformer basierende Modell zur Vorhersage der chemischen Retrosynthese wurde in der Unterzeitschrift „Nature' veröffentlicht. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!