In den letzten zwei Jahren hat maschinelles Lernen die Vorhersage der Proteinstruktur revolutioniert. Jetzt hat künstliche Intelligenz eine neue Revolution im Bereich des Proteindesigns ausgelöst.
Seit dem Aufkommen der KI haben sich viele Wissenschaftler dazu entschlossen, sie für die Proteinforschung zu nutzen. Biologen haben herausgefunden, dass mithilfe maschinellen Lernens Proteinmoleküle in Sekundenschnelle erzeugt werden können. Früher konnte diese Zeit mehrere Monate betragen.
Kürzlich nutzte das Start-up Evozyne vorab trainierte KI-Modelle von NVIDIA, um zwei Proteine mit erheblichem Potenzial in den Bereichen Medizin und saubere Energie zu entwickeln. Eines der Proteine wird zur Behandlung einer angeborenen Krankheit verwendet, ein anderes zum Verbrauch von Kohlendioxid, um die globale Erwärmung zu reduzieren.
Auf diese Weise nutzen Wissenschaftler NVIDIA BioNeMo, um groß angelegte Sprachmodelle zu erstellen, die hochwertige Proteine erzeugen können, um die Arzneimittelentwicklung zu beschleunigen und zur Schaffung einer nachhaltigeren Umwelt beizutragen.
Ein neuer Weg zur Beschleunigung der Arzneimittelforschung
Andrew Ferguson, Mitbegründer von Evozyne und Mitautor des Papiers, sagte: „Erfreulich ist, dass die synthetischen Proteine, die dieses KI-Modell in der ersten Runde produziert hat, es sind.“ Genau wie natürlich vorkommende Proteine. Zeigt an, dass das Modell die Designregeln der Natur gelernt hat.“
Evozyne verwendet NVIDIAs ProtT5. ProtT5 ist ein Transformer-Modell, das Teil von NVIDIA BioNeMo ist, einem Software-Framework und Dienst zur Erstellung medizinischer KI-Modelle.
Der Molekularingenieur Ferguson, dessen Forschungsgebiete die Bereiche Chemie und maschinelles Lernen umfassen, sagte: „BioNeMo ist sehr leistungsstark und ermöglicht es uns, ein Modell zu trainieren und es dann zu sehr geringen Kosten zum Ausführen von Arbeitsaufgaben zu verwenden.“ „Generieren Sie Millionen von Sequenzen.“
Dieses Modell ist das Herzstück der Evovyne ProT-VAE-Pipeline. Die ProT-VAE-Pipeline von Evozyne kombiniert das leistungsstarke Transformer-Modell in NVIDIA BioNeMo mit Variational Autoencodern (VAEs).
Er sagte: „Vor ein paar Jahren ist niemandem aufgefallen, dass Proteine mithilfe großer Sprachmodelle in Kombination mit Variations-Autoencodern entworfen werden können.“
Im Gegensatz dazu durchläuft die Methode von Evozyne nur eine Runde. Sie kann die Hälfte oder mehr davon verändern Aminosäuren in einem Protein. Dies entspricht Hunderten von Mutationen.
Evozyne-Datenwissenschaftler Joshua Moller sagte: „Sie beschleunigen das Training, indem sie die Arbeit auf mehrere GPUs ausweiten.
Dadurch verkürzt sich die Zeit zum Trainieren eines großen KI-Modells von Monaten auf eine Woche. So können wir Modelle trainieren, die sonst unmöglich wären.“ zu trainieren, beispielsweise einige mit Milliarden trainierbarer Parameter. „
Revolutionäres KI-Modell
Die traditionelle Protein-Engineering-Designmethode, nämlich die gerichtete Evolution, verwendet einen langsamen, ungeplanten Ansatz, der normalerweise nur die Reihenfolge einiger weniger Aminosäuren gleichzeitig ändert. Maschinelles Lernen hilft dabei, massiv zu studieren Aminosäurekombinationen und identifizieren dann effizient die nützlichsten Sequenzen
BioNeMo ist ein KI-fähiger Cloud-Dienst und ein Framework für die Arzneimittelentwicklung, das auf dem KI-Modell „Biomolecule Transformer“ für das Training und die Bereitstellung groß angelegter Anwendungen basiert vorab trainiertes LLM, native Unterstützung für gängige Dateiformate für Proteine, DNA, RNA und Chemie und bietet auch Unterstützung für SMILES (für molekulare Strukturen) und FASTA (für Aminosäure- und Nukleotidsequenzen) mithilfe des Datenladers
Mit BioNeMo können Wissenschaftler ganz einfach vorab trainierte Modelle, automatische Downloader und Präprozessoren für UniRef50- und ZINC-Datenbanken mit verschiedenen Modellen, Einbettungen und Ausgaben verwenden. Durch das unbeaufsichtigte Vortraining sind auch gekennzeichnete Daten nicht mehr erforderlich, um schnell gelernte Einbettungen zu generieren, die Proteine vorhersagen Struktur, Funktion, Zellstandort, Wasserlöslichkeit und Membranbindung, Speicherbereich und variabler Bereich usw.
Daunter ist MegaMolBART ein mit 1,4 Milliarden Molekülen trainiertes generatives Chemiemodell (SMILES-String), das für a verwendet werden kann Eine Vielzahl chemischer Informatikanwendungen, und BioNeMo bietet ProtT5 und ESM1 sowie andere Transformer-basierte Proteinsprachenmodelle.
BioNeMo bietet auch OpenFold, ein Deep-Learning-Modell zur Vorhersage der 3D-Struktur neuartiger Proteinsequenzen liest Millionen von Proteinen. Dieses Modell nutzt die Technologie, die neuronale Netze verwenden, um Texte zu verstehen, und lernt, wie die Natur Protein-Aminosäuresequenzen konstruiert Im Vergleich zu den ursprünglich in der Natur vorkommenden Proteinen ist es stabiler und kann unter extremen Bedingungen wie Energiemangel oder hoher Temperatur eine seiner Funktionen erfüllen
.Darüber hinaus können mithilfe künstlicher Intelligenz auch Aminosäuresequenzen passend zum Rückgrat entworfen werden, wodurch die Stabilität bestimmter Proteine wie Enzyme und Antikörper verbessert werden kann. Künstliche Intelligenz spielt eine sehr wichtige Rolle bei der Entwicklung von Proteinen unterschiedlicher Größe und unterschiedlicher Konformation. In Zukunft kann sie auch dazu beitragen, immer mehr nützliche Proteine zu entwickeln, einschließlich neuer biologischer Materialien, die zur Reduzierung der Umweltverschmutzung und zur Verbesserung der Umwelt eingesetzt werden können .
Das obige ist der detaillierte Inhalt vonUnendliche Möglichkeiten Das generative KI-Modell von NVIDIA beschleunigt die Proteinsynthese. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!