Table des matières
L'IA change le domaine de l'analyse cinétique " >L'IA change le domaine de l'analyse cinétique
Recherche spécifique" >Recherche spécifique
Maison Périphériques technologiques IA Le modèle d'apprentissage automatique classe les mécanismes de réaction organiques avec une précision exceptionnelle

Le modèle d'apprentissage automatique classe les mécanismes de réaction organiques avec une précision exceptionnelle

Apr 13, 2023 pm 03:04 PM
机器学习 模型

La découverte des réactions chimiques dépend non seulement de la rapidité avec laquelle les données expérimentales peuvent être obtenues, mais également de la facilité avec laquelle les chimistes comprennent ces données. Découvrir les bases mécanistiques de nouvelles réactions catalytiques est un problème particulièrement complexe qui nécessite souvent une expertise en chimie organique informatique et physique. Cependant, il est important d’étudier les réactions catalytiques car elles représentent les processus chimiques les plus efficaces.

Récemment, Burés et Larrosa du Département de chimie de l'Université de Manchester (UoM), Royaume-Uni, ont rapporté un modèle d'apprentissage automatique, démontrant que des modèles de réseaux neuronaux profonds peuvent être entraînés pour analyser des données cinétiques communes et élucider automatiquement les données correspondantes. catégories de mécanismes, sans aucune intervention utilisateur supplémentaire. Le modèle identifie différents types de mécanismes avec une excellente précision.

Les résultats démontrent que la classification des mécanismes guidée par l'IA est un nouvel outil puissant qui peut simplifier et automatiser l'élucidation des mécanismes. Ces travaux devraient faire progresser la découverte et le développement de réactions organiques entièrement automatisées.

La recherche s'intitulait « Classification des mécanismes de réaction organiques à l'aide de l'apprentissage automatique » et a été publiée dans « Nature » le 25 janvier 2023.

Le modèle dapprentissage automatique classe les mécanismes de réaction organiques avec une précision exceptionnelle

Lien papier : ​https://www.nature.com/articles/s41586-022-05639-4​

Manière traditionnelle d'élucider le mécanisme de réaction chimique

Déterminer la séquence exacte des étapes de base impliquées dans la conversion des substrats en produits est essentiel pour améliorer rationnellement les méthodes de synthèse, concevoir de nouveaux catalyseurs et étendre en toute sécurité les processus industriels. Pour élucider le mécanisme de réaction, plusieurs courbes cinétiques doivent être collectées et les experts humains doivent effectuer une analyse cinétique des données. Bien que la technologie de surveillance des réactions se soit considérablement améliorée au cours des dernières décennies, au point où la collecte de données cinétiques peut être entièrement automatisée, le cadre théorique qui sous-tend l’élucidation mécaniste n’a pas évolué au même rythme.

Le pipeline d'analyse cinétique actuel comprend trois étapes principales : extraire les propriétés cinétiques des données expérimentales, prédire les propriétés cinétiques de tous les mécanismes possibles et comparer les propriétés extraites expérimentalement avec les propriétés prédites.

Depuis plus d'un siècle, les chimistes extraient des informations mécanistes à partir des taux de réaction. Une méthode encore utilisée aujourd’hui consiste à évaluer la vitesse initiale d’une réaction, en se concentrant sur la consommation des premiers pour cent de la matière première. Cette méthode est populaire car dans la plupart des cas, la variation de la concentration du réactif au fil du temps est linéaire au début de la réaction et est donc simple à analyser. Bien que perspicace, cette technique ignore les changements dans les taux de réaction et les concentrations qui se produisent sur une grande partie du temps.

Au cours des dernières décennies, des méthodes plus avancées ont été développées pour évaluer les concentrations des composants de réaction tout au long du processus de réaction. Ces méthodes sont en outre facilitées par des techniques mathématiques qui révèlent le nombre de composants participant à une étape de réaction (également appelé ordre des composants de réaction) à partir de diagrammes cinétiques de réaction. Ces techniques continueront certainement à fournir des informations sur la réactivité chimique, mais elles se limitent à analyser l'ordre des composants de la réaction plutôt qu'à fournir une hypothèse mécanistique plus complète décrivant le comportement cinétique d'un système catalytique.

Le modèle dapprentissage automatique classe les mécanismes de réaction organiques avec une précision exceptionnelle

Figure 1 : Pertinence et techniques de pointe pour l'analyse cinétique. (Source : article)

L'IA change le domaine de l'analyse cinétique

L'apprentissage automatique révolutionne la façon dont les chimistes résolvent les problèmes, de la conception de molécules et d'itinéraires à la synthèse de molécules en passant par la compréhension des mécanismes de réaction. Burés et Larrosa apportent désormais cette révolution à l'analyse cinétique en utilisant des modèles d'apprentissage automatique pour classer les réactions en fonction de leurs caractéristiques cinétiques simulées.

Ici, les chercheurs démontrent qu'un modèle d'apprentissage profond formé sur des données cinétiques simulées est capable d'élucider correctement divers mécanismes à partir des distributions temporelles de concentrations. Les modèles d'apprentissage automatique simplifient l'analyse cinétique en éliminant le besoin de dérivation de lois de vitesse ainsi que d'extraction et de prédiction de propriétés cinétiques, facilitant ainsi grandement l'élucidation des mécanismes de réaction dans tous les laboratoires de synthèse.

Grâce à l'analyse holistique de toutes les données cinétiques disponibles, cette méthode améliore la capacité d'interroger les courbes de réaction, élimine les erreurs humaines potentielles lors de l'analyse cinétique et élargit la plage de cinétiques analysables pour inclure l'état non stable (y compris l'activation et processus de désactivation) et les réactions réversibles. Cette approche compléterait les méthodes d’analyse cinétique actuellement disponibles et serait particulièrement utile dans les situations les plus difficiles.

Recherche spécifique

Les chercheurs ont défini 20 types de mécanismes de réaction et développé des lois de vitesse pour chaque type. Chaque mécanisme est mathématiquement décrit par un ensemble de constantes cinétiques (k1, … kn) et une équation différentielle ordinaire (ODE) fonction de la concentration de l'espèce chimique. Ils ont ensuite résolu ces équations, générant des millions de simulations décrivant la désintégration des réactifs et la production de produits. Ces données cinétiques simulées sont utilisées pour entraîner des algorithmes d'apprentissage afin d'identifier les signatures caractéristiques de chaque classe mécanistique. Le modèle de classification résultant utilise des courbes cinétiques comme entrée, y compris des données de concentration initiales et temporelles, et génère la classe mécanistique de la réaction.

Le modèle dapprentissage automatique classe les mécanismes de réaction organiques avec une précision exceptionnelle

Figure 2 : Portée mécanistique et composition des données. (Source : article)

La formation de modèles d'apprentissage profond nécessite souvent de grandes quantités de données, ce qui peut poser des défis considérables lorsque ces données doivent être collectées expérimentalement.

La méthode de formation de l'algorithme de Burés et Larrosa évite le goulot d'étranglement lié à la génération de grandes quantités de données cinétiques expérimentales. Dans ce cas, les chercheurs ont pu résoudre numériquement un ensemble d’EDO pour générer 5 millions d’échantillons dynamiques pour la formation et la validation du modèle sans utiliser d’approximations en régime permanent.

Le modèle contient 576 000 paramètres entraînables et utilise une combinaison de deux types de réseaux neuronaux : (1) un réseau neuronal à mémoire longue et à court terme, un réseau neuronal récurrent utilisé pour traiter des séries de données temporelles (c'est-à-dire des données de concentration temporelle) ; (2) Réseau neuronal entièrement connecté pour le traitement des données non temporelles (c'est-à-dire la concentration initiale du catalyseur et les caractéristiques extraites de la mémoire à long terme à chaque exécution cinétique). Le modèle génère une probabilité pour chaque mécanisme dont la somme est égale à 1.

Les chercheurs ont évalué le modèle entraîné à l'aide d'un ensemble de tests de courbes cinétiques simulées et ont démontré qu'il attribuait correctement ces courbes aux classes de mécanismes avec une précision de 92,6 %.

Le modèle dapprentissage automatique classe les mécanismes de réaction organiques avec une précision exceptionnelle

Figure 3 : Performances du modèle d'apprentissage automatique sur l'ensemble de test, avec six points temporels pour chaque courbe cinétique. (Source : article)

Le modèle fonctionne bien même lorsque des données « bruyantes » sont intentionnellement introduites, ce qui signifie qu'il peut être utilisé pour classer des données expérimentales.

Le modèle dapprentissage automatique classe les mécanismes de réaction organiques avec une précision exceptionnelle

Figure 4 : L'impact de l'erreur et du nombre de points de données sur les performances du modèle d'apprentissage automatique. (Source : Papier)

Enfin, les chercheurs ont comparé leur modèle à l’aide de plusieurs courbes cinétiques expérimentales précédemment rapportées. Le mécanisme prédit est en bon accord avec les conclusions d’études cinétiques antérieures. Dans certains cas, le modèle a également identifié des détails mécanistes qui n'avaient pas été détectés dans le travail original. Pour une réaction difficile, le modèle propose trois catégories mécanistiques très similaires. Cependant, les auteurs affirment à juste titre que ce résultat n’est pas un bug mais une caractéristique de leur modèle, car il suggère que d’autres expériences spécifiques sont nécessaires pour explorer le mécanisme.

Le modèle dapprentissage automatique classe les mécanismes de réaction organiques avec une précision exceptionnelle

Figure 5 : Étude de cas avec des données cinétiques expérimentales. (Source : article)

En résumé, Burés et Larrosa ont développé une méthode qui automatise non seulement le long processus de dérivation d'hypothèses mécanistes à partir d'études cinétiques, mais effectue également une analyse cinétique de mécanismes de réaction difficiles. Comme pour toute avancée technologique dans l’analyse des données, les classifications mécanistes qui en résultent doivent être considérées comme des hypothèses nécessitant un soutien expérimental supplémentaire. Il existe toujours un risque d'interprétation erronée des données cinétiques, mais la capacité de l'algorithme à identifier le chemin de réaction correct avec une grande précision sur la base d'un petit nombre d'expériences pourrait convaincre davantage de chercheurs d'essayer l'analyse cinétique.

Par conséquent, cette approche pourrait populariser et favoriser l’intégration de l’analyse cinétique dans le pipeline de développement de réactions, d’autant plus que les chimistes se familiarisent davantage avec les algorithmes d’apprentissage automatique.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌
Will R.E.P.O. Vous avez un jeu croisé?
1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Cet article vous amènera à comprendre SHAP : explication du modèle pour l'apprentissage automatique Cet article vous amènera à comprendre SHAP : explication du modèle pour l'apprentissage automatique Jun 01, 2024 am 10:58 AM

Dans les domaines de l’apprentissage automatique et de la science des données, l’interprétabilité des modèles a toujours été au centre des préoccupations des chercheurs et des praticiens. Avec l'application généralisée de modèles complexes tels que l'apprentissage profond et les méthodes d'ensemble, la compréhension du processus décisionnel du modèle est devenue particulièrement importante. Explainable AI|XAI contribue à renforcer la confiance dans les modèles d'apprentissage automatique en augmentant la transparence du modèle. L'amélioration de la transparence des modèles peut être obtenue grâce à des méthodes telles que l'utilisation généralisée de plusieurs modèles complexes, ainsi que les processus décisionnels utilisés pour expliquer les modèles. Ces méthodes incluent l'analyse de l'importance des caractéristiques, l'estimation de l'intervalle de prédiction du modèle, les algorithmes d'interprétabilité locale, etc. L'analyse de l'importance des fonctionnalités peut expliquer le processus de prise de décision du modèle en évaluant le degré d'influence du modèle sur les fonctionnalités d'entrée. Estimation de l’intervalle de prédiction du modèle

KAN, qui remplace MLP, a été étendu à la convolution par des projets open source KAN, qui remplace MLP, a été étendu à la convolution par des projets open source Jun 01, 2024 pm 10:03 PM

Plus tôt ce mois-ci, des chercheurs du MIT et d'autres institutions ont proposé une alternative très prometteuse au MLP – KAN. KAN surpasse MLP en termes de précision et d’interprétabilité. Et il peut surpasser le MLP fonctionnant avec un plus grand nombre de paramètres avec un très petit nombre de paramètres. Par exemple, les auteurs ont déclaré avoir utilisé KAN pour reproduire les résultats de DeepMind avec un réseau plus petit et un degré d'automatisation plus élevé. Plus précisément, le MLP de DeepMind compte environ 300 000 paramètres, tandis que le KAN n'en compte qu'environ 200. KAN a une base mathématique solide comme MLP est basé sur le théorème d'approximation universelle, tandis que KAN est basé sur le théorème de représentation de Kolmogorov-Arnold. Comme le montre la figure ci-dessous, KAN a

Implémentation d'algorithmes d'apprentissage automatique en C++ : défis et solutions courants Implémentation d'algorithmes d'apprentissage automatique en C++ : défis et solutions courants Jun 03, 2024 pm 01:25 PM

Les défis courants rencontrés par les algorithmes d'apprentissage automatique en C++ incluent la gestion de la mémoire, le multithread, l'optimisation des performances et la maintenabilité. Les solutions incluent l'utilisation de pointeurs intelligents, de bibliothèques de threads modernes, d'instructions SIMD et de bibliothèques tierces, ainsi que le respect des directives de style de codage et l'utilisation d'outils d'automatisation. Des cas pratiques montrent comment utiliser la bibliothèque Eigen pour implémenter des algorithmes de régression linéaire, gérer efficacement la mémoire et utiliser des opérations matricielles hautes performances.

Surpassant largement le DPO : l'équipe de Chen Danqi a proposé une optimisation simple des préférences SimPO et a également affiné le modèle open source 8B le plus puissant. Surpassant largement le DPO : l'équipe de Chen Danqi a proposé une optimisation simple des préférences SimPO et a également affiné le modèle open source 8B le plus puissant. Jun 01, 2024 pm 04:41 PM

Afin d'aligner les grands modèles de langage (LLM) sur les valeurs et les intentions humaines, il est essentiel d'apprendre les commentaires humains pour garantir qu'ils sont utiles, honnêtes et inoffensifs. En termes d'alignement du LLM, une méthode efficace est l'apprentissage par renforcement basé sur le retour humain (RLHF). Bien que les résultats de la méthode RLHF soient excellents, certains défis d’optimisation sont impliqués. Cela implique de former un modèle de récompense, puis d'optimiser un modèle politique pour maximiser cette récompense. Récemment, certains chercheurs ont exploré des algorithmes hors ligne plus simples, dont l’optimisation directe des préférences (DPO). DPO apprend le modèle politique directement sur la base des données de préférence en paramétrant la fonction de récompense dans RLHF, éliminant ainsi le besoin d'un modèle de récompense explicite. Cette méthode est simple et stable

Cinq écoles d'apprentissage automatique que vous ne connaissez pas Cinq écoles d'apprentissage automatique que vous ne connaissez pas Jun 05, 2024 pm 08:51 PM

L'apprentissage automatique est une branche importante de l'intelligence artificielle qui donne aux ordinateurs la possibilité d'apprendre à partir de données et d'améliorer leurs capacités sans être explicitement programmés. L'apprentissage automatique a un large éventail d'applications dans divers domaines, de la reconnaissance d'images et du traitement du langage naturel aux systèmes de recommandation et à la détection des fraudes, et il change notre façon de vivre. Il existe de nombreuses méthodes et théories différentes dans le domaine de l'apprentissage automatique, parmi lesquelles les cinq méthodes les plus influentes sont appelées les « Cinq écoles d'apprentissage automatique ». Les cinq grandes écoles sont l’école symbolique, l’école connexionniste, l’école évolutionniste, l’école bayésienne et l’école analogique. 1. Le symbolisme, également connu sous le nom de symbolisme, met l'accent sur l'utilisation de symboles pour le raisonnement logique et l'expression des connaissances. Cette école de pensée estime que l'apprentissage est un processus de déduction inversée, à travers les connaissances existantes.

IA explicable : Expliquer les modèles IA/ML complexes IA explicable : Expliquer les modèles IA/ML complexes Jun 03, 2024 pm 10:08 PM

Traducteur | Revu par Li Rui | Chonglou Les modèles d'intelligence artificielle (IA) et d'apprentissage automatique (ML) deviennent aujourd'hui de plus en plus complexes, et le résultat produit par ces modèles est une boîte noire – impossible à expliquer aux parties prenantes. L'IA explicable (XAI) vise à résoudre ce problème en permettant aux parties prenantes de comprendre comment fonctionnent ces modèles, en s'assurant qu'elles comprennent comment ces modèles prennent réellement des décisions et en garantissant la transparence des systèmes d'IA, la confiance et la responsabilité pour résoudre ce problème. Cet article explore diverses techniques d'intelligence artificielle explicable (XAI) pour illustrer leurs principes sous-jacents. Plusieurs raisons pour lesquelles l’IA explicable est cruciale Confiance et transparence : pour que les systèmes d’IA soient largement acceptés et fiables, les utilisateurs doivent comprendre comment les décisions sont prises

Aucune donnée OpenAI requise, rejoignez la liste des grands modèles de code ! UIUC publie StarCoder-15B-Instruct Aucune donnée OpenAI requise, rejoignez la liste des grands modèles de code ! UIUC publie StarCoder-15B-Instruct Jun 13, 2024 pm 01:59 PM

À la pointe de la technologie logicielle, le groupe de l'UIUC Zhang Lingming, en collaboration avec des chercheurs de l'organisation BigCode, a récemment annoncé le modèle de grand code StarCoder2-15B-Instruct. Cette réalisation innovante a permis une percée significative dans les tâches de génération de code, dépassant avec succès CodeLlama-70B-Instruct et atteignant le sommet de la liste des performances de génération de code. Le caractère unique de StarCoder2-15B-Instruct réside dans sa stratégie d'auto-alignement pur. L'ensemble du processus de formation est ouvert, transparent et complètement autonome et contrôlable. Le modèle génère des milliers d'instructions via StarCoder2-15B en réponse au réglage fin du modèle de base StarCoder-15B sans recourir à des annotations manuelles coûteuses.

Flash Attention est-il stable ? Meta et Harvard ont constaté que les écarts de poids de leur modèle fluctuaient de plusieurs ordres de grandeur. Flash Attention est-il stable ? Meta et Harvard ont constaté que les écarts de poids de leur modèle fluctuaient de plusieurs ordres de grandeur. May 30, 2024 pm 01:24 PM

MetaFAIR s'est associé à Harvard pour fournir un nouveau cadre de recherche permettant d'optimiser le biais de données généré lors de l'apprentissage automatique à grande échelle. On sait que la formation de grands modèles de langage prend souvent des mois et utilise des centaines, voire des milliers de GPU. En prenant comme exemple le modèle LLaMA270B, sa formation nécessite un total de 1 720 320 heures GPU. La formation de grands modèles présente des défis systémiques uniques en raison de l’ampleur et de la complexité de ces charges de travail. Récemment, de nombreuses institutions ont signalé une instabilité dans le processus de formation lors de la formation des modèles d'IA générative SOTA. Elles apparaissent généralement sous la forme de pics de pertes. Par exemple, le modèle PaLM de Google a connu jusqu'à 20 pics de pertes au cours du processus de formation. Le biais numérique est à l'origine de cette imprécision de la formation,

See all articles