


Identifiez automatiquement les meilleures molécules et réduisez les coûts de synthèse. Le MIT développe un cadre d'algorithme de prise de décision en matière de conception moléculaire.
Éditeur | Ziluo
L'utilisation de l'IA pour rationaliser la découverte de médicaments explose. Ciblez des milliards de molécules candidates pour détecter celles qui pourraient posséder les propriétés nécessaires au développement de nouveaux médicaments. Il y a tellement de variables à prendre en compte, depuis le prix des matériaux jusqu’au risque d’erreur, qu’évaluer les coûts de synthèse des meilleures molécules candidates n’est pas une tâche facile, même si les scientifiques utilisent l’IA.
Ici, les chercheurs du MIT ont développé SPARROW, un cadre d'algorithme de décision quantitatif, pour identifier automatiquement les meilleurs candidats moléculaires, minimisant ainsi les coûts de synthèse tout en maximisant la probabilité que le candidat possède les propriétés souhaitées. L’algorithme a également déterminé les matériaux et les étapes expérimentales nécessaires à la synthèse de ces molécules.
SPARROW prend en compte le coût de synthèse d'un lot de molécules à la fois, puisque plusieurs molécules candidates peuvent souvent être dérivées de certains des mêmes composés. De plus, cette approche unifiée permet d'accéder à des informations critiques pour la conception moléculaire, la prédiction des propriétés et la planification de la synthèse à partir de référentiels en ligne et d'outils d'IA largement utilisés.
En plus d'aider les sociétés pharmaceutiques à découvrir plus efficacement de nouveaux médicaments, SPARROW peut également être utilisé pour inventer de nouveaux produits chimiques agricoles ou découvrir des matériaux spécialisés pour l'électronique organique.
Une recherche pertinente intitulée « Un cadre algorithmique pour une prise de décision synthétique tenant compte des coûts dans la conception moléculaire » a été publiée sur « Nature Computational Science » le 19 juin.
Lien papier : https://www.nature.com/articles/s43588-024-00639-y
"La sélection de composés est un art, et parfois c'est un art très réussi. Mais étant donné que nous disposons de tous ces modèles et outils de prédiction qui fournissent des informations sur la façon dont les molécules pourraient se comporter et être synthétisées, nous devrions utiliser ces informations pour guider les décisions que nous prenons », a déclaré Connor, auteur correspondant de l'article et professeur adjoint au Département de » a déclaré Coley.
Cadre d'algorithme de prise de décision quantitative SPARROW
"Synthesis Planning And Rewards-based Route Optimization Workflow, SPARROW" est un cadre de prise de décision algorithmique utilisé pour piloter le cycle de conception.
Illustration : Aperçu de SPARROW et de son rôle dans le cycle de conception moléculaire. (Source : article)
Cette recherche s'appuie sur des formulations de problèmes antérieures pour la sélection simultanée de voies de synthèse pour plusieurs molécules et l'intégration de la conception de produits et de systèmes de processus. Contrairement aux méthodes de criblage traditionnelles, SPARROW utilise un critère d'optimisation multi-objectifs qui équilibre le coût et l'utilité pour prioriser les molécules et leurs voies de synthèse putatives à partir d'une bibliothèque de molécules candidates.
SPARROW génère un réseau réactionnel composé de molécules cibles candidates et de voies de synthèse. En résolvant des problèmes d'optimisation basés sur des graphiques, un ensemble de molécules et de voies de synthèse peuvent être criblés pour équilibrer de manière optimale le coût et l'utilité cumulés de la synthèse. Dans ce contexte, l’utilité mesure la valeur de l’évaluation d’une propriété moléculaire.
Les mesures d'utilité appropriées varient selon les différentes étapes de l'application et de la conception. Cela peut inclure des prédictions de propriétés moléculaires, des incertitudes dans ces prédictions ou le potentiel de nouveaux points de données pour améliorer les relations structure-propriété. Une bibliothèque de candidats doit être fournie à SPARROW avec une récompense correspondante indiquant l'utilité associée à chaque molécule candidate.
Illustration : Énoncé du problème de SPARROW. (Source : Article)
La récompense pour le choix d'une molécule dépend également du succès des étapes de réaction choisies pour synthétiser cette molécule. Si une étape de réaction dans la voie de synthèse d’une molécule candidate échoue, aucune information n’est obtenue. Les chercheurs ont formalisé cela en maximisant la récompense attendue de la sélection d’une molécule candidate, qui peut être exprimée comme sa récompense multipliée par la probabilité de réussir la synthèse de la molécule.
En équilibrant le coût et l'utilité, l'objectif de SPARROW peut être formalisé comme la récompense attendue de tous les objectifs sélectionnés divisée par le coût de synthèse de tous les objectifs sélectionnés en utilisant l'itinéraire sélectionné.
Considérations de coûts complexes
Dans un sens, la question de savoir si les scientifiques doivent synthétiser et tester une certaine molécule se résume à une question de coût de synthèse par rapport à la valeur de l'expérience. Cependant, déterminer le coût ou la valeur est un problème difficile en soi.
SPARROW relève ce défi en prenant en compte les composés intermédiaires partagés impliqués dans la synthèse d'une molécule et en incorporant ces informations dans sa fonction coût/valeur.
"Lorsque vous réfléchissez au problème d'optimisation de la conception d'un lot de molécules, le coût de l'ajout de nouvelles structures dépend des molécules que vous avez déjà choisies", a déclaré Coley.
Le cadre prend également en compte des facteurs tels que le coût des matières premières, le nombre de réactions impliquées dans chaque voie de synthèse et la probabilité que ces réactions réussissent du premier coup.
Pour utiliser SPARROW, les scientifiques fournissent un ensemble de composés moléculaires qu'ils envisagent de tester, ainsi que des définitions des propriétés qu'ils espèrent trouver.
Ensuite, SPARROW collecte des informations sur les molécules et leurs voies de synthèse, puis compare la valeur de chaque molécule au coût de synthèse d'un lot de candidats. Il sélectionne automatiquement le meilleur sous-ensemble de candidats répondant aux critères des utilisateurs et trouve les voies de synthèse les plus rentables pour ces composés.
Jenna Fromer, la première auteure de l'article, a déclaré : "Il effectue toutes ces optimisations en une seule étape, afin de pouvoir capturer tous ces objectifs concurrents en même temps."
Cadre multifonctionnel
SPARROW est. unique en ce sens qu'il peut être intégré à des structures moléculaires conçues par des humains, existant dans des catalogues virtuels, ou à des structures moléculaires inédites créées par des modèles d'IA génératifs.
"Nous avons une variété de sources d'idées différentes. Une partie de l'attrait de SPARROW est que vous pouvez mettre toutes ces idées sur un pied d'égalité", a ajouté Coley.
Les chercheurs démontrent la capacité de SPARROW à orchestrer des cycles de conception moléculaire à travers trois études de cas. Ces applications illustrent comment SPARROW (1) équilibre avec succès le gain d'informations et les coûts de synthèse, (2) capture la non-additivité des coûts de synthèse pour un lot de molécules et (3) s'adapte à des bibliothèques candidates contenant des centaines de molécules.
Illustration : Démonstration de la capacité de SPARROW à équilibrer les coûts et les récompenses à travers une bibliothèque de 14 candidats inhibiteurs de l'ASCT2. (Source : article)
Ils ont découvert que SPARROW capturait efficacement le coût marginal de la synthèse par lots et identifiait les étapes expérimentales communes et les produits chimiques intermédiaires. En outre, il peut être étendu pour gérer des centaines de candidats moléculaires potentiels.
「Dans la communauté de l'apprentissage automatique chimique, il existe de nombreux modèles qui fonctionnent bien pour la rétrosynthèse ou la prédiction des propriétés moléculaires, mais comment les utilisons-nous réellement ? Notre cadre vise à exploiter la valeur de ces études préliminaires, nous l'espérons. pour guider d'autres chercheurs dans leur réflexion sur le dépistage des composés en utilisant leurs propres fonctions de coût et d'utilité", a déclaré Fromer.
À l'avenir, les chercheurs espèrent intégrer plus de complexité dans SPARROW. Par exemple, ils espèrent permettre aux algorithmes de prendre en compte le fait que la valeur du test d’un composé n’est pas toujours constante. Ils souhaitent également inclure des éléments chimiques plus parallèles dans leurs fonctions coût/valeur.
Contenu de référence : https://news.mit.edu/2024/smarter-way-streamline-drug-discovery-0617
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds











Dans la fabrication moderne, une détection précise des défauts est non seulement la clé pour garantir la qualité des produits, mais également la clé de l’amélioration de l’efficacité de la production. Cependant, les ensembles de données de détection de défauts existants manquent souvent de précision et de richesse sémantique requises pour les applications pratiques, ce qui rend les modèles incapables d'identifier des catégories ou des emplacements de défauts spécifiques. Afin de résoudre ce problème, une équipe de recherche de premier plan composée de l'Université des sciences et technologies de Hong Kong, Guangzhou et de Simou Technology a développé de manière innovante l'ensemble de données « DefectSpectrum », qui fournit une annotation à grande échelle détaillée et sémantiquement riche des défauts industriels. Comme le montre le tableau 1, par rapport à d'autres ensembles de données industrielles, l'ensemble de données « DefectSpectrum » fournit le plus grand nombre d'annotations de défauts (5 438 échantillons de défauts) et la classification de défauts la plus détaillée (125 catégories de défauts).

Editeur | KX À ce jour, les détails structurels et la précision déterminés par cristallographie, des métaux simples aux grandes protéines membranaires, sont inégalés par aucune autre méthode. Cependant, le plus grand défi, appelé problème de phase, reste la récupération des informations de phase à partir d'amplitudes déterminées expérimentalement. Des chercheurs de l'Université de Copenhague au Danemark ont développé une méthode d'apprentissage en profondeur appelée PhAI pour résoudre les problèmes de phase cristalline. Un réseau neuronal d'apprentissage en profondeur formé à l'aide de millions de structures cristallines artificielles et de leurs données de diffraction synthétique correspondantes peut générer des cartes précises de densité électronique. L'étude montre que cette méthode de solution structurelle ab initio basée sur l'apprentissage profond peut résoudre le problème de phase avec une résolution de seulement 2 Angströms, ce qui équivaut à seulement 10 à 20 % des données disponibles à la résolution atomique, alors que le calcul ab initio traditionnel

La communauté ouverte LLM est une époque où une centaine de fleurs fleurissent et s'affrontent. Vous pouvez voir Llama-3-70B-Instruct, QWen2-72B-Instruct, Nemotron-4-340B-Instruct, Mixtral-8x22BInstruct-v0.1 et bien d'autres. excellents interprètes. Cependant, par rapport aux grands modèles propriétaires représentés par le GPT-4-Turbo, les modèles ouverts présentent encore des lacunes importantes dans de nombreux domaines. En plus des modèles généraux, certains modèles ouverts spécialisés dans des domaines clés ont été développés, tels que DeepSeek-Coder-V2 pour la programmation et les mathématiques, et InternVL pour les tâches de langage visuel.

Pour l’IA, l’Olympiade mathématique n’est plus un problème. Jeudi, l'intelligence artificielle de Google DeepMind a réalisé un exploit : utiliser l'IA pour résoudre la vraie question de l'Olympiade mathématique internationale de cette année, l'OMI, et elle n'était qu'à un pas de remporter la médaille d'or. Le concours de l'OMI qui vient de se terminer la semaine dernière comportait six questions portant sur l'algèbre, la combinatoire, la géométrie et la théorie des nombres. Le système d'IA hybride proposé par Google a répondu correctement à quatre questions et a marqué 28 points, atteignant le niveau de la médaille d'argent. Plus tôt ce mois-ci, le professeur titulaire de l'UCLA, Terence Tao, venait de promouvoir l'Olympiade mathématique de l'IA (AIMO Progress Award) avec un prix d'un million de dollars. De manière inattendue, le niveau de résolution de problèmes d'IA s'était amélioré à ce niveau avant juillet. Posez les questions simultanément sur l'OMI. La chose la plus difficile à faire correctement est l'OMI, qui a la plus longue histoire, la plus grande échelle et la plus négative.

En 2023, presque tous les domaines de l’IA évoluent à une vitesse sans précédent. Dans le même temps, l’IA repousse constamment les limites technologiques de domaines clés tels que l’intelligence embarquée et la conduite autonome. Sous la tendance multimodale, le statut de Transformer en tant qu'architecture dominante des grands modèles d'IA sera-t-il ébranlé ? Pourquoi l'exploration de grands modèles basés sur l'architecture MoE (Mixture of Experts) est-elle devenue une nouvelle tendance dans l'industrie ? Les modèles de grande vision (LVM) peuvent-ils constituer une nouvelle avancée dans la vision générale ? ...Dans la newsletter des membres PRO 2023 de ce site publiée au cours des six derniers mois, nous avons sélectionné 10 interprétations spéciales qui fournissent une analyse approfondie des tendances technologiques et des changements industriels dans les domaines ci-dessus pour vous aider à atteindre vos objectifs dans le nouveau année. Cette interprétation provient de la Week50 2023

L'ensemble de données ScienceAI Question Answering (QA) joue un rôle essentiel dans la promotion de la recherche sur le traitement du langage naturel (NLP). Des ensembles de données d'assurance qualité de haute qualité peuvent non seulement être utilisés pour affiner les modèles, mais également évaluer efficacement les capacités des grands modèles linguistiques (LLM), en particulier la capacité à comprendre et à raisonner sur les connaissances scientifiques. Bien qu’il existe actuellement de nombreux ensembles de données scientifiques d’assurance qualité couvrant la médecine, la chimie, la biologie et d’autres domaines, ces ensembles de données présentent encore certaines lacunes. Premièrement, le formulaire de données est relativement simple, et la plupart sont des questions à choix multiples. Elles sont faciles à évaluer, mais limitent la plage de sélection des réponses du modèle et ne peuvent pas tester pleinement la capacité du modèle à répondre aux questions scientifiques. En revanche, les questions et réponses ouvertes

Editeur | KX La rétrosynthèse est une tâche essentielle dans la découverte de médicaments et la synthèse organique, et l'IA est de plus en plus utilisée pour accélérer le processus. Les méthodes d’IA existantes ont des performances insatisfaisantes et une diversité limitée. En pratique, les réactions chimiques provoquent souvent des modifications moléculaires locales, avec un chevauchement considérable entre les réactifs et les produits. Inspirée par cela, l'équipe de Hou Tingjun de l'Université du Zhejiang a proposé de redéfinir la prédiction rétrosynthétique en une seule étape en tant que tâche d'édition de chaînes moléculaires, en affinant de manière itérative la chaîne moléculaire cible pour générer des composés précurseurs. Et un modèle rétrosynthétique basé sur l'édition, EditRetro, est proposé, qui permet d'obtenir des prédictions diverses et de haute qualité. Des expériences approfondies montrent que le modèle atteint d'excellentes performances sur l'ensemble de données de référence standard USPTO-50 K, avec une précision top 1 de 60,8 %.

Editeur | ScienceAI Sur la base de données cliniques limitées, des centaines d'algorithmes médicaux ont été approuvés. Les scientifiques se demandent qui devrait tester les outils et comment le faire au mieux. Devin Singh a vu un patient pédiatrique aux urgences subir un arrêt cardiaque alors qu'il attendait un traitement pendant une longue période, ce qui l'a incité à explorer l'application de l'IA pour réduire les temps d'attente. À l’aide des données de triage des salles d’urgence de SickKids, Singh et ses collègues ont construit une série de modèles d’IA pour fournir des diagnostics potentiels et recommander des tests. Une étude a montré que ces modèles peuvent accélérer les visites chez le médecin de 22,3 %, accélérant ainsi le traitement des résultats de près de 3 heures par patient nécessitant un examen médical. Cependant, le succès des algorithmes d’intelligence artificielle dans la recherche ne fait que le vérifier.
