AI炼金术革新化学:MIT学者使用生成式AI,六秒生成新化学反应
需要重新书写的是:编辑 | 凯霞
化学从远古的「等价交换」炼金术开始,一直是一门研究和控制物质间相互作用的学科。通过不断解锁和利用新的化学反应,人们开发了许多新材料。这些新材料不仅为人们的生活带来便利,还提高了能源利用效率,促进了可持续发展
一个基元化学反应由反应物,过渡态(TS),生成物三者构成。过渡态是化学中至关重要的 3D 结构,被广泛用于理解化学反应机制、估算反应能垒以及探索庞大的反应网络。然而,由于其在反应过程中存在的时间极短(飞秒量级),实验中几乎不可能分离和表征过渡态。
重写后的内容:通常情况下,人们会使用量子化学的计算方法,通过反复求解薛定谔方程来确定已知反应物和生成物之间的过渡态。然而,这种计算方法非常昂贵,并且以其经常失败而臭名远扬。同时,该方法受限于个人的经验直觉和计算所需的资源,每个人所能探索的化学反应也是有限的。这种限制在研究未知的复杂反应时尤其致命。它会导致研究者忽略一些潜在可能发生的反应,从而误判反应机理,进而影响催化材料设计的思路
针对这一问题,麻省理工学院(MIT)的一组研究人员开发出了一种基于机器学习的替代方法,能够在几秒钟内发现这些结构。他们的新模型可以协助化学家探索和设计新的反应和催化剂,从而生成高附加值的有用产品,例如燃料化合物或药物。此外,该模型还能够模拟自然发生的化学反应,如那些推动早期地球上生命演化的关键反应。
MIT 化学工程和化学教授 Heather Kulik 指出,了解过渡态的具体结构对于设计催化剂或了解自然系统如何执行某些转化是非常重要的
相关研究工作以「Accurate transition state generation with an object-aware equivariant elementary reaction diffusion model」为题发表在国际顶级期刊《Nature Computational Science》上。
麻省理工学院的段辰儒博士是该论文的第一作者,康奈尔大学的博士生杜沅岂、麻省理工学院的博士生贾皓钧以及麻省理工学院的Heather Kulik教授是该论文的共同作者。原文链接:[https://rdcu.be/dtGSF]
请点击以下链接查看论文:https://www.nature.com/articles/s43588-023-00563-7
麻省理工学院新闻也对这项研究进行了报道
报道链接:https://news.mit.edu/2023/computational-model-captures-elusive-transition-states-1215
需要被重写的内容是:理论难点
当前,化学家可以使用基于密度泛函理论的量子化学计算方法来计算过渡态。然而,这种方法需要大量的计算资源,需要数小时甚至数天才能完成一个过渡态的计算
为了解决计算时间长的问题,一些研究人员最近开始尝试使用机器学习模型来发现过渡态结构。然而,迄今为止几乎所有开发的模型都要求将两个反应物建模为一个整体,而反应物之间相对于彼此则保持特定的几何构型(conformation)。任何其他可能的构型都会被机器学习模型误认为是一个新的反应
段辰儒博士表示,如果反应物分子被旋转,从原理上讲,在旋转之前和之后它们仍然可以经历相同的化学反应。就像我们在谈论电解水时,只会说水在特定条件下转换为氧气和氢气,而不会描述这些分子的相对几何位置。但在传统的机器学习方法中,模型将把反应物和生成物在不同几何位置的反应视为两个不同的反应。这使得机器学习训练变得更加困难,准确性也会随之下降
扩散模型是一种生成式模型,已经被广泛应用于图像处理。最近,扩散模型还被用于生成3D分子和蛋白质结构,蛋白质-配体对接和基于结构的药物设计。在这些应用中,扩散模型使用3D特殊欧几里得群(SE(3))图神经网络(GNNs)来保持分子的排列、平移和旋转对称性。然而,基元反应由反应物、过渡态和产物组成,遵循的是"对象感知"的SE(3)对称性。这是因为基元反应中三个对象之间的相互作用不是在3D欧几里得空间中进行的,而是在更高维的电子势能面(potential energy surface)上的因果联系。因此,现有的基于SE(3) GNN的扩散模型可能会因为破坏对称性而存在问题
图示:「对象感知」SE(3) 等变及其基于 SE(3) 等变 GNN 的实现。(来源:论文)
解决方案
麻省理工学院的团队根据上述问题开发了一种名为「OA-ReactDiff」的新方法。该团队将SE(3)等变GNN调整为「对象感知」模拟,即在保持单个对象的SE(3)等变性的同时,保持它们在欧几里得空间中的独立相互作用
段辰儒博士说,扩散模型是生成式人工智能领域的一部分,它通过随机过程来捕捉简单分布和复杂分布之间的转化过程。一旦模型学会了这三种结构如何共存的基本分布,我们可以给它新的反应物和生成物,它将尝试生成与这些反应物和生成物相对应的过渡态结构
图示:用于生成分子系统采样的等变扩散模型 (EDM) 概述。(来源:论文)
在研究中,研究人员利用量子计算方法在训练集中得到了9,000种不同化学反应的反应物、过渡态和生成物的结构。并且还对约1,000个之前未见过的反应进行了测试,要求为每个过渡态生成40种可能的结构
在计算的过程中,通过引入「推荐模型」来预测哪个过渡态的置信度最高。在此基础上,进一步结合不确定性估计,研究人员只对模型不确定性最高的14%的反应执行量子化学计算,成功实现了2.6 kcal/mol的平均绝对误差。这使得在使用OA-ReactDiff估算300°C的反应速率时,可以得到一个数量级误差范围内的结果。与量子化学计算得到的过渡态结构相比,OA-ReactDiff生成的结构的均方根误差(RMSD)在0.06埃(千分之六纳米)范围内,这个误差量级在肉眼中几乎不可区分
更令人欣喜的是 OA-ReactDiff 生成一个过渡态结构只需要 6 秒,相比于量子化学计算至少加速了 1000 倍。由此,该算法成功实现了对 TS 结构和反应能垒计算的极高准确性和快速性。
图示:评估 OA-ReactDiff 生成的 TS 结构与真实 TS 结构的结构相似性。(来源:论文)
Kulik 教授也感慨道,「之前我们很难想象在一念之间就能生成数千个过渡态。」
需要重写的内容是:图示:OA-ReactDiff plus 推荐 TS 结构的能量性能。(来源:论文)
未来期许是对于未来的期待和希望。它是一个人对自己未来发展和成长的愿景。每个人都有自己的未来期许,它可以是实现个人目标、追求事业成功、建立幸福家庭,或者是为社会做出积极贡献等等。无论未来期许是什么,它都是人们努力奋斗的动力和方向。通过努力和坚持,我们可以逐渐实现自己的未来期许,让自己的生活变得更加美好和充实
What needs to be rewritten is: 这个研究是首次在化学反应中使用3D扩散模型。尽管研究人员只研究了较小数量的原子化合物,但这项工作的意义不可忽视
Kulik教授指出:「即使面对更大的系统甚至是酶催化的系统,仍然可以得到关于原子最有可能重新排列的不同方式。」
研究人员现在计划加入其他组分来扩展他们的模型,比如催化剂。借助生成式 AI 的随机性,OA-ReactDiff 可以探索到意料之外的化学反应。这个特点弥补了现有基于化学的直觉反应探索框架,帮助建立更加完整的化学反应网络,助力研发设计新型催化材料。这方面的研究可以帮助他们加速发掘特定反应的新的催化剂。此外,他们提出的算法对于开发药品、燃料或其他有用化合物的新过程可能非常有用,尤其是当合成涉及许多化学步骤时。
段辰儒博士指出,以往所有这些计算都是使用量子化学方法进行的,但现在我们可以通过更快的生成模型来替代量子化学
研究人员还指出,化学反应是化学研究的核心。除了偏向于工业应用的催化剂设计,OA-ReactDiff还有许多有趣的潜在应用,例如探索可能发生在其他行星上的气体相互作用,模拟地球早期生命演化过程中的反应过程等等
以上是AI炼金术革新化学:MIT学者使用生成式AI,六秒生成新化学反应的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

在现代制造业中,精准的缺陷检测不仅是保证产品质量的关键,更是提升生产效率的核心。然而,现有的缺陷检测数据集常常缺乏实际应用所需的精确度和语义丰富性,导致模型无法识别具体的缺陷类别或位置。为了解决这一难题,由香港科技大学广州和思谋科技组成的顶尖研究团队,创新性地开发出了“DefectSpectrum”数据集,为工业缺陷提供了详尽、语义丰富的大规模标注。如表一所示,相比其他工业数据集,“DefectSpectrum”数据集提供了最多的缺陷标注(5438张缺陷样本),最细致的缺陷分类(125种缺陷类别

开放LLM社区正是百花齐放、竞相争鸣的时代,你能看到Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1等许多表现优良的模型。但是,相比于以GPT-4-Turbo为代表的专有大模型,开放模型在很多领域依然还有明显差距。在通用模型之外,也有一些专精关键领域的开放模型已被开发出来,比如用于编程和数学的DeepSeek-Coder-V2、用于视觉-语言任务的InternVL

对于AI来说,奥数不再是问题了。本周四,谷歌DeepMind的人工智能完成了一项壮举:用AI做出了今年国际数学奥林匹克竞赛IMO的真题,并且距拿金牌仅一步之遥。上周刚刚结束的IMO竞赛共有六道赛题,涉及代数、组合学、几何和数论。谷歌提出的混合AI系统做对了四道,获得28分,达到了银牌水平。本月初,UCLA终身教授陶哲轩刚刚宣传了百万美元奖金的AI数学奥林匹克竞赛(AIMO进步奖),没想到7月还没过,AI的做题水平就进步到了这种水平。IMO上同步做题,做对了最难题IMO是历史最悠久、规模最大、最负

编辑|KX时至今日,晶体学所测定的结构细节和精度,从简单的金属到大型膜蛋白,是任何其他方法都无法比拟的。然而,最大的挑战——所谓的相位问题,仍然是从实验确定的振幅中检索相位信息。丹麦哥本哈根大学研究人员,开发了一种解决晶体相问题的深度学习方法PhAI,利用数百万人工晶体结构及其相应的合成衍射数据训练的深度学习神经网络,可以生成准确的电子密度图。研究表明,这种基于深度学习的从头算结构解决方案方法,可以以仅2埃的分辨率解决相位问题,该分辨率仅相当于原子分辨率可用数据的10%到20%,而传统的从头算方

编辑|ScienceAI基于有限的临床数据,数百种医疗算法已被批准。科学家们正在讨论由谁来测试这些工具,以及如何最好地进行测试。DevinSingh在急诊室目睹了一名儿科患者因长时间等待救治而心脏骤停,这促使他探索AI在缩短等待时间中的应用。Singh利用了SickKids急诊室的分诊数据,与同事们建立了一系列AI模型,用于提供潜在诊断和推荐测试。一项研究表明,这些模型可以加快22.3%的就诊速度,将每位需要进行医学检查的患者的结果处理速度加快近3小时。然而,人工智能算法在研究中的成功只是验证此

编辑|ScienceAI问答(QA)数据集在推动自然语言处理(NLP)研究发挥着至关重要的作用。高质量QA数据集不仅可以用于微调模型,也可以有效评估大语言模型(LLM)的能力,尤其是针对科学知识的理解和推理能力。尽管当前已有许多科学QA数据集,涵盖了医学、化学、生物等领域,但这些数据集仍存在一些不足。其一,数据形式较为单一,大多数为多项选择题(multiple-choicequestions),它们易于进行评估,但限制了模型的答案选择范围,无法充分测试模型的科学问题解答能力。相比之下,开放式问答

2023年,几乎AI的每个领域都在以前所未有的速度进化,同时,AI也在不断地推动着具身智能、自动驾驶等关键赛道的技术边界。多模态趋势下,Transformer作为AI大模型主流架构的局面是否会撼动?为何探索基于MoE(专家混合)架构的大模型成为业内新趋势?大型视觉模型(LVM)能否成为通用视觉的新突破?...我们从过去的半年发布的2023年本站PRO会员通讯中,挑选了10份针对以上领域技术趋势、产业变革进行深入剖析的专题解读,助您在新的一年里为大展宏图做好准备。本篇解读来自2023年Week50

编辑|紫罗AI在简化药物发现方面的应用正在爆炸式增长。从数十亿种候选分子中筛选出可能具有开发新药所需特性的分子。需要考虑的变量太多了,从材料价格到出错的风险,即使科学家使用AI,权衡合成最佳候选分子的成本也不是一件容易的事。在此,MIT研究人员开发了一个定量决策算法框架SPARROW,来自动识别最佳分子候选物,从而最大限度地降低合成成本,同时最大限度地提高候选物具有所需特性的可能性。该算法还确定了合成这些分子所需的材料和实验步骤。SPARROW考虑了一次合成一批分子的成本,因为多个候选分子通常可
