上海交大团队开发数据驱动的主动学习框架,加速碳纳米材料研究进展
编辑 | X
控制碳纳米材料合成,如单晶、石墨烯、手性碳纳米管,是其在电子和能源领域应用的主要挑战。
虽然基底催化生长为碳纳米结构的可控合成被认为是前途光明的方法,但是目前仍然存在动态催化表面生长机制和设计策略的挑战,需要进一步的研究和发展。
近期,上海交通大学和日本东北大学的研究团队展示了主动机器学习模型在揭示基底催化生长微观过程中的有效性。通过分子动力学和蒙特卡罗方法的协同应用,他们成功地对Cu(111)上石墨烯的生长进行了全面动态模拟。为了增强模拟的准确性,研究团队采用了高斯近似势。这项研究为深入理解催化生长过程提供了新的工具和方法。
通过该研究,我们得出了一种实用而有效的方法,可用于设计金属或合金衬底以获得所需的碳纳米结构,并探索更多的反应可能性。
该研究以《Active machine learning model for the dynamic simulation and growth mechanisms of carbon on metal surface》为题,于 2024 年 1 月 6 日,发布在《Nature Communications》上。
论文链接:https://www.nature.com/articles/s41467-023-44525-z
当前金属基底催化研究的局限性
基底催化沉积被认为是实现二维或三维碳原子共价键网络可控生长的最有前途的方法之一。虽然普通表面上的生长机制已被广泛研究,但关于控制高指数或复合表面上石墨烯质量的动态和原子级因素的知识有限。这一研究差距极大地阻碍了理论指导设计方法在碳纳米结构生长中的新型催化金属衬底的发展。
由于潜在基底的广泛范围以及碳纳米材料生长过程对各种实验参数的敏感性,通过实验寻找金属或合金催化剂有相当大的挑战。
因此,理论模拟有足够的空间,许多原子细节很容易获得。比如 DFT、动力学蒙特卡罗 (KMC) 和从头算分子动力学 (AIMD) 等。然而,这些方法各有其局限性。因此,仍然迫切需要一种能够准确描述金属表面碳生长机制的稳健设计模型。
基于人工神经网络或基于核方法的机器学习势(MLP)被认为是解决经典力场有限的精度和可转移性并保持 DFT 级精度的有效方法。尽管在数据驱动的 MD 模拟方面取得了重大成就,但构建精确的 MLP 仍然是一项艰巨的任务。这个问题的一个解决方案是动态学习技术。
为了提高沉积过程的动态训练的效率和有效性,需要一个明确定义的选择协议。另一方面,金属基底上碳生长的动力学可以由重要的罕见事件控制。因此,如何通过将增强采样方法与经典动力学相结合来提高 MLP 的训练效率还需要进一步研究。
数据驱动的自动学习框架,以最少的人力生成 MLP
该研究提出了一种数据驱动的自动学习框架,以最少的人力生成 MLP,其适合于金属或合金表面的碳生长。
为了实现这一任务,研究人员利用 (1) 高斯近似势 (GAP) 加工学习模型;(2)一种增强采样方法,称为时间戳力偏置蒙特卡罗(time-stamped force-biased Monte Carlo,tfMC)方法,以加速碳沉积后的弛豫过程,从而将重要的稀有事件包含在训练数据库中;(3)基于原子位置平滑重叠(SOAP)描述符选择代表性训练数据的有效策略;(4) 完善的碳训练集;(5)自动化筛选、拟合和验证程序。
图 1:在混合分 MD/tfMC 模拟过程中,通过动态主动学习产生的碳在金属上生长机器学习势 (CGM-MLP)的示意图。(来源:论文)
通过利用金属上碳生长机器学习势 (CGM-MLP) 的高精度并在 MD/tfMC 方法中纳入罕见的原子事件,成功地复制了与金属表面石墨烯成核和碳生长相关的基本子过程(subprocesses),如下图所示。
图 2:CGM-MLP 驱动模拟具有不同碳入射动能 (Ek) 的 Cu(111) 上的石墨烯生长。(来源:论文)
然后应用产生的电势来研究碳原子在 Cu (111) 表面上的沉积生长。这种方法可以正确捕获 Cu(111)上碳生长的关键过程,如亚表面碳单体和表面二聚体的形成和迁移,一维碳纳米微晶的出现,石墨烯成核涉及 Cu 原子和碳链的边缘钝化,以及析出生长过程。
图 3:碳结构分析和高能轰击碳环断裂的观察。(来源:论文)
图 4:使用金属上 CGM-MLP 和基于 DFT 的爬行图像微动弹性带 (CI-NEB) 计算获得碳扩散和石墨烯成核的最小能量路径。(来源:论文)
研究人员对不同金属表面的初始成核,特别是 Cu(111)、Cr(110)、Ti(001) 和 O 污染的 Cu(111) 上的碳沉积的模拟,与实验观察和 DFT 计算表现出一致性。
图 5:用于碳纳米结构生长的代表性金属表面。(来源:论文)
研究意义
总之,该研究代表了 MLP 和 MD/tfMC 集成方面的开创性进展,为设计金属或合金基材以获得所需的碳纳米结构提供了可转移且有效的策略。
CGM-MLP 有效地将第一原理方法的准确性与经典力场的效率结合起来。tfMC 方法克服了传统 AIMD 或经典 MD 方法的时间尺度限制。此外,CGM-MLP 的自动训练框架纳入了专门的查询策略,用于在沉积模拟中构建动态训练集,强调了考虑沉积原子周围局部环境的重要性。
这些进展使得复杂金属表面碳生长机制的直接理论研究成为可能。该研究中提出的机器学习驱动的沉积模型可能为研究多种碳纳米结构(例如石墨烯、碳纳米管、石墨或类金刚石碳膜)生长中的多元素金属或合金基底提供机会。
以上是上海交大团队开发数据驱动的主动学习框架,加速碳纳米材料研究进展的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

在现代制造业中,精准的缺陷检测不仅是保证产品质量的关键,更是提升生产效率的核心。然而,现有的缺陷检测数据集常常缺乏实际应用所需的精确度和语义丰富性,导致模型无法识别具体的缺陷类别或位置。为了解决这一难题,由香港科技大学广州和思谋科技组成的顶尖研究团队,创新性地开发出了“DefectSpectrum”数据集,为工业缺陷提供了详尽、语义丰富的大规模标注。如表一所示,相比其他工业数据集,“DefectSpectrum”数据集提供了最多的缺陷标注(5438张缺陷样本),最细致的缺陷分类(125种缺陷类别

开放LLM社区正是百花齐放、竞相争鸣的时代,你能看到Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1等许多表现优良的模型。但是,相比于以GPT-4-Turbo为代表的专有大模型,开放模型在很多领域依然还有明显差距。在通用模型之外,也有一些专精关键领域的开放模型已被开发出来,比如用于编程和数学的DeepSeek-Coder-V2、用于视觉-语言任务的InternVL

编辑|KX时至今日,晶体学所测定的结构细节和精度,从简单的金属到大型膜蛋白,是任何其他方法都无法比拟的。然而,最大的挑战——所谓的相位问题,仍然是从实验确定的振幅中检索相位信息。丹麦哥本哈根大学研究人员,开发了一种解决晶体相问题的深度学习方法PhAI,利用数百万人工晶体结构及其相应的合成衍射数据训练的深度学习神经网络,可以生成准确的电子密度图。研究表明,这种基于深度学习的从头算结构解决方案方法,可以以仅2埃的分辨率解决相位问题,该分辨率仅相当于原子分辨率可用数据的10%到20%,而传统的从头算方

对于AI来说,奥数不再是问题了。本周四,谷歌DeepMind的人工智能完成了一项壮举:用AI做出了今年国际数学奥林匹克竞赛IMO的真题,并且距拿金牌仅一步之遥。上周刚刚结束的IMO竞赛共有六道赛题,涉及代数、组合学、几何和数论。谷歌提出的混合AI系统做对了四道,获得28分,达到了银牌水平。本月初,UCLA终身教授陶哲轩刚刚宣传了百万美元奖金的AI数学奥林匹克竞赛(AIMO进步奖),没想到7月还没过,AI的做题水平就进步到了这种水平。IMO上同步做题,做对了最难题IMO是历史最悠久、规模最大、最负

编辑|ScienceAI基于有限的临床数据,数百种医疗算法已被批准。科学家们正在讨论由谁来测试这些工具,以及如何最好地进行测试。DevinSingh在急诊室目睹了一名儿科患者因长时间等待救治而心脏骤停,这促使他探索AI在缩短等待时间中的应用。Singh利用了SickKids急诊室的分诊数据,与同事们建立了一系列AI模型,用于提供潜在诊断和推荐测试。一项研究表明,这些模型可以加快22.3%的就诊速度,将每位需要进行医学检查的患者的结果处理速度加快近3小时。然而,人工智能算法在研究中的成功只是验证此

编辑|ScienceAI问答(QA)数据集在推动自然语言处理(NLP)研究发挥着至关重要的作用。高质量QA数据集不仅可以用于微调模型,也可以有效评估大语言模型(LLM)的能力,尤其是针对科学知识的理解和推理能力。尽管当前已有许多科学QA数据集,涵盖了医学、化学、生物等领域,但这些数据集仍存在一些不足。其一,数据形式较为单一,大多数为多项选择题(multiple-choicequestions),它们易于进行评估,但限制了模型的答案选择范围,无法充分测试模型的科学问题解答能力。相比之下,开放式问答

2023年,几乎AI的每个领域都在以前所未有的速度进化,同时,AI也在不断地推动着具身智能、自动驾驶等关键赛道的技术边界。多模态趋势下,Transformer作为AI大模型主流架构的局面是否会撼动?为何探索基于MoE(专家混合)架构的大模型成为业内新趋势?大型视觉模型(LVM)能否成为通用视觉的新突破?...我们从过去的半年发布的2023年本站PRO会员通讯中,挑选了10份针对以上领域技术趋势、产业变革进行深入剖析的专题解读,助您在新的一年里为大展宏图做好准备。本篇解读来自2023年Week50

简介在计算机视觉领域,准确地测量图像相似性是一项关键任务,具有广泛的实际应用。从图像搜索引擎到人脸识别系统和基于内容的推荐系统,有效比较和查找相似图像的能力非常重要。Siamese网络与对比损失结合,为数据驱动方式学习图像相似性提供了强大的框架。在这篇博文中,我们将深入了解Siamese网络的细节,探讨对比损失的概念,并探讨这两个组件如何共同工作以创建一个有效的图像相似性模型。首先,Siamese网络由两个相同的子网络组成,这两个子网络共享相同的权重和参数。每个子网络将输入图像编码为特征向量,这
