比传统方法高30倍,中国科学院团队Transformer深度学习模型预测糖-蛋白质作用位点
糖类是自然界中最丰富的有机物质,对生命至关重要。了解糖类如何在生理和病理过程中调节蛋白质,可以为解决关键的生物学问题和开发新的治疗方法提供机遇。
然而,糖类分子的多样性和复杂性,对实验识别糖-蛋白质结合以及相互作用的位点提出了挑战。
在这里,中国科学院团队开发了一种深度学习模型 DeepGlycanSite,它能够准确预测给定蛋白质结构上的糖结合位点。
DeepGlycanSite 将蛋白质的几何和进化特征融入具有 Transformer 架构的深度等变图神经网络中,其性能显着超越了之前的先进方法,并能有效预测各种糖类分子的结合位点。
结合诱变研究,DeepGlycanSite 揭示了重要 G 蛋白偶联受体的鸟苷-5'-二磷酸糖识别位点。
这些发现表明 DeepGlycanSite 对于糖结合位点预测具有重要价值,并可以深入了解具有治疗重要性蛋白质的糖类调节背后的分子机制。
该研究以「Highly accurate carbohydrate-binding site prediction with DeepGlycanSite」为题,于 2024 年 6 月 17 日发布在《Nature Communications》。
糖在所有生物体的细胞表面普遍存在,它们与多种蛋白质家族如凝集素、抗体、酶和转运蛋白相互作用,调节免疫反应、细胞分化和神经发育等关键生物学过程。理解糖类与蛋白质的相互作用机制是开发糖类药物的基础。
然而,糖类结构的多样性和复杂性,尤其是它们与蛋白质结合位点的多变性,给实验数据的获取和药物设计带来了挑战。
图示:糖类分子的复杂性和糖结合位点的多样性。 (来源:论文)
过去,传统的结合位点预测方法不适用于结构复杂、大小变化大的糖类分子。加之高分辨率糖-蛋白质复合物结构数据的稀缺,导致预测模型的性能受限。
近年来,随着蛋白质数据库(PDB)和开放糖组学资源的快速发展,学界已经积累了超过 19000 个此类复合物的结构数据。这些高质量数据的增加,为采用 AI 技术开发精确的糖结合位点预测模型提供了可能,从而有望加速糖类药物的发现和优化过程。
在最新的研究中,中国科学院团队引入了 DeepGlycanSite,这是一种深度等变图神经网络 (EGNN) 模型,能够准确预测具有目标蛋白质结构的糖结合位点。
图示:DeepGlycanSite 概述。 (来源:论文)
该团队利用几何特征(例如残基内和残基间的方向和距离)以及进化信息,在 DeepGlycanSite 中以残基级别的图形表示形式呈现蛋白质。结合具有自注意力机制的 Transformer 块来增强特征提取和复杂关系发现。
在涉及一百多种独特糖结合蛋白的独立测试集上,研究人员将 DeepGlycanSite 与当前最先进的计算方法进行了比较。
结果显示,DeepGlycanSite (0.625) 的平均马修斯相关系数(MCC) 是 StackCBPred (0.018) 的 30 倍以上,同时远超其他序列基础的预测方法。
传统配体结合位点方法可能因疏水性或小尺寸而排除简单糖类分子的结合位点,而 DeepGlycanSite 则能有效识别这些位点。
图示:比较模型在预测不同糖结合位点方面的表现。 (来源:论文)
并且,DeepGlycanSite 在预测蛋白质上的多个糖结合位点方面也表现出色,这对于理解多价糖缀合物如何影响糖-蛋白相互作用以及生物过程的调控具有重要价值。例如,多价糖缀合物被设计成化学工具和药物候选物,以影响糖类分子与凝集素之间的相互作用。
与传统的仅使用蛋白质序列或结构信息的方法不同,DeepGlycanSite 充分考虑了蛋白质的几何信息及进化特性,这可能是其表现优异的关键因素。
此外,给定查询糖类分子的化学结构,DeepGlycanSite 还可以预测其特定结合位点。
图示:查询糖的特定结合位点预测。(来源:论文)
研究人员探索了 DeepGlycanSite 对功能重要的 G 蛋白偶联受体 (GPCR) 的应用。利用 AlphaFold2 预测的蛋白质结构和糖类化学结构,DeepGlycanSite 成功检测到了人类 P2Y14 上 GDP-Fuc 的具体结合位点。
虽然 AlphaFold2 预测的侧链质量有待提高,但 DeepGlycanSite 对蛋白质结构准确性的依赖较低,能够使用预测的蛋白质结构提供糖-蛋白相互作用的见解。
综上所述,DeepGlycanSite 在独立测试集和体外案例研究中的验证表明,它是一个有效的糖结合位点预测工具。研究人员可以利用 DeepGlycanSite 预测目标蛋白质上的糖结合口袋,从而促进对糖-蛋白质相互作用的理解。
糖类在生物学功能中扮演着关键角色,DeepGlycanSite 不仅有助于解析糖类分子和糖结合蛋白的生物学功能,也为糖类药物的开发提供了有力工具。
论文链接:https://www.nature.com/articles/s41467-024-49516-2
以上是比传统方法高30倍,中国科学院团队Transformer深度学习模型预测糖-蛋白质作用位点的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

在现代制造业中,精准的缺陷检测不仅是保证产品质量的关键,更是提升生产效率的核心。然而,现有的缺陷检测数据集常常缺乏实际应用所需的精确度和语义丰富性,导致模型无法识别具体的缺陷类别或位置。为了解决这一难题,由香港科技大学广州和思谋科技组成的顶尖研究团队,创新性地开发出了“DefectSpectrum”数据集,为工业缺陷提供了详尽、语义丰富的大规模标注。如表一所示,相比其他工业数据集,“DefectSpectrum”数据集提供了最多的缺陷标注(5438张缺陷样本),最细致的缺陷分类(125种缺陷类别

开放LLM社区正是百花齐放、竞相争鸣的时代,你能看到Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1等许多表现优良的模型。但是,相比于以GPT-4-Turbo为代表的专有大模型,开放模型在很多领域依然还有明显差距。在通用模型之外,也有一些专精关键领域的开放模型已被开发出来,比如用于编程和数学的DeepSeek-Coder-V2、用于视觉-语言任务的InternVL

编辑|KX时至今日,晶体学所测定的结构细节和精度,从简单的金属到大型膜蛋白,是任何其他方法都无法比拟的。然而,最大的挑战——所谓的相位问题,仍然是从实验确定的振幅中检索相位信息。丹麦哥本哈根大学研究人员,开发了一种解决晶体相问题的深度学习方法PhAI,利用数百万人工晶体结构及其相应的合成衍射数据训练的深度学习神经网络,可以生成准确的电子密度图。研究表明,这种基于深度学习的从头算结构解决方案方法,可以以仅2埃的分辨率解决相位问题,该分辨率仅相当于原子分辨率可用数据的10%到20%,而传统的从头算方

对于AI来说,奥数不再是问题了。本周四,谷歌DeepMind的人工智能完成了一项壮举:用AI做出了今年国际数学奥林匹克竞赛IMO的真题,并且距拿金牌仅一步之遥。上周刚刚结束的IMO竞赛共有六道赛题,涉及代数、组合学、几何和数论。谷歌提出的混合AI系统做对了四道,获得28分,达到了银牌水平。本月初,UCLA终身教授陶哲轩刚刚宣传了百万美元奖金的AI数学奥林匹克竞赛(AIMO进步奖),没想到7月还没过,AI的做题水平就进步到了这种水平。IMO上同步做题,做对了最难题IMO是历史最悠久、规模最大、最负

2023年,几乎AI的每个领域都在以前所未有的速度进化,同时,AI也在不断地推动着具身智能、自动驾驶等关键赛道的技术边界。多模态趋势下,Transformer作为AI大模型主流架构的局面是否会撼动?为何探索基于MoE(专家混合)架构的大模型成为业内新趋势?大型视觉模型(LVM)能否成为通用视觉的新突破?...我们从过去的半年发布的2023年本站PRO会员通讯中,挑选了10份针对以上领域技术趋势、产业变革进行深入剖析的专题解读,助您在新的一年里为大展宏图做好准备。本篇解读来自2023年Week50

编辑|ScienceAI问答(QA)数据集在推动自然语言处理(NLP)研究发挥着至关重要的作用。高质量QA数据集不仅可以用于微调模型,也可以有效评估大语言模型(LLM)的能力,尤其是针对科学知识的理解和推理能力。尽管当前已有许多科学QA数据集,涵盖了医学、化学、生物等领域,但这些数据集仍存在一些不足。其一,数据形式较为单一,大多数为多项选择题(multiple-choicequestions),它们易于进行评估,但限制了模型的答案选择范围,无法充分测试模型的科学问题解答能力。相比之下,开放式问答

编辑|KX逆合成是药物发现和有机合成中的一项关键任务,AI越来越多地用于加快这一过程。现有AI方法性能不尽人意,多样性有限。在实践中,化学反应通常会引起局部分子变化,反应物和产物之间存在很大重叠。受此启发,浙江大学侯廷军团队提出将单步逆合成预测重新定义为分子串编辑任务,迭代细化目标分子串以生成前体化合物。并提出了基于编辑的逆合成模型EditRetro,该模型可以实现高质量和多样化的预测。大量实验表明,模型在标准基准数据集USPTO-50 K上取得了出色的性能,top-1准确率达到60.8%。

编辑|ScienceAI基于有限的临床数据,数百种医疗算法已被批准。科学家们正在讨论由谁来测试这些工具,以及如何最好地进行测试。DevinSingh在急诊室目睹了一名儿科患者因长时间等待救治而心脏骤停,这促使他探索AI在缩短等待时间中的应用。Singh利用了SickKids急诊室的分诊数据,与同事们建立了一系列AI模型,用于提供潜在诊断和推荐测试。一项研究表明,这些模型可以加快22.3%的就诊速度,将每位需要进行医学检查的患者的结果处理速度加快近3小时。然而,人工智能算法在研究中的成功只是验证此
