AlphaFold 3 向解码分子行为和生物计算迈出重要一步,Nature 子刊锐评

王林
发布: 2024-07-15 10:11:49
原创
1144 人浏览过

AlphaFold 3 向解码分子行为和生物计算迈出重要一步,Nature 子刊锐评

编辑 | KX

如果我们完全了解分子之间是如何相互作用的,那么生物学就没什么可学的了,因为每一种生物现象,包括我们如何感知世界,最终都源于细胞内生物分子的行为和相互作用。

最近推出的 AlphaFold 3 可以直接从蛋白质、核酸及其配体的序列中预测生物分子复合物的 3D 结构。这标志着我们在长期探索生物分子如何相互作用方面取得了重大进展。

AlphaFold 3 代表了直接从复合物序列预测其三维结构的突破,为生物分子相互作用提供了见解。

AlphaFold 3 向解码分子行为和生物计算迈出重要一步,Nature 子刊锐评

1. 生物分子的代码

生物分子(如蛋白质或核酸)的一维 (1D) 序列指定细胞功能,类似于一段代码指定程序。该序列表示编程语言中的代码,并通过折叠过程「编译」成机器语言中的代码,形成独特的 3D 结构。

  1. 程序的执行

该程序由折叠的生物分子与细胞内其他分子之间的相互作用执行。

  1. 生物分子的相互作用

由于其独特的三维结构,生物分子只会与细胞内的一小部分分子(例如 DNA 位点)相互作用,这些相互作用将引发一系列精心策划的化学和结构转化,共同定义生化程序(如转录)。生化过程的产物(如 RNA)代表执行程序的输出。

  1. 生物序列的编码

因此,在生物学中,生物分子的一维序列编码了程序以及编译和执行程序的方法;该序列编码了软件和硬件。根据生物分子的一维序列预测其复合物形成的三维结构是理解生物程序如何执行的关键步骤,对我们理解、合理操纵和设计生物系统的能力具有深远的影响。

AlphaFold 3 向解码分子行为和生物计算迈出重要一步,Nature 子刊锐评

图示:分子生物学的「计算教条」(来源:论文)

1. AlphaFold 2

  • 2020 年发布,革命性的蛋白质结构预测算法
  • 中位准确率优于其他方法
  • 提供 2 亿种已知蛋白质的预测结构

2. RoseTTAFold

  • 2021 年发布,基于深度学习的蛋白质预测工具
  • 预测准确率媲美 AlphaFold 2,速度更快、计算需求更低
  • 利用多轨神经网络实现高精度

3. AlphaFold Multimer

  • AlphaFold 2 的修改版本
  • 训练用于蛋白质复合物数据集
  • 改进了蛋白质-蛋白质复合物预测

4. AlphaFold 3

  • 2023 年 5 月发布
  • 超越专业工具,预测蛋白质复合物的 3D 结构
  • 显著提升蛋白质-配体和蛋白质-核酸复合物的预测准确率
  • 预测包含多种共价修饰的结构

5. 技术更新

  • 替换结构模块为扩散模块
  • 直接预测单个原子的笛卡尔坐标
  • 扩展到更广泛的化学空间

    AlphaFold 3 向解码分子行为和生物计算迈出重要一步,Nature 子刊锐评

    图示:为 AlphaFold 3 的扩散模块提供动力的扩散过程的说明性示例。(来源:论文)

作为 AlphaFold 3 的简化说明:

  1. 想象在一个典型的生物分子复合体中,取每个原子的三维坐标。
  2. 迭代地向其中添加越来越多的高斯噪声,直到我们得到一个随机分布的空间原子云(正向扩散)。
  3. 扩散模型使用多层神经网络来学习逆转这个过程(反向扩散)。

通过这种方式,AlphaFold 3 中的扩散模块学会了:

  • 预测给定复合物中每个原子的坐标,而无需预定义的残基框架。
  • 包含核酸、离子、配体和化学修饰在内的更广泛的化学空间。

其他改进:

  • 用 Pairformer(一种更新的 Transformer 架构)取代 Evoformer。
  • 减少对 MSA 处理的重视。
  • 更新指标以适应网络架构的变化。

进步和局限性:

  • 进步:提高了预测精度,减少了对序列比对的依赖,增加了对残基相互作用的重视。
  • 局限性:有时无法正确模拟分子的手性,无法预测大型蛋白质-核酸复合物的结构,生成模型可能会出现“幻觉”。

RNA 预测:

  • AlphaFold 3 对 RNA 靶标的预测准确性高于其他方法,但不如顶级人类专家。

AlphaFold 服务器:

  • 提供用户友好的界面,但源代码和可执行文件不公开。
  • 伪代码代替了源代码,导致了争论和阻碍了进一步的发展。

    AlphaFold 3 向解码分子行为和生物计算迈出重要一步,Nature 子刊锐评

    1. 在考量 AlphaFold 3 带来的结构预测突破时,重要的是要记住,结构生物学的目标不是预测生物分子及其复合物的 3D 结构,而是预测它们的行为以及执行生物程序时会发生什么。
  1. 为了在预测分子行为方面取得进展,我们必须认识到结构预测问题并不像看起来那么明确。生物分子及其复合物不会折叠成单一结构,而是形成数千种不同构象的集合,每种构象都有不同的概率和寿命。
  2. 了解这些构象景观以及它们在生物分子相互作用时如何变化,对于定量预测亲和力和动力学速率至关重要。
  3. 从各种条件下的序列预测构象集合是我们现在必须集中精力解决的问题,从而获得对分子行为的定量和预测性理解。
  4. 尽管利用 AlphaFold 3 根据生物分子序列预测其自由和相互复合的 3D 结构,是理解分子行为和生物计算的重要一步,但实验人员不必担心被淘汰。结构生物学领域即将变得更加充满活力。

论文链接:https://www.nature.com/articles/s41594-024-01350-2

以上是AlphaFold 3 向解码分子行为和生物计算迈出重要一步,Nature 子刊锐评的详细内容。更多信息请关注PHP中文网其他相关文章!

相关标签:
来源:jiqizhixin.com
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板