无限的可能性 NVIDIA生成式AI模型加速合成蛋白质
过去两年,机器学习彻底改变了蛋白质结构预测。而现在,人工智能又在蛋白质设计领域引发了新一轮革命。
自从AI问世以来,众多科学家们就加入了利用它来进行蛋白质研究的赛道。生物学家发现,使用机器学习,可以在几秒钟内创建出蛋白质分子。而在以前,这个时间也许是几个月。
近日,初创企业Evozyne使用NVIDIA提供的预训练AI模型,创造了两种在医疗和清洁能源领域具有重大潜力的蛋白质。其中一种蛋白质用于治疗一种先天性疾病,另一种用于消耗二氧化碳以减少全球变暖。
这样科学家使用NVIDIA BioNeMo创建出能够生成高质量蛋白质的大型语言模型,以此加快药物研发并助力创造更具可持续性的环境。
加速药物研发的新方法
Evozyne联合创始人、论文共同作者Andrew Ferguson表示: “令人欣喜的是,这个AI模型第一轮产出的合成蛋白质就像自然生成的蛋白质一样,表示该模型已经学会了自然界的设计规则。”
Evozyne使用了NVIDIA的ProtT5。ProtT5是一个Transformer模型,是用于创建医疗AI模型的软件框架和服务——NVIDIA BioNeMo的一部分。
分子工程师Ferguson的研究领域涵盖化学和机器学习领域,他表示:“BioNeMo非常强大,让我们能够训练模型,然后以非常低的成本使用该模型来运行工作任务,在几秒钟内就能生成数百万个序列。该模型预测了如何组装出能够满足Evozyne需求的新蛋白质。”
该模型是Evovyne ProT-VAE流程的核心。Evozyne的ProT-VAE流程将NVIDIA BioNeMo中强大的Transformer模型与变分自编码器(VAE)相结合。
他表示:“几年前,还没有人注意到可以使用大型语言模型与变分自编码器相结合的方式来设计蛋白质。”
相比之下,Evozyne的方法只通过一轮,就能改变一个蛋白质中半数乃至以上的氨基酸。这相当于进行了数百次的突变。
Evozyne数据科学家Joshua Moller表示: “他们通过将工作扩展到多个GPU来加快训练速度。
这将训练大型 AI 模型的时间从几个月缩短到一个星期。Ferguson表示:“所以我们能够训练出原本不可能训练出的模型,比如一些有数十亿可训练参数的模型。”
革命性的AI模型
传统的蛋白质工程设计方法,即定向进化,采用的是一种缓慢、无计划的方法,通常一次只改变几个氨基酸的序列。而机器学习有助于研究海量可能的氨基酸组合,然后有效地识别最有用的序列。
BioNeMo是一款基于NVIDIA NeMo Megatron构建的AI赋能药物研发云服务和框架,用于在超级计算规模下训练和部署大型生物分子Transformer AI模型。服务包括预训练LLM、对蛋白质、DNA、RNA和化学的通用文件格式的原生支持,还提供可供SMILES(用于分子结构)和FASTA(用于氨基酸和核苷酸序列)使用的数据加载器。
借助BioNeMo,科学家可以开始为UniRef50和ZINC数据库轻松使用预训练模型、自动下载器和预处理器。借助无监督式结构化学习者,各种模型、嵌入和输出得以结合,将多模态数据组合在一起。无监督式预训练还消除了对已标记数据的需求,从而快速生成已学习的嵌入,预测蛋白质结构、功能、细胞位置、水溶性、膜结合性、保存区域和可变区域等。
其中,MegaMolBART是一种使用14亿个分子(SMILES字符串)进行训练的生成化学模型,可用于多种化学信息学应用。而且BioNeMo提供了ProtT5和ESM1-85M等基于 Transformer 的蛋白质语言模型。
BioNeMo还提供OpenFold,这是一种用于预测新型蛋白质序列 3D 结构的深度学习模型。
NVIDIA的Transformer模型会读取数百万种蛋白质中的氨基酸序列。该模型运用神经网络用来理解文本的技术,学会了大自然如何构建蛋白质氨基酸序列。
展望未来,使用AI加速蛋白质工程的前景十分广阔。人工设计出来的蛋白质相对于自然界中原本就存在的蛋白质而言,更加稳定,在没有能量或高温等极端情况下,也能实现它的某项功能。
此外,也可以用人工智能来设计氨基酸序列,使其与主干相符,用于改善酶、抗体等特定蛋白的稳定性。人工智能技术对于不同大小、不同构象的蛋白质设计起到了非常重要的作用,未来还可帮助设计更多、更有用的蛋白质,包括可用于减少污染、改善环境的新的生物材料。
以上是无限的可能性 NVIDIA生成式AI模型加速合成蛋白质的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

CentOS 关机命令为 shutdown,语法为 shutdown [选项] 时间 [信息]。选项包括:-h 立即停止系统;-P 关机后关电源;-r 重新启动;-t 等待时间。时间可指定为立即 (now)、分钟数 ( minutes) 或特定时间 (hh:mm)。可添加信息在系统消息中显示。

CentOS系统下GitLab的备份与恢复策略为了保障数据安全和可恢复性,CentOS上的GitLab提供了多种备份方法。本文将详细介绍几种常见的备份方法、配置参数以及恢复流程,帮助您建立完善的GitLab备份与恢复策略。一、手动备份利用gitlab-rakegitlab:backup:create命令即可执行手动备份。此命令会备份GitLab仓库、数据库、用户、用户组、密钥和权限等关键信息。默认备份文件存储于/var/opt/gitlab/backups目录,您可通过修改/etc/gitlab

检查CentOS系统中HDFS配置的完整指南本文将指导您如何有效地检查CentOS系统上HDFS的配置和运行状态。以下步骤将帮助您全面了解HDFS的设置和运行情况。验证Hadoop环境变量:首先,确认Hadoop环境变量已正确设置。在终端执行以下命令,验证Hadoop是否已正确安装并配置:hadoopversion检查HDFS配置文件:HDFS的核心配置文件位于/etc/hadoop/conf/目录下,其中core-site.xml和hdfs-site.xml至关重要。使用

在CentOS系统上启用PyTorchGPU加速,需要安装CUDA、cuDNN以及PyTorch的GPU版本。以下步骤将引导您完成这一过程:CUDA和cuDNN安装确定CUDA版本兼容性:使用nvidia-smi命令查看您的NVIDIA显卡支持的CUDA版本。例如,您的MX450显卡可能支持CUDA11.1或更高版本。下载并安装CUDAToolkit:访问NVIDIACUDAToolkit官网,根据您显卡支持的最高CUDA版本下载并安装相应的版本。安装cuDNN库:前

Docker利用Linux内核特性,提供高效、隔离的应用运行环境。其工作原理如下:1. 镜像作为只读模板,包含运行应用所需的一切;2. 联合文件系统(UnionFS)层叠多个文件系统,只存储差异部分,节省空间并加快速度;3. 守护进程管理镜像和容器,客户端用于交互;4. Namespaces和cgroups实现容器隔离和资源限制;5. 多种网络模式支持容器互联。理解这些核心概念,才能更好地利用Docker。

在 CentOS 上安装 MySQL 涉及以下步骤:添加合适的 MySQL yum 源。执行 yum install mysql-server 命令以安装 MySQL 服务器。使用 mysql_secure_installation 命令进行安全设置,例如设置 root 用户密码。根据需要自定义 MySQL 配置文件。调整 MySQL 参数和优化数据库以提升性能。

重启 SSH 服务的命令为:systemctl restart sshd。步骤详解:1. 访问终端并连接到服务器;2. 输入命令:systemctl restart sshd;3. 验证服务状态:systemctl status sshd。

在CentOS系统上进行PyTorch分布式训练,需要按照以下步骤操作:PyTorch安装:前提是CentOS系统已安装Python和pip。根据您的CUDA版本,从PyTorch官网获取合适的安装命令。对于仅需CPU的训练,可以使用以下命令:pipinstalltorchtorchvisiontorchaudio如需GPU支持,请确保已安装对应版本的CUDA和cuDNN,并使用相应的PyTorch版本进行安装。分布式环境配置:分布式训练通常需要多台机器或单机多GPU。所
