끝없는 가능성 NVIDIA Generative AI 모델로 단백질 합성 가속화
지난 2년 동안 머신러닝은 단백질 구조 예측에 혁명을 일으켰습니다. 이제 인공지능은 단백질 디자인 분야에 새로운 혁명을 일으켰습니다.
AI가 등장한 이후 많은 과학자들이 이를 활용하여 단백질 연구를 수행하는 추세에 동참했습니다. 생물학자들은 기계 학습을 사용하면 단 몇 초 만에 단백질 분자를 생성할 수 있다는 사실을 발견했습니다. 과거에는 이 시간이 몇 달이었을 수도 있습니다.
최근 스타트업 Evozyne은 NVIDIA가 제공하는 사전 훈련된 AI 모델을 사용하여 의료 및 청정 에너지 분야에서 상당한 잠재력을 지닌 두 가지 단백질을 만들었습니다. 단백질 중 하나는 선천성 질환을 치료하는 데 사용되고, 다른 하나는 지구 온난화를 줄이기 위해 이산화탄소를 소비하는 데 사용됩니다.
이런 방식으로 과학자들은 NVIDIA BioNeMo를 사용하여 고품질 단백질을 생성할 수 있는 대규모 언어 모델을 만들어 약물 개발 속도를 높이고 보다 지속 가능한 환경을 조성하는 데 도움을 줍니다.
약물 발견을 가속화하는 새로운 방법
Evozyne의 공동 창립자이자 논문의 공동 저자인 Andrew Ferguson은 다음과 같이 말했습니다. "기쁜 점은 1차 라운드에서 이 AI 모델에 의해 생성된 합성 단백질이 자연적으로 발생하는 단백질과 같습니다. 모델이 자연의 설계 규칙을 학습했음을 나타냅니다.”
Evozyne은 NVIDIA의 ProtT5를 사용합니다. ProtT5는 의료 AI 모델 생성을 위한 소프트웨어 프레임워크이자 서비스인 NVIDIA BioNeMo의 일부인 Transformer 모델입니다.
화학 및 기계 학습 분야를 연구하는 분자 엔지니어 Ferguson은 다음과 같이 말했습니다. "BioNeMo는 매우 강력하며 모델을 훈련한 다음 해당 모델을 사용하여 매우 저렴한 비용으로 작업을 실행할 수 있습니다. 수백만 개의 시퀀스를 생성합니다. 이 모델은 Evozyne의 요구 사항을 충족하는 새로운 단백질을 조립하는 방법을 예측합니다."
이 모델은 Evovyne ProT-VAE 파이프라인의 핵심입니다. Evozyne의 ProT-VAE 파이프라인은 NVIDIA BioNeMo의 강력한 Transformer 모델과 VAE(변형 자동 인코더)를 결합합니다.
그는 "몇 년 전만 해도 변형 자동 인코더와 결합된 대규모 언어 모델을 사용하여 단백질을 설계할 수 있다는 사실을 아무도 눈치 채지 못했습니다."
반면 Evozyne의 방법은 한 라운드만 거치면 단백질의 절반 이상을 변경할 수 있습니다. 단백질의 아미노산. 이는 수백 개의 돌연변이에 해당합니다.
Evozyne 데이터 과학자 Joshua Moller는 다음과 같이 말했습니다. "작업을 여러 GPU로 확장하여 훈련 속도를 높입니다.
이렇게 하면 대규모 AI 모델을 훈련하는 시간이 몇 달에서 일주일로 단축됩니다. 따라서 다른 방법으로는 불가능했을 모델을 훈련할 수 있습니다. 훈련 가능한 매개변수가 수십억 개에 달하는 일부와 같은 훈련을 수행합니다. ”
혁명적인 AI 모델
전통적인 단백질 공학 설계 방법, 즉 방향성 진화는 일반적으로 한 번에 몇 개의 아미노산의 순서만 변경하는 느리고 계획되지 않은 접근 방식을 사용합니다. 기계 학습은 가능한 대규모 연구에 사용됩니다.
BioNeMo는 슈퍼컴퓨팅 규모의 대규모 애플리케이션을 훈련하고 배포하기 위해 NVIDIA NeMo Megatron을 기반으로 구축된 AI 지원 약물 개발 클라우드 서비스 및 프레임워크입니다. 사전 훈련된 LLM, 단백질, DNA, RNA 및 화학에 대한 일반적인 파일 형식을 기본적으로 지원하며 데이터 로더를 사용하여 SMILES(분자 구조용) 및 FASTA(아미노산 및 뉴클레오티드 서열용)에 사용할 수 있습니다. BioNeMo, 과학자들은 UniRef50 및 ZINC 데이터베이스용 사전 훈련된 모델, 자동 다운로더 및 전처리기를 사용하여 다양한 모델, 임베딩 및 출력을 쉽게 시작할 수 있습니다. 또한 감독되지 않은 사전 훈련을 통해 단백질 구조를 예측하는 학습된 임베딩을 신속하게 생성하기 위해 레이블이 지정된 데이터가 필요하지 않습니다. , 기능, 세포 위치, 수용성, 막 결합, 저장 영역 및 가변 영역 등
그 중 MegaMolBART는 14억 개의 분자(SMILES 문자열)로 학습된 생성 화학 모델로 다양한 용도로 사용할 수 있습니다. BioNeMo는 ProtT5 및 ESM1.-85M 및 기타 Transformer 기반 단백질 언어 모델을 제공합니다.
BioNeMo는 새로운 단백질 서열의 3D 구조를 예측하기 위한 딥 러닝 모델인 OpenFold도 제공합니다.
NVIDIA의 Transformer 모델은 다음과 같습니다. 수백만 개의 단백질 아미노산 서열. 이 모델은 신경망에서 사용하는 기술을 사용하여 텍스트를 이해하고 자연이 단백질 아미노산 서열을 구성하는 방법을 학습합니다.
미래를 살펴보면 AI를 사용하여 단백질 공학을 가속화할 전망은 매우 밝습니다. 기존 단백질의 경우 에너지가 없거나 고온과 같은 극한 조건에서도 더욱 안정적이고 기능 중 하나를 달성할 수 있습니다.
또한 인공지능을 활용해 골격에 맞게 아미노산 서열을 설계할 수도 있는데, 이를 통해 효소, 항체 등 특정 단백질의 안정성을 향상시킬 수 있습니다. 인공지능 기술은 미래에는 오염을 줄이고 환경을 개선하는 데 사용할 수 있는 새로운 생물학적 물질을 포함하여 점점 더 유용한 단백질을 설계하는 데 매우 중요한 역할을 할 수 있습니다. .
위 내용은 끝없는 가능성 NVIDIA Generative AI 모델로 단백질 합성 가속화의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











CentOS 종료 명령은 종료이며 구문은 종료 [옵션] 시간 [정보]입니다. 옵션은 다음과 같습니다. -H 시스템 중지 즉시 옵션; -P 종료 후 전원을 끕니다. -R 다시 시작; -대기 시간. 시간은 즉시 (현재), 분 (분) 또는 특정 시간 (HH : MM)으로 지정할 수 있습니다. 추가 정보는 시스템 메시지에 표시 될 수 있습니다.

CentOS 시스템 하에서 Gitlab의 백업 및 복구 정책 데이터 보안 및 복구 가능성을 보장하기 위해 CentOS의 Gitlab은 다양한 백업 방법을 제공합니다. 이 기사는 완전한 GITLAB 백업 및 복구 전략을 설정하는 데 도움이되는 몇 가지 일반적인 백업 방법, 구성 매개 변수 및 복구 프로세스를 자세히 소개합니다. 1. 수동 백업 gitlab-rakegitlab : 백업 : 명령을 작성하여 수동 백업을 실행하십시오. 이 명령은 gitlab 저장소, 데이터베이스, 사용자, 사용자 그룹, 키 및 권한과 같은 주요 정보를 백업합니다. 기본 백업 파일은/var/opt/gitlab/backups 디렉토리에 저장됩니다. /etc /gitlab을 수정할 수 있습니다

CentOS 시스템에서 HDFS 구성 확인에 대한 완전한 안내서이 기사에서는 CentOS 시스템에서 HDF의 구성 및 실행 상태를 효과적으로 확인하는 방법을 안내합니다. 다음 단계는 HDF의 설정 및 작동을 완전히 이해하는 데 도움이됩니다. Hadoop 환경 변수 확인 : 먼저 Hadoop 환경 변수가 올바르게 설정되어 있는지 확인하십시오. 터미널에서 다음 명령을 실행하여 Hadoop이 올바르게 설치되고 구성되었는지 확인하십시오. Hadoopversion Check HDFS 구성 파일 : HDFS의 Core 구성 파일은/etc/hadoop/conf/directory에 있으며 Core-Site.xml 및 HDFS-Site.xml이 중요합니다. 사용

CentOS 시스템에서 Pytorch GPU 가속도를 활성화하려면 Cuda, Cudnn 및 GPU 버전의 Pytorch를 설치해야합니다. 다음 단계는 프로세스를 안내합니다. CUDA 및 CUDNN 설치 CUDA 버전 호환성 결정 : NVIDIA-SMI 명령을 사용하여 NVIDIA 그래픽 카드에서 지원하는 CUDA 버전을보십시오. 예를 들어, MX450 그래픽 카드는 CUDA11.1 이상을 지원할 수 있습니다. Cudatoolkit 다운로드 및 설치 : NVIDIACUDATOOLKIT의 공식 웹 사이트를 방문하여 그래픽 카드에서 지원하는 가장 높은 CUDA 버전에 따라 해당 버전을 다운로드하여 설치하십시오. CUDNN 라이브러리 설치 :

Docker는 Linux 커널 기능을 사용하여 효율적이고 고립 된 응용 프로그램 실행 환경을 제공합니다. 작동 원리는 다음과 같습니다. 1. 거울은 읽기 전용 템플릿으로 사용되며, 여기에는 응용 프로그램을 실행하는 데 필요한 모든 것을 포함합니다. 2. Union 파일 시스템 (Unionfs)은 여러 파일 시스템을 스택하고 차이점 만 저장하고 공간을 절약하고 속도를 높입니다. 3. 데몬은 거울과 컨테이너를 관리하고 클라이언트는 상호 작용을 위해 사용합니다. 4. 네임 스페이스 및 CGroup은 컨테이너 격리 및 자원 제한을 구현합니다. 5. 다중 네트워크 모드는 컨테이너 상호 연결을 지원합니다. 이러한 핵심 개념을 이해 함으로써만 Docker를 더 잘 활용할 수 있습니다.

Centos에 MySQL을 설치하려면 다음 단계가 필요합니다. 적절한 MySQL Yum 소스 추가. mysql 서버를 설치하려면 yum install mysql-server 명령을 실행하십시오. mysql_secure_installation 명령을 사용하여 루트 사용자 비밀번호 설정과 같은 보안 설정을 작성하십시오. 필요에 따라 MySQL 구성 파일을 사용자 정의하십시오. MySQL 매개 변수를 조정하고 성능을 위해 데이터베이스를 최적화하십시오.

SSH 서비스를 다시 시작하라는 명령은 SystemCTL SSHD를 다시 시작합니다. 자세한 단계 : 1. 터미널에 액세스하고 서버에 연결; 2. 명령을 입력하십시오 : SystemCTL SSHD 재시작; 3. 서비스 상태를 확인하십시오 : SystemCTL 상태 SSHD.

CentOS 시스템에 대한 Pytorch 분산 교육에는 다음 단계가 필요합니다. Pytorch 설치 : 전제는 Python과 PIP가 CentOS 시스템에 설치된다는 것입니다. CUDA 버전에 따라 Pytorch 공식 웹 사이트에서 적절한 설치 명령을 받으십시오. CPU 전용 교육의 경우 다음 명령을 사용할 수 있습니다. PipinStalltorchtorchvisiontorchaudio GPU 지원이 필요한 경우 CUDA 및 CUDNN의 해당 버전이 설치되어 있는지 확인하고 해당 PyTorch 버전을 설치하려면 설치하십시오. 분산 환경 구성 : 분산 교육에는 일반적으로 여러 기계 또는 단일 기계 다중 GPU가 필요합니다. 장소
