IBM은 수백억 개의 매개변수 모델을 유연하게 배치하고 교육하기 위해 클라우드 기반 AI 슈퍼컴퓨터 Vela를 개발합니다.-일체 포함-php.cn

집

기술 주변기기

일체 포함

IBM은 수백억 개의 매개변수 모델을 유연하게 배치하고 교육하기 위해 클라우드 기반 AI 슈퍼컴퓨터 Vela를 개발합니다.

王林

Apr 14, 2023 pm 01:46 PM

ai ibm 클라우드 네이티브

ChatGPT는 인터넷에서 인기가 높으며, 그 뒤에 숨은 AI 모델 훈련 또한 폭넓은 관심을 끌었습니다. IBM Research는 최근 자사가 개발한 클라우드 기반 슈퍼컴퓨터 Vela를 신속하게 배포하고 기본 AI 모델을 훈련하는 데 사용할 수 있다고 발표했습니다. 2022년 5월부터 수십 명의 회사 연구원들이 이 슈퍼컴퓨터를 사용하여 수백억 개의 매개변수로 AI 모델을 훈련해 왔습니다.

IBM은 수백억 개의 매개변수 모델을 유연하게 배치하고 교육하기 위해 클라우드 기반 AI 슈퍼컴퓨터 Vela를 개발합니다.

기본 모델은 레이블이 지정되지 않은 대량의 데이터에 대해 훈련된 AI 모델이며, 그 다양성은 미세 조정만으로 다양한 작업에 사용할 수 있음을 의미합니다. 규모가 엄청나며 막대하고 값비싼 컴퓨팅 성능이 필요합니다. 따라서 전문가들의 말처럼 컴퓨팅 능력은 차세대 대규모 기본 모델 개발에 있어서 가장 큰 병목 현상이 될 것이며, 이를 훈련시키기 위해서는 많은 컴퓨팅 능력과 시간이 필요하다.

수천억 또는 수천억 개의 매개변수를 실행할 수 있는 모델을 훈련하려면 네트워크, 병렬 파일 시스템, 베어메탈 노드를 포함한 고성능 컴퓨팅 하드웨어를 사용해야 합니다. 이 하드웨어는 배포하기 어렵고 실행 비용이 많이 듭니다. Microsoft는 2020년 5월 OpenAI용 AI 슈퍼컴퓨터를 구축하고 이를 Azure 클라우드 플랫폼에서 호스팅했습니다. 그러나 IBM은 하드웨어 중심이기 때문에 비용이 증가하고 유연성이 제한된다고 말합니다.

클라우드 AI 슈퍼컴퓨터

그래서 IBM은 “특히 대규모 AI에 초점을 맞춘” Vela라는 시스템을 만들었습니다.

Vela는 필요에 따라 IBM의 모든 클라우드 데이터 센터에 배포할 수 있으며 그 자체가 "가상 클라우드"입니다. 이 접근 방식은 물리학 기반 슈퍼컴퓨터를 구축하는 것에 비해 컴퓨팅 성능을 감소시키지만 보다 유연한 솔루션을 생성합니다. 클라우드 컴퓨팅 솔루션은 엔지니어에게 API 인터페이스를 통한 리소스, 심층적인 통합을 위한 광범위한 IBM 클라우드 에코시스템에 대한 보다 쉬운 액세스, 필요에 따라 성능을 확장할 수 있는 기능을 제공합니다.

IBM 엔지니어는 Vela가 사용자 정의 스토리지 백엔드를 구축하는 대신 IBM Cloud Object Storage의 데이터 세트에 액세스할 수 있다고 설명했습니다. 이전에는 이 인프라를 슈퍼컴퓨터에 별도로 구축해야 했습니다.

모든 AI 슈퍼컴퓨터의 핵심 구성 요소는 수많은 GPU와 이를 연결하는 노드입니다. Vela는 실제로 각 노드를 (베어메탈이 아닌) 가상 머신으로 구성합니다. 이는 가장 일반적인 방법이며 AI 훈련에 가장 이상적인 방법으로 널리 간주됩니다.

Vela는 어떻게 만들어졌나요?

클라우드 가상 컴퓨터의 단점 중 하나는 성능을 보장할 수 없다는 것입니다. 성능 저하를 해결하고 가상 머신 내에서 베어메탈 성능을 제공하기 위해 IBM 엔지니어는 전체 노드 성능(GPU, CPU, 네트워크 및 스토리지 포함)을 잠금 해제하고 로드 손실을 5% 미만으로 줄이는 방법을 찾았습니다.

여기에는 가상화를 위한 베어메탈 호스트 구성, VM 확장 지원, 대형 페이지 및 단일 루트 IO 가상화가 포함되며 VM 내의 모든 장치 및 연결에 대한 현실적인 표현도 포함되며 네트워크 카드를 CPU 및 GPU에 일치시키는 것도 포함됩니다. 서로 연결하는 방법. 이 작업을 완료한 후 가상 머신 노드의 성능이 "베어메탈에 가깝다"는 사실을 발견했습니다.

또한 AI 훈련 데이터, 모델 및 완제품을 캐싱하기 위해 대용량 GPU 메모리와 대용량 로컬 스토리지를 갖춘 AI 노드를 설계하는 데에도 전념하고 있습니다. PyTorch를 사용한 테스트에서 그들은 워크로드 통신 패턴을 최적화함으로써 슈퍼컴퓨팅에 사용되는 Infiniband와 같은 빠른 네트워크에 비해 상대적으로 느린 이더넷 네트워크의 병목 현상을 해소할 수 있다는 것을 발견했습니다.

구성 측면에서 각 Vela는 80GB A100 GPU 8개, 2세대 Intel Xeon 확장 가능 프로세서 2개, 1.5TB 메모리 및 4개의 3.2TB NVMe 하드 드라이브를 사용하며 모든 규모의 클라우드 데이터 센터에 배포할 수 있습니다. 세계 각국.

IBM 엔지니어는 다음과 같이 말했습니다. "올바른 도구와 인프라를 갖추는 것은 R&D 효율성을 향상시키는 핵심 요소입니다. 많은 팀이 AI용 기존 슈퍼컴퓨터를 구축하는 검증된 경로를 선택합니다. 우리는 더 나은 솔루션을 위해 노력해 왔습니다. 솔루션, 고성능 컴퓨팅과 고급 사용자 생산성의 두 가지 이점을 제공합니다.”

위 내용은 IBM은 수백억 개의 매개변수 모델을 유연하게 배치하고 교육하기 위해 클라우드 기반 AI 슈퍼컴퓨터 Vela를 개발합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7485

Cakephp 튜토리얼

1377

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

SQL에서 새 열을 추가하는 방법 Apr 09, 2025 pm 02:09 PM

Alter Table 문을 사용하여 SQL의 기존 테이블에 새 열을 추가하십시오. 특정 단계에는 다음이 포함됩니다. 테이블 이름 및 열 정보 결정, Alter Table 문 작성 및 진술 실행. 예를 들어, 고객 테이블에 이메일 열을 추가하십시오 (Varchar (50)) : Alter Table 고객 이메일 추가 Varchar (50);

SQL에서 열을 추가하기위한 구문은 무엇입니까? Apr 09, 2025 pm 02:51 PM

SQL에서 열을 추가하기위한 구문은 Alter Table_Name ADD CORMEN_NAME DATY_TYPE [NOT NULL] [DEFAULT DEFAULT_VALUE]; 여기서 table_name은 테이블 이름이고 column_name은 새 열 이름, data_type는 데이터 유형이며 NULL은 NULL 값이 허용되는지 여부를 지정하고 기본값 기본값을 지정합니다.

SQL 클리어 테이블 : 성능 최적화 팁 Apr 09, 2025 pm 02:54 PM

SQL 테이블 개선 성능을 개선하기위한 팁 : 삭제 대신 Truncate 테이블을 사용하고 공간을 확보하고 ID 열을 재설정하십시오. 계단식 삭제를 방지하기 위해 외국의 주요 제약 조건을 비활성화하십시오. 트랜잭션 캡슐화 작업을 사용하여 데이터 일관성을 보장합니다. 배치는 빅 데이터를 삭제하고 한계를 통해 행 수를 제한합니다. 쿼리 효율성을 향상시키기 위해 지우고 지수를 재구성하십시오.

SQL에서 열을 추가 할 때 기본값을 설정하는 방법 Apr 09, 2025 pm 02:45 PM

새로 추가 된 열에 대한 기본값을 설정하고 Alter Table 문을 사용하십시오. 문 : 열 추가를 지정하고 기본값을 설정하십시오. Alter Table_Name Add Column_name Data_Type Default_value; 구속 조건 조항을 사용하여 기본값을 지정하십시오. ALTER TABLE TABLE_NAME CORMENT CORMEN_NAME DATA DATA DATA DATA DATA DATA DATA DATAY_TYPE 제한 DEFAULT_COSSTRANT DEFAULT DEFAULT_VALUE;

삭제 명령문을 사용하여 SQL 테이블을 지우십시오 Apr 09, 2025 pm 03:00 PM

예, 삭제 명령문은 SQL 테이블을 지우는 데 사용될 수 있습니다. 단계는 다음과 같습니다. 삭제 명령문 사용 : table_name에서 삭제; TABLE_NAME을 제거 할 테이블 이름으로 바꾸십시오.

Redis 메모리 조각화를 처리하는 방법? Apr 10, 2025 pm 02:24 PM

Redis 메모리 조각화는 할당 된 메모리에 재 할당 할 수없는 작은 자유 영역의 존재를 말합니다. 대처 전략에는 다음이 포함됩니다. REDIS를 다시 시작하십시오 : 메모리를 완전히 지우지 만 인터럽트 서비스. 데이터 구조 최적화 : Redis에 더 적합한 구조를 사용하여 메모리 할당 및 릴리스 수를 줄입니다. 구성 매개 변수 조정 : 정책을 사용하여 최근에 가장 적게 사용 된 키 값 쌍을 제거하십시오. 지속 메커니즘 사용 : 데이터를 정기적으로 백업하고 Redis를 다시 시작하여 조각을 정리하십시오. 메모리 사용 모니터링 : 적시에 문제를 발견하고 조치를 취하십시오.

phpmyadmin은 데이터 테이블을 만듭니다 Apr 10, 2025 pm 11:00 PM

phpmyadmin을 사용하여 데이터 테이블을 만들려면 다음 단계가 필수적입니다. 데이터베이스에 연결하고 새 탭을 클릭하십시오. 테이블의 이름을 지정하고 저장 엔진을 선택하십시오 (InnoDB 권장). 열 이름, 데이터 유형, NULL 값 허용 여부 및 기타 속성을 포함하여 열 추가 버튼을 클릭하여 열 디테일을 추가하십시오. 기본 키로 하나 이상의 열을 선택하십시오. 저장 버튼을 클릭하여 테이블과 열을 만듭니다.

Redis Exporter 서비스로 Redis 액 적을 모니터링하십시오 Apr 10, 2025 pm 01:36 PM

Redis 데이터베이스의 효과적인 모니터링은 최적의 성능을 유지하고 잠재적 인 병목 현상을 식별하며 전반적인 시스템 신뢰성을 보장하는 데 중요합니다. Redis Exporter Service는 Prometheus를 사용하여 Redis 데이터베이스를 모니터링하도록 설계된 강력한 유틸리티입니다. 이 튜토리얼은 Redis Exporter Service의 전체 설정 및 구성을 안내하여 모니터링 솔루션을 원활하게 구축 할 수 있도록합니다. 이 자습서를 연구하면 완전히 작동하는 모니터링 설정을 달성 할 수 있습니다.

See all articles

IBM은 수백억 개의 매개변수 모델을 유연하게 배치하고 교육하기 위해 클라우드 기반 AI 슈퍼컴퓨터 Vela를 개발합니다.

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제