IT 홈뉴스 8월 31일 Google Cloud는 오늘 열린 Cloud Next 컨퍼런스에서 A3 가상 머신 인스턴스가 다음 달 출시될 것이라고 발표했습니다. Google Cloud는 올해 5월 I/O 개발자 컨퍼런스에서 A3 인스턴스를 발표했습니다. 가장 큰 특징은 생성 AI 및 대규모 언어 모델의 요구 사항을 충족하기 위해 NVIDIA H100 Tensor Core GPU를 탑재했다는 것입니다.
IT House는 이전에 A3 인스턴스가 4세대 Intel Xeon Scalable 프로세서, 2TB DDR5-4800 메모리 및 8개의 NVIDIA H100 "Hopper" GPU를 사용하여 NVLink 4.0 및 NVSwitch 대역폭 공유를 통해 3.6TBps를 달성했다고 보고했습니다.
새로운 A3 슈퍼컴퓨터는 생성 인공 지능 및 대규모 언어 모델 분야에서 오늘날의 혁신을 주도하는 인공 지능 모델의 매우 까다로운 작업을 훈련하고 제공하도록 특별히 설계되었습니다. 보고서에 따르면 이 슈퍼컴퓨터는 26엑사플롭스의 인공지능 성능을 제공할 수 있다고 합니다오늘 출시에서 Google Cloud는 현재까지 가장 비용 효율적이고 접근성이 뛰어난 클라우드 TPU인 새로운 TPU v5e도 출시했습니다. 이러한 TPU 및 맞춤형 ASIC은 인공 지능 및 머신 러닝 워크로드를 가속화하도록 설계되었습니다
SDxCentral 보고서에 따르면 TPU v5e는 이전 세대 제품에 비해 달러당 훈련 성능이 2배, 달러당 추론 성능이 2.5배 향상되었습니다
위 내용은 Google은 NVIDIA H100을 탑재하여 26exaFlop의 AI 성능을 제공하는 A3 인스턴스를 출시할 예정입니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!