Nvidia, AI 칩 H200 출시: 성능 90% 향상, Llama 2 추론 속도 2배 향상-일체 포함-php.cn

집

기술 주변기기

일체 포함

Nvidia, AI 칩 H200 출시: 성능 90% 향상, Llama 2 추론 속도 2배 향상

王林

Nov 14, 2023 pm 12:09 PM

DoNews는 11월 14일 NVIDIA가 베이징 시간으로 13일 차세대 인공지능 슈퍼컴퓨터 칩을 출시했다고 보도했습니다. 이 칩은 OpenAI의 GPT-4와 같은 딥 러닝 및 대규모 언어 모델(LLM)에서 중요한 역할을 할 것입니다.

英伟达发布AI芯片H200：性能飙升90%，Llama 2推理速度翻倍

신세대 칩은 이전 세대에 비해 상당한 발전을 이루었으며 날씨 및 기후 예측, 약물 연구 및 개발, 양자 컴퓨팅과 같은 복잡한 작업을 처리하기 위해 데이터 센터 및 슈퍼컴퓨터에서 널리 사용될 것입니다

출시된 핵심 제품은 Nvidia의 "Hopper" 아키텍처를 기반으로 한 HGX H200 GPU입니다. 이는 H100 GPU의 후속 제품이자 HBM3e 메모리를 사용하는 회사 최초의 칩입니다. HBM3e 메모리는 속도가 더 빠르고 용량도 더 크기 때문에 대규모 언어 모델 애플리케이션에 매우 적합합니다

NVIDIA는 "HBM3e 기술을 통해 NVIDIA H200 메모리 속도는 초당 4.8TB에 달하고, 용량은 A100의 거의 2배인 141GB이며, 대역폭도 2.4배 증가했습니다."라고 밝혔습니다.

인공지능 분야에서 NVIDIA는 Llama 2(700억 매개변수 LLM)에서 HGX H200의 추론 속도가 H100보다 2배 빠르다고 주장합니다. HGX H200은 4방향 및 8방향 구성으로 제공되며 H100 시스템의 소프트웨어 및 하드웨어와 호환됩니다

모든 유형의 데이터 센터(온프레미스, 클라우드, 하이브리드 클라우드 및 엣지)에서 사용할 수 있으며 Amazon Web Services, Google Cloud, Microsoft Azure 및 Oracle Cloud Infrastructure를 통해 배포되며 2024년 2분기에 제공될 예정입니다.

이번에 NVIDIA가 출시한 또 다른 핵심 제품은 HGX H200 GPU와 Arm 기반 NVIDIA Grace CPU를 자사의 NVLink-C2C 인터커넥트를 통해 결합한 GH200 Grace Hopper '슈퍼칩'입니다. 테라바이트급 데이터를 실행하는 복잡한 AI 및 HPC 애플리케이션을 가속화하여 세계에서 가장 어려운 문제를 해결합니다.”

GH200은 Dell, Eviden, Hewlett Packard Enterprise(HPE), Lenovo, QCT 및 Supermicro를 포함하여 "전 세계 연구 센터, 시스템 제조업체 및 클라우드 제공업체의 40개 이상의 AI 슈퍼컴퓨터"에 사용될 예정입니다.

특히 HPE의 Cray EX2500 슈퍼컴퓨터는 수만 개의 Grace Hopper 슈퍼칩 노드로 확장 가능한 4방향 GH200을 특징으로 합니다

위 내용은 Nvidia, AI 칩 H200 출시: 성능 90% 향상, Llama 2 추론 속도 2배 향상의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7422

Cakephp 튜토리얼

1359

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

Related knowledge

나는 Cursor AI와 함께 Vibe 코딩을 시도했는데 놀랍습니다! Mar 20, 2025 pm 03:34 PM

Vibe Coding은 끝없는 코드 라인 대신 자연 언어를 사용하여 애플리케이션을 생성함으로써 소프트웨어 개발의 세계를 재구성하고 있습니다. Andrej Karpathy와 같은 비전가들로부터 영감을 얻은이 혁신적인 접근 방식은 Dev가

Dall-E 3 사용 방법 : 팁, 예제 및 기능 Mar 09, 2025 pm 01:00 PM

Dall-E 3 : 생성 AI 이미지 생성 도구 생성 AI는 컨텐츠 생성에 혁명을 일으키고 있으며 OpenAi의 최신 이미지 생성 모델 인 Dall-E 3은 최전선에 있습니다. 2023 년 10 월에 출시 된이 제품은 전임자 인 Dall-E 및 Dall-E 2를 기반으로합니다.

2025 년 2 월 2 일 Genai 출시 : GPT-4.5, Grok-3 & More! Mar 22, 2025 am 10:58 AM

2025 년 2 월은 Generative AI의 또 다른 게임 변화 달이었으며, 가장 기대되는 모델 업그레이드와 획기적인 새로운 기능을 제공합니다. Xai 's Grok 3 및 Anthropic's Claude 3.7 Sonnet, Openai 's G에 이르기까지

물체 감지에 Yolo V12를 사용하는 방법은 무엇입니까? Mar 22, 2025 am 11:07 AM

Yolo (한 번만 보이면)는 주요 실시간 객체 감지 프레임 워크였으며 각 반복은 이전 버전에서 개선되었습니다. 최신 버전 Yolo V12는 정확도를 크게 향상시키는 발전을 소개합니다.

Elon Musk & Sam Altman은 5 천억 달러 이상의 Stargate 프로젝트를 충돌시킵니다. Mar 08, 2025 am 11:15 AM

OpenAi, SoftBank, Oracle 및 Nvidia와 같은 기술 거인이 지원하고 미국 정부의 지원을받는 5 천억 달러 규모의 Stargate AI 프로젝트는 미국 AI 리더십을 굳히는 것을 목표로합니다. 이 야심 찬 사업은 AI Advanceme의 미래를 약속합니다.

Sora vs Veo 2 : 어느 것이 더 현실적인 비디오를 만드는가? Mar 10, 2025 pm 12:22 PM

Google의 Veo 2와 Openai의 Sora : 어떤 AI 비디오 생성기가 최고를 통치합니까? 두 플랫폼 모두 인상적인 AI 비디오를 생성하지만 강점은 다른 영역에 있습니다. 다양한 프롬프트를 사용하는이 비교는 어떤 도구가 귀하의 요구에 가장 적합한지를 보여줍니다. 티