NVIDIA는 새로운 AI 칩 H200을 출시하여 성능이 90% 향상되었습니다! 중국의 컴퓨팅 파워가 자주적인 돌파를 달성했습니다!
전 세계가 여전히 NVIDIA H100 칩에 집착하고 AI 컴퓨팅 성능에 대한 증가하는 수요를 충족하기 위해 이를 미친 듯이 구매하는 동안, 월요일 현지 시간에 NVIDIA는 대규모 AI 모델 훈련을 위한 최신 AI 칩 H200을 조용히 출시했습니다. 비교. 이전 세대 제품인 H100에 비해 H200의 성능이 약 60~90% 향상되었습니다.
H200은 H100과 같은 Hopper 아키텍처를 기반으로 하는 업그레이드 버전입니다. 주요 업그레이드에는 141GB의 HBM3e 비디오 메모리가 포함됩니다. 비디오 메모리 대역폭은 H100의 3.35TB/s에서 4.8TB/s로 증가했습니다. NVIDIA 공식 웹사이트에 따르면 H200은 HBM3e 메모리를 사용하는 회사 최초의 칩이기도 합니다. 이 메모리는 더 빠르고 용량이 크기 때문에 대규모 언어 모델에 더 적합합니다. NVIDIA는 "HBM3e를 통해 NVIDIA H200은 초당 4.8TB의 141GB 메모리를 제공합니다. 이는 A100에 비해 거의 2배의 용량과 2.4배의 대역폭 을 제공합니다." 공식 사진에 따르면 H200의 대형 모델 Llama 2와 GPT-3.5의 출력 속도는 각각 H100의 1.9배, 1.6배
이며, 고성능 컴퓨팅 HPC에서의 속도는 듀얼 코어의 110배에 달합니다. x86 CPU 시간.H200은 내년 2분기에 출시될 것으로 예상되며 엔비디아는 아직 가격을 발표하지 않았습니다.
그러나 H100 및 기타 AI 칩과 마찬가지로 Nvidia는 H200 칩을 중국 제조업체에 공급하지 않습니다.올해 10월 17일, 미국 상무부는 칩에 대한 새로운 수출 통제 규정
을 발표했습니다. 특히 고성능 AI 칩에 대한 통제가 더욱 엄격해졌습니다. 매우 중요한 새로운 규정 중 하나는 고급 컴퓨팅 칩에 대한 제한된 표준을 조정하고 새로운 "성능 밀도 임계값"을 매개변수로 설정하는 것입니다. 새로운 규정에 따라 NVIDIA China의 '스페셜 에디션' H800 및 A800의 중국 수출이 제한되었습니다.최첨단 AI 칩이 부족하면 단기적으로는 국내 AI 산업 발전에 몇 가지 어려움이 따르겠지만 기회도 있습니다.
첫째, Baidu의 최근 1,600개의 Huawei Ascend 910B 칩 주문과 같은 국내 컴퓨팅 전원 칩을 교체할 수 있는 기회
가 있습니다. 두 번째로, 수요와 공급의 불일치로 인해컴퓨팅 전원 임대 가격 상승이 컴퓨팅 전원 임대에 도움이 될 것입니다. 기업. 휴이나테크놀로지는 엔비디아 A100 칩이 내장된 고성능 컴퓨팅 서버의 컴퓨팅 파워 서비스 요금을 100% 인상한다고 14일 밝혔다. 첨단 공정 생산 능력 부족 문제로 인해 개발이 가속화될 것으로 예상됩니다. 그렇다면 Huawei Shengteng 외에 국내 컴퓨팅 능력을 갖춘 또 누가 배너를 들고 다닐 수 있을까요? 산업 체인과 관련된 회사는 무엇입니까? 간접적으로 이익을 얻을 것으로 예상되는 다른 방향은 무엇입니까? 국내 AI 컴퓨팅 파워 독립통제의 4대 혜택 방향과 대표 기업들이 "AI 컴퓨팅 파워를 독립적으로 관리하는 것이 필수입니다
"라는 특별 주제를 제작했습니다. 도움이 필요한 친구들은 아래 QR 코드를 스캔하거나 WeChat 보조자(hzkyxjyy)를 추가하세요. 무료로 다운로드하거나 친구 서클에서 읽어보세요. 추가가 성공적으로 완료되면 모든 과거 보고서와 향후 각 특별 보고서를 무료로 읽을 수 있습니다.
위 내용은 NVIDIA는 새로운 AI 칩 H200을 출시하여 성능이 90% 향상되었습니다! 중국의 컴퓨팅 파워가 자주적인 돌파를 달성했습니다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











11월 14일 뉴스에 따르면, 엔비디아는 현지 시간 13일 오전 '슈퍼컴퓨팅23' 컨퍼런스에서 새로운 H200 GPU를 공식 출시했으며, 그 중 H200은 여전히 기존 호퍼 H100 아키텍처를 기반으로 구축됐다. 하지만 인공지능 개발 및 구현에 필요한 대용량 데이터 세트를 더 잘 처리하기 위해 더 많은 고대역폭 메모리(HBM3e)가 추가되어 대규모 모델 실행의 전반적인 성능이 이전 세대 H100에 비해 60%~90% 향상되었습니다. . 업데이트된 GH200은 또한 차세대 AI 슈퍼컴퓨터를 구동할 것입니다. 2024년에는 200엑사플롭 이상의 AI 컴퓨팅 성능이 온라인에 구현될 것입니다. H200

19일 대만 언론 보도에 따르면 구글(Google)은 최신 서버 지향 AI 칩 개발을 위해 미디어텍에 협력을 요청했으며, 이를 TSMC의 파운드리용 5나노 공정에 넘겨줄 계획이다. 내년 초 양산한다. 보고서에 따르면 소식통에 따르면 Google과 MediaTek 간의 이번 협력은 MediaTek에 SerDes(직렬 변환기 및 역직렬 변환기) 솔루션을 제공하고 Google이 자체 개발한 TPU(텐서 프로세서)를 통합하여 Google이 최신 서버 AI 칩을 만드는 데 도움이 될 것이라고 밝혔습니다. CPU나 GPU 아키텍처보다 업계에서는 구글이 현재 제공하는 서비스 중 상당수가 AI와 관련이 있다고 지적한다. 수년 전부터 딥러닝 기술에 투자한 결과 GPU를 사용해 AI 계산을 수행하는 데 비용이 많이 든다는 사실을 알게 된 구글은 이런 결정을 내렸다.

세계에서 가장 강력한 AI 칩으로 알려진 엔비디아 H200 출시 이후 업계는 더욱 강력해진 엔비디아의 B100 칩에 기대를 걸기 시작했다. 동시에 올해 가장 인기 있는 AI 스타트업 기업인 오픈AI(OpenAI)도 본격화됐다. 더욱 강력하고 복잡한 GPT-5 모델을 개발합니다. Guotai Junan은 최신 연구 보고서에서 무한한 성능을 갖춘 B100과 GPT5가 2024년에 출시될 예정이며, 주요 업그레이드를 통해 전례 없는 생산성을 발휘할 수 있다고 지적했습니다. 기관은 AI가 급속한 발전의 시기에 진입할 것이며 그 가시성은 2024년까지 지속될 것이라고 낙관한다고 밝혔습니다. 이전 세대 제품과 비교했을 때 B100과 GPT-5는 얼마나 강력합니까? Nvidia와 OpenAI는 이미 미리보기를 제공했습니다. B100은 H100보다 4배 이상 빠를 수 있으며 GPT-5는 Super를 달성할 수 있습니다.

KL730의 에너지 효율성 향상으로 인공 지능 모델 구현의 가장 큰 병목 현상인 에너지 비용이 해결되었습니다. 업계 및 이전 Nerner 칩과 비교하여 KL730 칩은 가장 진보된 기능을 지원합니다. nanoGPT와 같은 경량 GPT 대규모 언어 모델을 개발하고 초당 0.35~4테라의 유효 컴퓨팅 성능을 제공합니다. AI 회사 Kneron은 오늘 자동차 등급 NPU와 이미지 신호 처리(ISP)를 통합한 KL730 칩을 출시했다고 발표했습니다. 안전한 저에너지 AI를 구현하기 위해 엣지 서버, 스마트 홈, 자동차 보조 운전 시스템 등 다양한 애플리케이션 시나리오에서 기능이 강화됩니다. 샌디에이고에 본사를 둔 Kneron은 획기적인 신경 처리 장치(NPU)로 유명하며 최신 칩인 KL730은 다음과 같은 목표를 달성합니다.

전 세계가 여전히 NVIDIA H100 칩에 집착하고 AI 컴퓨팅 성능에 대한 증가하는 수요를 충족하기 위해 미친 듯이 구매하고 있는 동안, 월요일 현지 시간에 NVIDIA는 다른 AI 모델과 비교하여 훈련하는 데 사용되는 최신 AI 칩 H200을 조용히 출시했습니다. 이전 세대 제품인 H100, H200의 성능은 약 60~90% 향상됐다. H200은 Nvidia H100의 업그레이드 버전이며 H100과 같은 Hopper 아키텍처를 기반으로 합니다. 주요 업그레이드에는 141GB의 HBM3e 비디오 메모리가 포함되며 비디오 메모리 대역폭은 H100의 3.35TB/s에서 4.8로 증가했습니다. TB/초 Nvidia 공식 웹사이트에 따르면 H200은 HBM3e 메모리를 사용하는 회사 최초의 칩이기도 합니다. 이 메모리는 더 빠르고 용량이 크기 때문에 대규모 언어에 더 적합합니다.

(Global TMT 2023년 8월 16일) 샌디에이고에 본사를 두고 획기적인 신경 처리 장치(NPU)로 유명한 AI 회사 Kneron이 KL730 칩 출시를 발표했습니다. 이 칩은 자동차 등급 NPU와 이미지 신호 처리(ISP)를 통합하고 엣지 서버, 스마트 홈 및 자동차 보조 운전 시스템과 같은 다양한 애플리케이션 시나리오에 안전한 저에너지 AI 기능을 제공합니다. 에너지 효율성 측면에서 획기적인 것으로, 이전 Nerner 칩과 비교하여 에너지 효율성이 3~4배 증가했으며 주요 산업의 유사한 제품보다 150%~200% 더 높습니다. 이 칩은 초당 0.35-4테라의 유효 컴퓨팅 성능을 갖추고 있으며 가장 진보된 경량 GPT 대형을 지원할 수 있습니다.

구글 CEO는 AI 혁명을 인류가 불을 사용하는 것에 비유했지만, 이제 업계에 활력을 불어넣는 디지털 불, 즉 AI 칩은 나오기 힘들다. AI 운영을 주도하는 차세대 고급 칩은 거의 모두 NVIDIA에서 제조됩니다. ChatGPT가 폭발적으로 증가함에 따라 NVIDIA 그래픽 처리 칩(GPU)에 대한 시장 수요가 공급을 훨씬 초과합니다. 기업이 챗봇과 같은 AI 모델을 구축하도록 돕는 스타트업 라미니(Lamini)의 공동 창업자이자 CEO인 샤론 저우(Sharon Zhou)는 "부족하기 때문에 핵심은 친구 집단입니다"라고 말했습니다. "전염병 기간 동안 화장지와 같습니다." 이런 상황은 Amazon, Microsoft 등의 클라우드 서비스 제공업체가 ChatGPT를 창시한 OpenAI와 같은 고객에게 제공할 수 있는 컴퓨팅 성능을 제한했습니다.

Microsoft는 OpenAIChatGPT 챗봇을 구동하는 것과 같은 생성 AI 모델 교육 비용을 줄이기 위해 AI 최적화 칩을 개발하고 있습니다. The Information은 최근 이 문제에 정통한 두 사람의 말을 인용하여 Microsoft가 적어도 2019년부터 "Athena"라는 새로운 칩셋 코드명을 개발해 왔다고 말했습니다. Microsoft와 OpenAI의 직원들은 이미 새로운 칩에 액세스할 수 있으며 이를 사용하여 GPT-4와 같은 대규모 언어 모델에서의 성능을 테스트하고 있습니다. 대규모 언어 모델을 훈련하려면 AI가 인간 대화를 모방할 수 있는 새로운 출력 콘텐츠를 생성하기 위해 대량의 데이터를 수집하고 분석해야 합니다. 이는 생성 AI 모델의 특징입니다. 수천) A
