AI 칩은 전 세계적으로 품절되었습니다!
구글 CEO는 AI 혁명을 인류가 불을 사용하는 것에 비유했지만, 이제 산업의 원동력이 되는 디지털 불, 즉 AI 칩은 찾아보기 어렵습니다.
AI 운영을 주도하는 차세대 고급 칩은 거의 모두 NVIDIA에서 제조됩니다. ChatGPT가 폭발적으로 증가함에 따라 NVIDIA 그래픽 처리 칩(GPU)에 대한 시장 수요가 공급을 훨씬 초과합니다.
기업이 챗봇과 같은 AI 모델을 구축하도록 돕는 스타트업 Lamini의 공동 창립자이자 CEO인 Sharon Zhou는 다음과 같이 말했습니다.
"부족하기 때문에 모든 것은 당신의 친구들에 관한 것입니다."
"팬데믹 기간 동안 휴지처럼."
세계에서 가장 인맥이 좋은 기술 기업가들조차 공급 확보를 위해 열심히 노력하고 있습니다. 5월 16일 AI 의회 청문회에서 OpenAI CEO 샘 알트만(Sam Altman)은 컴퓨팅 성능 병목 현상으로 인해 ChatGPT를 사용하는 사람이 적어지면 더 좋을 것이라고 말했습니다.
5월 23일 Tesla CEO Musk는 Wall Street Journal CEO Council Summit에서 다음과 같이 말했습니다.
"그러나 머스크는 여전히 훨씬 좋습니다.현재 GPU는 약보다 구하기 어렵습니다. "
올해 초 오라클의 컴퓨팅 성능을 찾고 있다고 밝힌 스타트업은 갑자기 구매자가 오라클의 예비 서버 공간을 많이 확보했다는 소식을 들었다고 월스트리트 저널이 보도했습니다. 이 문제에 정통한 소식통에 따르면 이들 신생 스타트업의 구매자는 OpenAI의 시장 지위에 도전하기 위해 X.AI라는 경쟁 제품을 개발 중인 머스크인 것으로 알려졌습니다.
고급 그래픽 처리 칩이 없으면 인공지능에서 대규모 언어 모델의 실행 속도가 크게 저하됩니다. 이는 스타트업 창업자들의 공통된 견해입니다. NVIDIA의 고급 그래픽 처리 칩은 AI 작동에 매우 중요한 뛰어난 병렬 컴퓨팅 기능을 갖추고 있습니다.
UBS 분석가들은 ChatGPT의 초기 버전에 약 10,000개의 NVIDIA 그래픽 처리 칩이 필요할 것으로 추정하고 있으며, Musk는 업데이트된 버전에 필요한 고급 프로세서 수가 이보다 3~5배 더 많을 것으로 추정합니다.
Nvidia는 최근 회사가 증가하는 수요를 충족하기 위해 공급을 확대하고 있다고 밝혔습니다.
Nvidia CEO Jensen Huang은 일요일에 회사가 생성 인공 지능(AI)을 위한 새로운 플래그십 칩 H100의 생산량을 늘렸다고 말했습니다.
AI 스타트업과 투자자들은 칩 부족 문제를 해결하기 위해 최선을 다하고 있습니다. 일부 투자자는 여분의 컴퓨팅 성능을 위해 컴퓨팅 네트워크를 샅샅이 뒤지고 있는 반면, 다른 투자자는 다른 AI 스타트업과 공유하기 위해 고용량 프로세서 및 서버에 대한 주문을 준비하고 있습니다.일부 스타트업은 효율성을 높이기 위해 AI 모델을 축소하고 있으며, 다른 창업자는 Amazon 및 Microsoft의 영업사원과의 관계를 개방하려고 합니다.
Lamini의 Sharon Zhou는 필요한 칩을 가지고 있다고 말했습니다.. Lamini는 그와 전 NVIDIA 엔지니어가 공동 창립했습니다. 그러나 그녀와 다른 많은 창업자들은 어떻게 칩을 얻었는지 밝히기를 거부했습니다.
많은 AI 창업자들은 AI 칩 부족 현상이 적어도 내년까지는 계속될 것으로 예상하고 있습니다.
설립자와 투자자들은AI 칩을 위한 설립된 회사가 있더라도 이를 사용하려면 몇 주를 기다려야 한다고 말합니다. AI 스타트업의 CEO는 이렇게 말했습니다.
“선불을 했다고 해서 다음 날이나 다음 주에 GPU가 배송된다는 의미는 아니며, 기다리기만 하면 됩니다.”세계 최대 서버 제조업체 중 하나인 Supermicro의 CEO는 회사의 그래픽 칩 시스템 잔고가 사상 최고치에 도달했으며 회사가 생산 능력을 늘리기 위해 서두르고 있다고 말했습니다.
2차 시장이 호황을 누리고 있고 NVIDIA도 미쳐가고 있습니다
품절 상황으로 인해 AI 칩의 2차 시장이 촉발되었으며, 그 중 일부에는 대규모 암호화 회사가 참여했습니다이 회사들은 통화 호황기에 채굴용 칩을 구입했지만 이제는 더 이상 칩이 필요하지 않습니다. 디지털 화폐 시장의 침체.
Nvidia 제품에 대한 수요로 인해 올해 회사의 주가가 약 167% 상승했습니다.AI 칩 가격은 다양합니다. 일부 소매점에서는 Nvidia의 고급 AI 칩을 약 33,000달러에 판매하고 있지만 높은 수요로 인해 2차 시장에서 더 높은 가격에 판매될 수도 있습니다. 인공 지능 연구 회사인 General Intelligent의 CEO인 Kanjun Qiu는 현재의 부족 상황을 극복하기 위해 작년부터 서버용 고급 그래픽 칩을 구입해 왔습니다.
최근 한 벤처 투자가가 그녀에게 다른 스타트업에 임대할 수 있는 초과 용량이 있는지 묻는 메시지를 보냈습니다. Qiu는 아직 칩을 포기할지 여부를 결정하지 않았습니다.
위 내용은 AI 칩은 전 세계적으로 품절되었습니다!의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











11월 14일 뉴스에 따르면, 엔비디아는 현지 시간 13일 오전 '슈퍼컴퓨팅23' 컨퍼런스에서 새로운 H200 GPU를 공식 출시했으며, 그 중 H200은 여전히 기존 호퍼 H100 아키텍처를 기반으로 구축됐다. 하지만 인공지능 개발 및 구현에 필요한 대용량 데이터 세트를 더 잘 처리하기 위해 더 많은 고대역폭 메모리(HBM3e)가 추가되어 대규모 모델 실행의 전반적인 성능이 이전 세대 H100에 비해 60%~90% 향상되었습니다. . 업데이트된 GH200은 또한 차세대 AI 슈퍼컴퓨터를 구동할 것입니다. 2024년에는 200엑사플롭 이상의 AI 컴퓨팅 성능이 온라인에 구현될 것입니다. H200

19일 대만 언론 보도에 따르면 구글(Google)은 최신 서버 지향 AI 칩 개발을 위해 미디어텍에 협력을 요청했으며, 이를 TSMC의 파운드리용 5나노 공정에 넘겨줄 계획이다. 내년 초 양산한다. 보고서에 따르면 소식통에 따르면 Google과 MediaTek 간의 이번 협력은 MediaTek에 SerDes(직렬 변환기 및 역직렬 변환기) 솔루션을 제공하고 Google이 자체 개발한 TPU(텐서 프로세서)를 통합하여 Google이 최신 서버 AI 칩을 만드는 데 도움이 될 것이라고 밝혔습니다. CPU나 GPU 아키텍처보다 업계에서는 구글이 현재 제공하는 서비스 중 상당수가 AI와 관련이 있다고 지적한다. 수년 전부터 딥러닝 기술에 투자한 결과 GPU를 사용해 AI 계산을 수행하는 데 비용이 많이 든다는 사실을 알게 된 구글은 이런 결정을 내렸다.

세계에서 가장 강력한 AI 칩으로 알려진 엔비디아 H200 출시 이후 업계는 더욱 강력해진 엔비디아의 B100 칩에 기대를 걸기 시작했다. 동시에 올해 가장 인기 있는 AI 스타트업 기업인 오픈AI(OpenAI)도 본격화됐다. 더욱 강력하고 복잡한 GPT-5 모델을 개발합니다. Guotai Junan은 최신 연구 보고서에서 무한한 성능을 갖춘 B100과 GPT5가 2024년에 출시될 예정이며, 주요 업그레이드를 통해 전례 없는 생산성을 발휘할 수 있다고 지적했습니다. 기관은 AI가 급속한 발전의 시기에 진입할 것이며 그 가시성은 2024년까지 지속될 것이라고 낙관한다고 밝혔습니다. 이전 세대 제품과 비교했을 때 B100과 GPT-5는 얼마나 강력합니까? Nvidia와 OpenAI는 이미 미리보기를 제공했습니다. B100은 H100보다 4배 이상 빠를 수 있으며 GPT-5는 Super를 달성할 수 있습니다.

KL730의 에너지 효율성 향상으로 인공 지능 모델 구현의 가장 큰 병목 현상인 에너지 비용이 해결되었습니다. 업계 및 이전 Nerner 칩과 비교하여 KL730 칩은 가장 진보된 기능을 지원합니다. nanoGPT와 같은 경량 GPT 대규모 언어 모델을 개발하고 초당 0.35~4테라의 유효 컴퓨팅 성능을 제공합니다. AI 회사 Kneron은 오늘 자동차 등급 NPU와 이미지 신호 처리(ISP)를 통합한 KL730 칩을 출시했다고 발표했습니다. 안전한 저에너지 AI를 구현하기 위해 엣지 서버, 스마트 홈, 자동차 보조 운전 시스템 등 다양한 애플리케이션 시나리오에서 기능이 강화됩니다. 샌디에이고에 본사를 둔 Kneron은 획기적인 신경 처리 장치(NPU)로 유명하며 최신 칩인 KL730은 다음과 같은 목표를 달성합니다.

전 세계가 여전히 NVIDIA H100 칩에 집착하고 AI 컴퓨팅 성능에 대한 증가하는 수요를 충족하기 위해 미친 듯이 구매하고 있는 동안, 월요일 현지 시간에 NVIDIA는 다른 AI 모델과 비교하여 훈련하는 데 사용되는 최신 AI 칩 H200을 조용히 출시했습니다. 이전 세대 제품인 H100, H200의 성능은 약 60~90% 향상됐다. H200은 Nvidia H100의 업그레이드 버전이며 H100과 같은 Hopper 아키텍처를 기반으로 합니다. 주요 업그레이드에는 141GB의 HBM3e 비디오 메모리가 포함되며 비디오 메모리 대역폭은 H100의 3.35TB/s에서 4.8로 증가했습니다. TB/초 Nvidia 공식 웹사이트에 따르면 H200은 HBM3e 메모리를 사용하는 회사 최초의 칩이기도 합니다. 이 메모리는 더 빠르고 용량이 크기 때문에 대규모 언어에 더 적합합니다.

(Global TMT 2023년 8월 16일) 샌디에이고에 본사를 두고 획기적인 신경 처리 장치(NPU)로 유명한 AI 회사 Kneron이 KL730 칩 출시를 발표했습니다. 이 칩은 자동차 등급 NPU와 이미지 신호 처리(ISP)를 통합하고 엣지 서버, 스마트 홈 및 자동차 보조 운전 시스템과 같은 다양한 애플리케이션 시나리오에 안전한 저에너지 AI 기능을 제공합니다. 에너지 효율성 측면에서 획기적인 것으로, 이전 Nerner 칩과 비교하여 에너지 효율성이 3~4배 증가했으며 주요 산업의 유사한 제품보다 150%~200% 더 높습니다. 이 칩은 초당 0.35-4테라의 유효 컴퓨팅 성능을 갖추고 있으며 가장 진보된 경량 GPT 대형을 지원할 수 있습니다.

Dimensity 9300은 최근 주력 휴대폰 칩 분야에서 경쟁사를 성공적으로 제치고 선두 자리를 차지했습니다. 출하량이 많은 서브 플래그십 시장에서 미디어텍이 차세대 서브 플래그십 칩인 Dimensity 8300을 공식 출시했다. 차세대 칩은 성능, 에너지 효율성 및 생성 AI 측면에서 크게 개선되어 플래그십 수준의 경험을 달성했습니다. 이번 행사에서 MediaTek 무선 통신 사업부 차장인 Dr. Li Yanji는 "Dimensity 8300은 에너지 효율이 매우 높은 엔드사이드 AI 기능을 갖추고 있으며 플래그십 수준의 스토리지를 지원하며 탁월한 게임, 이미징 및 멀티미디어 엔터테인먼트를 제공합니다"라고 말했습니다. 포괄적인 플랫폼 혁신을 통한 경험은 고급 스마트폰 시장에 더 많은 새로운 기회를 열어줄 것입니다.”

구글 CEO는 AI 혁명을 인류가 불을 사용하는 것에 비유했지만, 이제 업계에 활력을 불어넣는 디지털 불, 즉 AI 칩은 나오기 힘들다. AI 운영을 주도하는 차세대 고급 칩은 거의 모두 NVIDIA에서 제조됩니다. ChatGPT가 폭발적으로 증가함에 따라 NVIDIA 그래픽 처리 칩(GPU)에 대한 시장 수요가 공급을 훨씬 초과합니다. 기업이 챗봇과 같은 AI 모델을 구축하도록 돕는 스타트업 라미니(Lamini)의 공동 창업자이자 CEO인 샤론 저우(Sharon Zhou)는 "부족하기 때문에 핵심은 친구 집단입니다"라고 말했습니다. "전염병 기간 동안 화장지와 같습니다." 이런 상황은 Amazon, Microsoft 등의 클라우드 서비스 제공업체가 ChatGPT를 창시한 OpenAI와 같은 고객에게 제공할 수 있는 컴퓨팅 성능을 제한했습니다.
