ChatGPT가 최근 몇 달간 뜨거운 화제를 불러일으켰던 이유는 인공지능 콘텐츠 자동 생성 기술의 컴퓨팅 파워에 대한 수요가 증가했기 때문입니다. 한편으로 ChatGPT는 컴퓨팅 성능에 대한 수요 증가를 주도한 반면 ChatGPT는 컴퓨팅 성능 지원에 대한 더 높은 요구 사항을 제시했습니다.
데이터에 따르면 하나의 ChatGPT 모델 훈련에 필요한 총 컴퓨팅 전력 소비량은 3640PF-일로 약 1,200만 달러가 소요되며 작업 중에도 상당한 오버헤드가 필요합니다. Guosheng Securities 보고서에 따르면 1월 ChatGPT의 평균 고유 방문자 수 1,300만 명을 기준으로 해당 칩 수요는 NVIDIA A100 GPU 30,000개 이상, 대략적인 컴퓨팅 전력 비용은 미화 8억 달러, 일일 전력 비용은 8억 달러입니다. 비용은 미화 50,000달러 정도입니다. ChatGPT는 Microsoft로부터 130억 달러의 투자를 받았습니다. 이는 컴퓨팅 성능에 대한 높은 투자를 뒷받침하는 자신감입니다. OpenAI가 독립적인 기업가로서의 거대한 프로젝트를 완료할 수 있었던 것은 바로 자금, 미래 시장, 컴퓨팅 인프라(Azure 클라우드)에 이르기까지 기술 거대 Microsoft의 전폭적인 지원 덕분입니다. 컴퓨팅 전력 요구사항은 매개변수 크기와 밀접한 관련이 있습니다. 매개변수 크기는 현재 대규모 모델 훈련의 품질을 측정하는 데 중요한 참고 자료이기도 합니다. 매개변수 수가 많을수록 모델이 더 똑똑해지고 그에 따른 오버헤드도 커집니다. 이는 GPT 유형의 높은 임계값 특성을 형성합니다. GPT-3의 이전 버전은 오픈 소스였기 때문에 다른 기업가들이 이를 기반으로 새로운 연구 개발 작업을 더 쉽게 수행할 수 있었습니다. GPT-4부터 OpenAI 개방형 API는 바이트 트래픽을 기준으로 요금을 청구합니다. 애플리케이션 개발이든, 이를 기반으로 한 2차 모델 개발이든 문턱이 높다.
더 흥미로운 점은 Meta의 LLaMA 소스코드가 유출되었다는 점입니다. 그 결과 소위 "라마 패밀리"("라마"는 "알파카"로 번역될 수 있음) 대형 모델이 등장했으며 오픈 소스 리소스를 얻으려는 개발자는 GPT-3 외에 새로운 옵션을 얻을 수 있습니다.
컴퓨팅 성능에 대한 "대형 모델"의 높은 의존도는 적어도 두 가지 주요 영향을 미칩니다.
첫째, 이것은 더 이상 "풀뿌리" 창업 게임도 아니고 과거 인터넷 창업의 "중국 복사" 게임도 아니며 자본, 기술, 기업의 전략적 초점. 전통 산업 시대에 중국은 가공 산업에서 시작하여 점차 고부가가치 핵심 기술의 연구 개발로 발전했지만 실제로는 유럽과 미국의 가장 발전된 수준과는 거리가 멀습니다. 특히 재료과학과 같이 장기적인 기술 축적이 필요한 분야에서는 여전히 격차가 크다.
디지털 시대에 중국 업계의 합의는 핵심 기술 연구 개발에서 직접 시작된다는 것입니다.
미국과 중국이 과학기술 분야에서 서로 덜 의존하는 추세가 되었습니다. 지금은 제약을 받고 있는 것은 칩 산업뿐이지만, '빅 모델'이 생산 요소로 발전한다면 우리도 분명 같은 문제에 직면하게 될 것이다. 따라서 중국은 자국만의 '빅모델' 핵심기술을 보유해야 한다. 이러한 불가피성을 보고 중국 기술 기업들도 '빅 모델'에 집중적으로 투자하는 추세가 되었다.
중소 기술 기업이 기본 '빅 모델'을 개발할 능력이 없는 경우 GPT-3 또는 LLaMA의 오픈 소스 모델을 개발 또는 2차 개발에 사용하여 자체 '빅 모델'을 형성할 수 있습니다. 애플리케이션 개발 회사는 네이티브 "대형 모델"을 개발하는 경우가 거의 없습니다. 애플리케이션 판매 시장에 대해 극도로 높은 확신을 갖지 않는 한, 엄청난 컴퓨팅 성능 비용 압박에 굴복하고 대신 기성 모델을 사용하여 관련 애플리케이션을 개발하기 위해 API 사용 비용을 지불하게 됩니다. .
서부 지역은 "그린 파워" 자원이 풍부합니다. "동부 디지털 및 서부 컴퓨팅"의 전체 계획에 따라 서부 지역은 주로 백업 및 저장 작업을 담당합니다. 스마트시티에서는 산업인터넷과 인터넷서비스의 허브가 동부지역에 자리잡고 있다. "빅 모델"은 컴퓨팅 성능에 대한 요구 사항이 높습니다. 동부 IDC는 컴퓨팅 전력 자원을 대규모로 점유하는데, 이는 높은 비용(동부 지역의 높은 전기 요금), 높은 배출(동부 지역의 녹색 전력 비율)이라는 세 가지 주요 단점이 있습니다. 동부는 작음), 대기 시간이 짧은 리소스를 요구하는 애플리케이션을 위한 컴퓨팅 성능을 압박하여 서부의 컴퓨팅 파워 센터에 새로운 비즈니스 기회를 창출합니다.
한편으로는 "대형 모델"의 훈련 계산을 서부 지역의 IDC에 배치하는 것이 지역 통신 네트워크 성능 향상에 대한 요구 사항이 더 높습니다. 대용량 데이터의 처리량은 해결해야 할 문제이지만, 이 문제를 해결하는 데 드는 비용은 IDC 사용료 차이보다 훨씬 적습니다.
한편, 거대 기술 기업들은 자체 ESG(환경적 사회적 책임) 목표를 제시했으며, 탄소 배출량이 가장 중요한 지표입니다. '대형 모델'의 가동과 대규모 컴퓨팅 파워는 많은 양의 탄소 배출을 발생시킬 것이며, '그린 컴퓨팅 파워'에 대한 수요는 더욱 시급해질 것이다.
위 내용은 ChatGPT는 컴퓨팅 성능에 이중 영향을 미칩니다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!