최근 중국 산업정보기술부와 닝샤회족자치구 인민정부가 공동으로 인촨에서 개최된 2023년 중국 컴퓨팅 파워 컨퍼런스를 개최했습니다. 이번 회의에서는 컴퓨팅 파워 분야 전문가와 학자들이 공동으로 선정한 컴퓨팅 파워 중국·연간 획기적인 성과가 발표됐다. 그 중 알리바바 클라우드의 'PAI Lingjun 지능형 컴퓨팅 서비스'가 국내 AI 지능형 대표 기업으로 중요한 영예를 안았다.
컴퓨팅 인프라.이 선정은 컴퓨팅 파워 분야의 핫스팟, 어려움 및 핵심 문제를 해결하기 위해 설정되었습니다. "선구적, 선도적, 권위적, 공정성"을 원칙으로 하며 세계 최고의 수준에 도달한 기본 이론을 발굴하는 것을 목표로 합니다. 컴퓨팅 파워 또는 관련 산업 수준, 혁신적인 방법, 방법 모델 및 플랫폼 응용 프로그램의 혁신적인 결과. 심사위원회는 중국과학원 원사, 중국공정원 원사, 유명 대학 및 과학연구기관 전문가, 중국 컴퓨팅 분야에서 매우 영향력 있는 전문가 및 학자들로 구성됩니다. 전력 관련 분야.
Alibaba Cloud에서 출시한 PAI Lingjun 지능형 컴퓨팅 서비스는 빠르게 증가하는 AI 컴퓨팅 요구 사항을 충족하기 위해 만들어진 컴퓨팅 성능 인프라 서비스입니다. 이 서비스는 기업과 개발자에게 원스톱 AI 개발 전체 프로세스 엔지니어링 플랫폼과 지능형 컴퓨팅 성능을 제공할 수 있습니다. 이는 초대형 병렬 컴퓨팅 규모, 고성능, 고효율 및 높은 활용도의 특성을 가지고 있습니다. 이 서비스의 클러스터 확장성은 100,000개 카드 규모에 도달할 수 있으며, 수조 개의 매개변수가 있는 여러 대형 모델의 동시 교육을 지원할 수 있습니다. 단일 교육 작업은 10,000개 카드 규모에 도달할 수 있으며, 선형 확장 효율성은 킬로카드 규모입니다. 92% 도달
이전 실습 훈련에서 PAI Lingjun 지능형 컴퓨팅 서비스는 Tongyi Qianwen과 같은 대형 모델의 훈련 및 적용에서 대형 모델의 훈련 효율성이 10조 매개변수를 갖는 다중 모드 대형 모델의 저에너지 훈련을 안정적으로 지원했습니다. 거의 10배 향상되었으며, 추론 효율성도 2배 이상 향상되었습니다.
이 선정은 Alibaba Cloud PAI Lingjun 지능형 컴퓨팅 서비스가 "고성능 네트워크, 고성능 파일 저장, 높은 안정성, 최고의 소프트웨어 및 하드웨어 공동 최적화 기능 및 서버리스 서비스 기능을 갖추고 대형 모델 연구, 과학용 AI, AIGC를 위한 것"이라고 믿습니다. 다른 시나리오에서도 확실한 지원을 제공하세요.”
Pailingjun의 지능형 컴퓨팅 서비스는 여러 핵심 기술 분야에서 선도적이고 혁신적입니다. 대규모 모델 훈련에는 수십억 개의 매개변수 처리가 필요하며 이는 단순히 "그래픽 카드를 쌓는 것"만으로는 달성할 수 없을 뿐만 아니라 기본 컴퓨팅 성능, 네트워크, 스토리지, 데이터 컴퓨팅 및 AI 프레임워크와 같은 복잡한 기술을 통합하는 체계적인 엔지니어링이 필요합니다. 절묘한 디자인을 통해 대규모 컴퓨팅 프로젝트의 구현을 실현하는 것 외에도 "빠르고 경제적"을 달성하고 컴퓨팅 성능을 한 방울도 최대한 활용하는 것도 필요합니다
IaaS 인프라 계층에서 Alibaba Cloud는 터미널과 네트워크를 통합하고 소프트웨어와 하드웨어를 통합하여 마이크로초 수준의 안정적인 상호 연결과 칩 간의 효율적인 병렬 처리를 달성하는 예측 가능한 네트워크 기술을 통해 클러스터 컴퓨팅 리소스를 조정하고 최적화하는 지능형 컴퓨팅 클러스터 Lingjun을 구축했습니다. . 계산하다. 관련 기술 혁신으로 AI 컴퓨팅 성능의 확장성 병목 현상이 크게 제거되었습니다. Lingjun 클러스터의 최대 규모는 "100,000개 카드 수준"까지 확장될 수 있으며, 이를 통해 대형 모델의 개발 및 적용을 위한 유연하고 다양한 규모의 지능형 컴퓨팅 성능을 제공할 수 있습니다. , 상위 계층 플랫폼 애플리케이션을 지원하며 편리한 컨테이너화 서비스를 제공합니다.
PaaS 플랫폼 서비스 계층에서 Alibaba Cloud 기계 학습 플랫폼 PAI는 대규모 훈련 작업을 자동으로 분할 및 할당할 수 있으며 하드웨어, 네트워크 및 프레임워크의 통합 협업 스케줄링 기능을 통해 가장 빠른 속도와 최소한의 컴퓨팅 성능으로 고성능 배포를 제공할 수 있습니다. . 훈련 프로그램. 동시에 PAI에는 자동 내결함성 훈련 프레임워크인 AIMaster가 장착되어 있습니다. AIMaster는 종종 몇 주 또는 몇 달이 걸리는 대규모 언어 모델의 훈련 주기 동안 최고의 안정성을 보장하고 수동 개입 비용을 줄이고 작업 시간을 단축할 수 있습니다. 대형 모델의 학습 시간이 10배 증가합니다. 또한 PAI는 간단하고 사용하기 쉬운 RLHF 강화 학습 프레임워크를 제공하여 대규모 언어 모델의 성능을 크게 향상시킬 수 있습니다.
PAI Lingjun 지능형 컴퓨팅 서비스는 또한 중국 최초의 서버리스 지능형 컴퓨팅 서비스 모델을 출시하여 사용자에게 원클릭 활성화, 주문형 할당, 단순화된 운영 및 유지 관리의 사용자 경험을 제공합니다. 이 서비스는 AI 컴퓨팅 리소스의 유연한 재사용을 지원하여 클러스터 활용도를 크게 향상시키고 고객의 사용 비용을 절감할 수 있습니다
Alibaba Cloud PAI Lingjun 지능형 컴퓨팅 서비스는 많은 기업과 과학 연구 기관에서 사용되고 있는 것으로 알려져 있습니다. Alibaba Cloud와 XPeng Motors가 공동으로 구축한 지능형 컴퓨팅 센터 'Fuyao'는 중국 최대의 자율 주행 지능형 컴퓨팅 센터가 되어 Xpeng Automobile의 자율 주행 모델 훈련 속도를 170배 이상 높였습니다. Alibaba Cloud와 Fudan University가 공동으로 구축한 클라우드 기반 지능형 컴퓨팅 플랫폼인 CFFF는 최근 45억 개의 매개변수를 갖춘 대규모 단기 및 중기 일기 예보 모델을 출시하여 예측 속도를 원래 시간 수준에서 3시간 이내로 단축했습니다. 초.
콘텐츠 홍보를 위해 다시 작성하려면 원문을 중국어로 다시 작성해야 하며, 원문이 나올 필요는 없습니다
위 내용은 Alibaba Cloud AI 컴퓨팅, '컴퓨팅 파워 중국' 연례 혁신 공로상 수상의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!