Tencent, 컴퓨팅 전력 비용을 50% 절감하는 최신 대형 모델 학습 방법 공개
컴퓨팅 파워가 부족한 상황에서 어떻게 하면 대규모 모델 훈련과 추론의 효율성을 높이고 비용을 절감할 수 있을지가 업계의 초점이 되었습니다.
11월 23일, Tencent는 Tencent의 Hunyuan 대형 모델을 뒷받침하는 자체 개발 기계 학습 프레임워크인 Angel이 다시 업그레이드되었다고 공개했습니다. 대형 모델 훈련 효율성이 주류 오픈 소스 프레임워크보다 2.6배 증가했습니다. 수천억 개의 대규모 모델 교육을 통해 컴퓨팅 성능 비용을 50% 절감할 수 있습니다. 업그레이드된 Angel은 단일 작업으로 10,000ka 수준의 초대형 훈련을 지원하여 Tencent Cloud의 HCC 대형 모델 전용 컴퓨팅 클러스터의 성능과 효율성을 더욱 향상시킵니다.
동시에 Angel은 모델 개발부터 애플리케이션 구현까지 원스톱 플랫폼을 제공하여 사용자가 API 인터페이스 또는 미세 조정을 통해 Tencent Hunyuan 대형 모델 기능을 신속하게 호출할 수 있도록 지원하고 대형 모델 애플리케이션 구축을 가속화합니다. Tencent 컨퍼런스, Tencent News 및 Tencent Video를 포함한 300개 이상의 Tencent 제품 및 시나리오가 Tencent Hunyuan 내부 테스트에 연결되었습니다.
현재 Tencent Cloud를 통해 관련 기능이 외부 세계에 공개되었습니다. 업그레이드된 Angel 기계 학습 프레임워크를 기반으로 Tencent Cloud TI 플랫폼은 더 나은 교육 및 추론 가속화 기능을 제공하고 고객이 원스톱 교육 및 미세 조정을 위해 자체 데이터를 사용하도록 지원하며 Tencent의 Hunyuan 대규모 기반을 기반으로 독점적인 지능형 애플리케이션을 만들 수 있습니다. 모델.
자체 개발한 머신러닝 프레임워크가 업그레이드되어 대형 모델 학습 및 추론의 효율성이 더욱 향상되었습니다.
대형 모델 시대가 도래하면서 모델 매개변수가 기하급수적으로 증가하여 조 수준. 대형 모델은 단일 양식 및 작업 지원에서 여러 양식의 여러 작업 지원으로 점차 발전합니다. 이러한 추세에 따라 대규모 모델 훈련에는 단일 칩의 처리 속도를 훨씬 초과하는 엄청난 컴퓨팅 성능이 필요하며 다중 카드 분산 훈련의 통신 손실도 엄청납니다. 하드웨어 자원의 활용률을 어떻게 향상시킬 것인가는 국내 대형모델 기술의 개발과 실용화를 위한 중요한 전제조건이 되었다.
대형 모델을 훈련하기 위해 Tencent는 사전 훈련, 모델 미세 조정 및 강화 학습의 전체 프로세스를 가속화하고 최적화하는 AngelPTM이라는 기계 학습 훈련 프레임워크를 개발했습니다. AngelPTM은 최신 FP8 혼합 정밀 훈련 기술을 채택하고, 깊이 최적화된 4D 병렬성과 ZeROCache 메커니즘을 결합하여 다양한 국내 하드웨어와 호환되며 더 적은 리소스와 더 빠른 속도로 훈련할 수 있습니다
In. 2023년 4월 Tencent Cloud는 이전 세대에 비해 성능이 3배 향상된 대형 모델용 차세대 HCC 고성능 컴퓨팅 클러스터를 출시했습니다. 하드웨어 업그레이드 외에도 HCC는 네트워크 프로토콜, 통신 전략, AI 프레임워크 및 모델 컴파일에 대한 시스템 수준 최적화를 수행하여 교육, 조정 및 컴퓨팅 전력 비용을 크게 줄였습니다. AngelPTM은 이전에 HCC를 통해 서비스를 제공한 적이 있습니다. 이번 업그레이드로 HCC의 대형 모델 전용 컴퓨팅 클러스터 성능이 더욱 향상되어 기업이 대형 모델의 실제 적용을 가속화할 수 있습니다.
모델 매개변수 훈련 과제 증가와 추론 비용 상승 문제를 해결하기 위해 Tencent가 자체 개발한 대형 모델 추론 프레임워크인 AngelHCF는 병렬 기능을 확장하고 다중 주의 최적화 전략을 채택하여 성능을 향상했습니다. 동시에 프레임워크는 처리량을 향상시키기 위해 다양한 압축 알고리즘에 적용되어 더 빠른 추론 성능과 더 낮은 비용을 달성하고 대규모 모델 추론 서비스를 지원합니다
업계의 주류 프레임워크와 비교하여 AngelHCF의 추론 속도 1.3배 향상되었습니다. Tencent의 Hunyuan 대형 모델 Wenshengtu를 적용하면 추론 시간이 원래 10초에서 3~4초로 단축되었습니다. 또한 AngelHCF는 다양하고 유연한 대형 모델 압축 및 양자화 전략을 지원하고 자동 압축을 지원합니다
원스톱 애플리케이션 구축을 지원하여 대형 모델을 "즉시" 사용할 수 있습니다
실용적으로- 수준의 대형 모델, Tencent Hybrid Yuanta 모델은 연구 개발 초기부터 응용 시나리오를 지향해 왔으며, 실제로 대형 모델을 구현하는 데 따르는 어려움을 해결했습니다. Tencent는 다양한 유형의 제품과 애플리케이션, 그리고 엄청난 양의 트래픽을 보유하고 있으므로 모델을 실제로 "사용"하는 것은 매우 어렵습니다. Tencent는 Angel을 기반으로 데이터 처리, 미세 조정, 모델 평가, 원클릭 배포, 프롬프트 단어 최적화 등의 서비스를 포함하여 대규모 모델 액세스 및 애플리케이션 개발을 위한 원스톱 플랫폼을 구축하여 대규모 모델을 사용할 수 있도록 했습니다. "즉시 사용 가능"이 가능해졌습니다.
모델 액세스 측면에서 Tencent Hunyuan Large Model은 1000억, 100억, 10억 이상의 크기를 갖춘 모델을 제공하여 다양한 응용 시나리오의 요구 사항에 완벽하게 적응합니다. 간단한 미세 조정을 통해 비즈니스 요구 사항을 충족하고 모델 교육 및 추론 서비스에 대한 리소스 비용을 줄일 수 있습니다. Q&A 및 콘텐츠 분류와 같은 일반적인 애플리케이션 시나리오에서는 비용 효율성이 더 높습니다
애플리케이션 개발 수준에서 Tencent 내의 300개 이상의 비즈니스 및 애플리케이션 시나리오가 내부 테스트를 위해 Tencent Hunyuan 대형 모델에 연결되었습니다. 지난달과 비교하면 텍스트 요약, 초록, 창작, 번역, 코딩 등 다양한 분야를 포함해 그 수가 두 배로 늘었습니다.
2023년 9월, Tencent가 독자적으로 개발한 실용적인 대형 모델인 Tencent Hunyuan이 Tencent Cloud를 통해 공식 공개 및 오픈되었습니다. Tencent Hunyuan의 매개변수 규모는 1,000억 개가 넘고, 사전 학습 코퍼스에는 2조 개 이상의 토큰이 포함되어 있습니다. Tencent의 독립적인 기술 축적을 사전 학습 알고리즘, 머신 러닝 플랫폼 및 기본 컴퓨팅 리소스에 통합하고 애플리케이션에서 지속적으로 반복하여 대규모 모델 기능을 지속적으로 최적화합니다. 현재 소매, 교육, 금융, 의료, 미디어, 운송, 정부 업무 등 다양한 산업 분야의 고객이 Tencent Cloud
를 통해 Tencent Hunyuan 대규모 모델에 액세스했습니다.위 내용은 Tencent, 컴퓨팅 전력 비용을 50% 절감하는 최신 대형 모델 학습 방법 공개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

5월 30일, Tencent는 Hunyuan 모델의 포괄적인 업그레이드를 발표했습니다. Hunyuan 모델을 기반으로 하는 앱 "Tencent Yuanbao"가 공식 출시되었으며 Apple 및 Android 앱 스토어에서 다운로드할 수 있습니다. 이전 테스트 단계의 Hunyuan 애플릿 버전과 비교하여 Tencent Yuanbao는 일상 생활 시나리오를 위한 작업 효율성 시나리오를 위한 AI 검색, AI 요약 및 AI 작성과 같은 핵심 기능을 제공하며 Yuanbao의 게임 플레이도 더욱 풍부해지고 다양한 기능을 제공합니다. , 개인 에이전트 생성과 같은 새로운 게임 플레이 방법이 추가됩니다. Tencent Cloud 부사장이자 Tencent Hunyuan 대형 모델 책임자인 Liu Yuhong은 "Tencent는 먼저 대형 모델을 만들기 위해 노력하지 않을 것입니다."라고 말했습니다. Tencent Hunyuan 대형 모델 비즈니스 시나리오에서 풍부하고 방대한 폴란드 기술을 활용하면서 사용자의 실제 요구 사항에 대한 통찰력을 얻습니다.

Volcano Engine의 Tan Dai 사장은 대형 모델을 구현하려는 기업은 모델 효율성, 추론 비용, 구현 어려움이라는 세 가지 주요 과제에 직면하게 된다고 말했습니다. 복잡한 문제를 해결하기 위한 지원으로 좋은 기본 대형 모델이 있어야 하며, 서비스를 통해 대규모 모델을 널리 사용할 수 있으며 기업이 시나리오를 구현하는 데 더 많은 도구, 플랫폼 및 애플리케이션이 필요합니다. ——Tan Dai, Huoshan Engine 01 사장. 대형 빈백 모델이 출시되어 많이 사용되고 있습니다. 모델 효과를 연마하는 것은 AI 구현에 있어 가장 중요한 과제입니다. Tan Dai는 좋은 모델은 많은 양의 사용을 통해서만 연마될 수 있다고 지적했습니다. 현재 Doubao 모델은 매일 1,200억 개의 텍스트 토큰을 처리하고 3,000만 개의 이미지를 생성합니다. 기업이 대규모 모델 시나리오를 구현하는 데 도움을 주기 위해 ByteDance가 독자적으로 개발한 beanbao 대규모 모델이 화산을 통해 출시됩니다.

기계 학습 및 데이터 과학 분야에서 모델 해석 가능성은 항상 연구자와 실무자의 초점이었습니다. 딥러닝, 앙상블 방법 등 복잡한 모델이 널리 적용되면서 모델의 의사결정 과정을 이해하는 것이 특히 중요해졌습니다. explainable AI|XAI는 모델의 투명성을 높여 머신러닝 모델에 대한 신뢰와 확신을 구축하는 데 도움이 됩니다. 모델 투명성을 향상시키는 것은 여러 복잡한 모델의 광범위한 사용은 물론 모델을 설명하는 데 사용되는 의사 결정 프로세스와 같은 방법을 통해 달성할 수 있습니다. 이러한 방법에는 기능 중요도 분석, 모델 예측 간격 추정, 로컬 해석 가능성 알고리즘 등이 포함됩니다. 특성 중요도 분석은 모델이 입력 특성에 미치는 영향 정도를 평가하여 모델의 의사결정 과정을 설명할 수 있습니다. 모델 예측 구간 추정

C++의 기계 학습 알고리즘이 직면하는 일반적인 과제에는 메모리 관리, 멀티스레딩, 성능 최적화 및 유지 관리 가능성이 포함됩니다. 솔루션에는 스마트 포인터, 최신 스레딩 라이브러리, SIMD 지침 및 타사 라이브러리 사용은 물론 코딩 스타일 지침 준수 및 자동화 도구 사용이 포함됩니다. 실제 사례에서는 Eigen 라이브러리를 사용하여 선형 회귀 알고리즘을 구현하고 메모리를 효과적으로 관리하며 고성능 행렬 연산을 사용하는 방법을 보여줍니다.

1. 배경 소개 먼저 Yunwen Technology의 발전 역사를 소개하겠습니다. Yunwen Technology Company...2023년은 대형 모델이 유행하는 시기입니다. 많은 기업에서는 대형 모델 이후 그래프의 중요성이 크게 감소했으며 이전에 연구된 사전 설정 정보 시스템이 더 이상 중요하지 않다고 생각합니다. 그러나 RAG의 홍보와 데이터 거버넌스의 확산으로 우리는 보다 효율적인 데이터 거버넌스와 고품질 데이터가 민영화된 대형 모델의 효율성을 향상시키는 중요한 전제 조건이라는 것을 알게 되었습니다. 따라서 점점 더 많은 기업이 주목하기 시작했습니다. 지식 구축 관련 콘텐츠에 이는 또한 탐구할 수 있는 많은 기술과 방법이 있는 더 높은 수준으로 지식의 구성 및 처리를 촉진합니다. 신기술의 출현이 기존 기술을 모두 패배시키는 것이 아니라, 신기술과 기존 기술을 통합할 수도 있음을 알 수 있습니다.

머신 러닝은 명시적으로 프로그래밍하지 않고도 컴퓨터가 데이터로부터 학습하고 능력을 향상시킬 수 있는 능력을 제공하는 인공 지능의 중요한 분야입니다. 머신러닝은 이미지 인식, 자연어 처리, 추천 시스템, 사기 탐지 등 다양한 분야에서 폭넓게 활용되며 우리의 삶의 방식을 변화시키고 있습니다. 기계 학습 분야에는 다양한 방법과 이론이 있으며, 그 중 가장 영향력 있는 5가지 방법을 "기계 학습의 5개 학교"라고 합니다. 5개 주요 학파는 상징학파, 연결주의 학파, 진화학파, 베이지안 학파, 유추학파이다. 1. 상징주의라고도 알려진 상징주의는 논리적 추론과 지식 표현을 위해 상징을 사용하는 것을 강조합니다. 이 사고 학교는 학습이 기존을 통한 역연역 과정이라고 믿습니다.

MetaFAIR는 대규모 기계 학습을 수행할 때 생성되는 데이터 편향을 최적화하기 위한 새로운 연구 프레임워크를 제공하기 위해 Harvard와 협력했습니다. 대규모 언어 모델을 훈련하는 데는 수개월이 걸리고 수백 또는 수천 개의 GPU를 사용하는 것으로 알려져 있습니다. LLaMA270B 모델을 예로 들면, 훈련에는 총 1,720,320 GPU 시간이 필요합니다. 대규모 모델을 교육하면 이러한 워크로드의 규모와 복잡성으로 인해 고유한 체계적 문제가 발생합니다. 최근 많은 기관에서 SOTA 생성 AI 모델을 훈련할 때 훈련 프로세스의 불안정성을 보고했습니다. 이는 일반적으로 손실 급증의 형태로 나타납니다. 예를 들어 Google의 PaLM 모델은 훈련 과정에서 최대 20번의 손실 급증을 경험했습니다. 수치 편향은 이러한 훈련 부정확성의 근본 원인입니다.

번역기 | 검토자: Li Rui | Chonglou 인공 지능(AI) 및 기계 학습(ML) 모델은 오늘날 점점 더 복잡해지고 있으며 이러한 모델에서 생성되는 출력은 이해관계자에게 설명할 수 없는 블랙박스입니다. XAI(Explainable AI)는 이해관계자가 이러한 모델의 작동 방식을 이해할 수 있도록 하고, 이러한 모델이 실제로 의사 결정을 내리는 방식을 이해하도록 하며, AI 시스템의 투명성, 이 문제를 해결하기 위한 신뢰 및 책임을 보장함으로써 이 문제를 해결하는 것을 목표로 합니다. 이 기사에서는 기본 원리를 설명하기 위해 다양한 설명 가능한 인공 지능(XAI) 기술을 살펴봅니다. 설명 가능한 AI가 중요한 몇 가지 이유 신뢰와 투명성: AI 시스템이 널리 수용되고 신뢰되려면 사용자가 의사 결정 방법을 이해해야 합니다.
