메타 해외에 이어 알리바바는 인공지능(AI) 대형 모델의 '안드로이드 모멘트' 트렌드를 촉진하는 또 하나의 기술 거대 기업으로 거듭났다
Beijing Business Daily의 보도에 따르면 Alibaba Cloud는 8월 3일 목요일에 오픈 소스 일반 질문 및 답변 모델 Qwen-7B와 대화 모델 Qwen-7B-Chat을 출시할 예정입니다. 두 모델 모두 70억 개의 매개변수를 가지고 있습니다. 그들은 중국 최초의 "Model as a Service" 개방형 플랫폼인 Magic Community를 출시했으며 무료로 사용할 수 있으며 상업적인 사용도 허용됩니다
사용자는 오픈 소스 코드를 통해 Qwen-7B 및 Qwen-7B-Chat을 수량화하고 소비자급 그래픽 카드에서 모델을 배포 및 실행할 수 있습니다. Moda 커뮤니티에서 모델을 직접 다운로드하거나 Alibaba Cloud Lingji 플랫폼을 통해 Qwen-7B 및 Qwen-7B-Chat에 액세스하여 호출할 수 있습니다. Alibaba Cloud는 사용자에게 모델 훈련, 추론, 배포 및 미세 조정을 포함한 서비스를 제공합니다
매직타워 커뮤니티에는 Tongyi Qianwen 모델의 설치 방법, 공간 만들기 경험, 모델 추론 및 모델 훈련의 모범 사례를 소개하는 게시물이 있으며, 모델 링크 및 다운로드 상황의 스크린샷도 첨부합니다.
공개 정보에 따르면 Qwen-7B는 2조 2천억 개가 넘는 토큰의 중복 제거 및 필터링된 데이터를 사용하여 사전 훈련된 기본 모델입니다. 중국어, 영어 등 다국어를 지원하며 컨텍스트 창 길이는 8k입니다. 모델에는 고품질 중국어, 영어, 다국어, 코드, 수학 및 기타 데이터가 포함되어 있으며 전체 네트워크 텍스트, 백과사전, 서적, 코드, 수학 및 다양한 분야의 수직 분야를 포괄합니다
MMLU 평가 결과에 따르면 Qwen-7B는 영어 평가에서 좋은 성적을 거두어 다른 유사한 오픈 소스 사전 학습 모델을 능가하고 더 큰 규모의 모델과 경쟁력을 갖췄습니다. 중국 평가에서는 Qwen-7B가 C-Eval 검증 세트에서 가장 높은 점수를 획득했으며 더 큰 규모의 모델에서도 경쟁력을 보였습니다
다음은 Qwen-7B의 MMLU 5발 정확도 결과 비교입니다
Alibaba Cloud는 정렬 메커니즘을 통해 기본 모델을 기반으로 AI 보조 Qwen-7B-Chat을 구축했습니다. 이는 Transformer를 기반으로 한 중국어 및 영어 대화의 대규모 언어 모델로, 인간 인식과의 정렬을 성공적으로 달성했습니다. 이 모델은 다양한 주제를 다루는 온라인 텍스트, 전문 서적, 코드 등 다양한 사전 학습 데이터를 사용합니다
C-Eval 검증 세트와 MMLU 평가 세트 모두에서 Qwen-7B-Chat 모델의 제로샷 정확도는 다른 유사한 정렬 모델을 능가합니다
다음은 C-Eval 테스트 세트의 제로샷 정확도 결과를 비교한 것입니다
알리바바 클라우드는 중국 최초의 대형 기술 기업으로 오픈소스 대형 모델 대열에 합류했으며, 올해 7월 OpenAI와 Google의 모델을 대체할 수 있는 Meta를 탑재한 오픈소스 AI 모델 Llama 2의 상용 버전을 공동 출시했습니다. . 또한 Zhipu AI와 Tsinghua KEG Laboratory는 7월에 중국 최고의 오픈소스 대형 모델도 발표했습니다
오픈 소스 모델의 장점은 사용자 수용도를 높이고 인공 지능 처리를 위한 더 많은 데이터를 제공한다는 것입니다. LLM의 데이터 용량이 클수록 그 기능은 더욱 강력해집니다. 또한 오픈 소스 모델은 연구원과 개발자가 취약점을 발견하고 해결하여 기술 및 보안 수준을 향상시키는 데 도움이 됩니다
2023년 4월 Alibaba Cloud Summit에서 Alibaba는 기업에 Tongyi Qianwen을 개방한다고 발표했습니다. 이를 통해 기업은 Tongyi Qianwen의 기능을 사용하여 자체 대형 모델을 교육할 수 있습니다
Alibaba Cloud Intelligence 그룹 최고 기술 책임자(CTO) Zhou Jingren은 앞으로 기업은 Alibaba Cloud의 Tongyi Qianwen 기능을 최대한 활용하고 자체 산업 지식과 애플리케이션 시나리오를 결합하여 맞춤형 기업 대형 모델을 교육할 수 있다고 말했습니다. 예를 들어, 각 회사는 자체 지능형 고객 서비스, 지능형 쇼핑 가이드, 지능형 음성 도우미, 카피라이팅 도우미, AI 디자이너 및 자율 주행 모델 및 기타 기능을 보유할 수 있습니다
Alibaba 그룹 CEO이자 Alibaba Cloud Intelligence Group CEO인 Zhang Yong은 모든 Alibaba 제품이 Tongyi Qianwen 대형 모델과 통합될 것이라고 말했습니다
Alibaba Cloud는 더 많은 기업이 대형 모델을 사용하여 AI 시대의 요구 사항에 적응할 수 있도록 지원하여 각 기업이 업계 역량을 갖춘 고유한 대형 모델을 보유하고 Tongyi Qianwen을 기반으로 재구성할 수 있기를 바랍니다
위 내용은 국내 대형 AI 모델의 '안드로이드 모멘트'가 도래했다! Alibaba Cloud Tongyi Qianwen은 무료 오픈 소스이며 상업적 용도로 사용 가능합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!