Alibaba Cloud는 Tongyi Qianwen의 140억 매개변수 모델 Qwen-14B와 해당 대화 모델을 무료로 상업적으로 사용할 수 있도록 오픈 소스화할 것이라고 발표했습니다.

王林
풀어 주다: 2023-09-26 20:05:01
앞으로
2231명이 탐색했습니다.

Alibaba Cloud는 오늘 파라메트릭 모델과 대화 모델을 포함하는 Qwen-14B라는 오픈 소스 프로젝트를 발표했습니다. 이 오픈 소스 프로젝트는 무료 상업적 사용을 허용합니다

阿里云宣布开源通义千问 140 亿参数模型 Qwen-14B 及其对话模型,免费可商用

이 사이트에는 다음과 같이 명시되어 있습니다. Alibaba Cloud는 이전에 70억 상당의 매개변수 모델 Qwen-7B를 오픈 소스했으며, 한 달여 만에 다운로드량이 100만 회를 초과했습니다

阿里云宣布开源通义千问 140 亿参数模型 Qwen-14B 及其对话模型,免费可商用

Alibaba Cloud에서 제공한 데이터에 따르면 Qwen-14B는 여러 권위 있는 평가에서 동일한 크기의 모델을 능가하며 일부 지표는 Llama2-70B에 가깝습니다.

阿里云宣布开源通义千问 140 亿参数模型 Qwen-14B 及其对话模型,免费可商用

보고서에 따르면 Qwen-14B는 여러 언어를 지원하는 고성능 오픈 소스 모델입니다. 전체 훈련 데이터는 3조 토큰을 초과하고 더 강력한 추론, 인지, 계획 및 기억 기능을 갖추고 있으며 최대 8k의 컨텍스트 창 길이를 지원합니다

반면, Qwen-14B-Chat은 기본 모델을 기반으로 합니다. 대화 모델은 다음을 통해 획득됩니다. 세련된 SFT는 인간의 선호도에 더욱 부합하는 보다 정확한 콘텐츠를 제공할 수 있으며, 콘텐츠 제작의 상상력과 풍부함을 확장합니다.

오늘부터 사용자는 Alibaba Moda 커뮤니티에서 직접 모델을 다운로드하거나 Alibaba Cloud Lingji 플랫폼을 통해 Qwen-14B 및 Qwen-14B-Chat에 액세스하여 통화할 수 있습니다.

Alibaba Cloud CTO Zhou Jingren은 Alibaba Cloud가 계속해서 오픈 소스와 개방성을 수용하고 중국의 대형 모델 생태계 구축을 촉진할 것이라고 말했습니다. Alibaba Cloud는 오픈 소스의 힘을 굳게 믿고 있으며, 오픈 소스 자체 개발 대형 모델 분야에서 선두를 달리고 있으며, 대형 모델 기술을 중소기업과 개인 개발자에게 더 빨리 제공하기를 희망하고 있습니다.

모델 제로코드 생성 공간 체험 주소 :

https://modelscope.cn/stud/qwen/Qwen-14B-Chat-Demo

환경 구성 및 설치

  • python 버전 3.8 이상

  • pytorch 버전 1.12 이상, 버전 2.0 이상 권장

  • CUDA 11.4 이상 사용을 권장합니다(GPU 사용자는 이 옵션을 고려해야 합니다)

사용 단계

참고: 다음 환경 구성에서 실행하세요. PAI-DSW(단일 카드를 사용하여 실행할 수 있으며 최소 비디오 메모리 요구 사항은 11G입니다.)

  • Qwen-14B-Chat 모델 링크:

  • https://modelscope.cn/models/qwen/Qwen -14B-Chat

  • Qwen-14B 모델 링크:

  • https://modelscope.cn/models/qwen/Qwen-14B

  • Qwen-14B-Chat-Int4 모델 링크 :

  • https://www .modelscope.cn/models/qwen/Qwen-14B-Chat-Int4

커뮤니티는 모델 저장소의 직접 다운로드를 지원합니다:

from modelscope.hub.snapshot_download import snapshot_download<br>model_dir = snapshot_download('qwen/Qwen-14B-Chat', 'v1.0.0')

광고 문구: 외부 점프 기사에 포함된 링크(하이퍼링크를 포함하되 이에 국한되지 않음), QR 코드, 비밀번호 등은 더 많은 정보를 전달하고 선택 시간을 절약하는 데 사용됩니다. 이 사이트의 모든 기사에는 이 내용이 포함되어 있습니다.

위 내용은 Alibaba Cloud는 Tongyi Qianwen의 140억 매개변수 모델 Qwen-14B와 해당 대화 모델을 무료로 상업적으로 사용할 수 있도록 오픈 소스화할 것이라고 발표했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:ithome.com
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿