Alibaba Cloud는 오늘 파라메트릭 모델과 대화 모델을 포함하는 Qwen-14B라는 오픈 소스 프로젝트를 발표했습니다. 이 오픈 소스 프로젝트는 무료 상업적 사용을 허용합니다
이 사이트에는 다음과 같이 명시되어 있습니다. Alibaba Cloud는 이전에 70억 상당의 매개변수 모델 Qwen-7B를 오픈 소스했으며, 한 달여 만에 다운로드량이 100만 회를 초과했습니다
Alibaba Cloud에서 제공한 데이터에 따르면 Qwen-14B는 여러 권위 있는 평가에서 동일한 크기의 모델을 능가하며 일부 지표는 Llama2-70B에 가깝습니다.
보고서에 따르면 Qwen-14B는 여러 언어를 지원하는 고성능 오픈 소스 모델입니다. 전체 훈련 데이터는 3조 토큰을 초과하고 더 강력한 추론, 인지, 계획 및 기억 기능을 갖추고 있으며 최대 8k의 컨텍스트 창 길이를 지원합니다
반면, Qwen-14B-Chat은 기본 모델을 기반으로 합니다. 대화 모델은 다음을 통해 획득됩니다. 세련된 SFT는 인간의 선호도에 더욱 부합하는 보다 정확한 콘텐츠를 제공할 수 있으며, 콘텐츠 제작의 상상력과 풍부함을 확장합니다.
오늘부터 사용자는 Alibaba Moda 커뮤니티에서 직접 모델을 다운로드하거나 Alibaba Cloud Lingji 플랫폼을 통해 Qwen-14B 및 Qwen-14B-Chat에 액세스하여 통화할 수 있습니다.
Alibaba Cloud CTO Zhou Jingren은 Alibaba Cloud가 계속해서 오픈 소스와 개방성을 수용하고 중국의 대형 모델 생태계 구축을 촉진할 것이라고 말했습니다. Alibaba Cloud는 오픈 소스의 힘을 굳게 믿고 있으며, 오픈 소스 자체 개발 대형 모델 분야에서 선두를 달리고 있으며, 대형 모델 기술을 중소기업과 개인 개발자에게 더 빨리 제공하기를 희망하고 있습니다.
https://modelscope.cn/stud/qwen/Qwen-14B-Chat-Demo
python 버전 3.8 이상
pytorch 버전 1.12 이상, 버전 2.0 이상 권장
CUDA 11.4 이상 사용을 권장합니다(GPU 사용자는 이 옵션을 고려해야 합니다)
참고: 다음 환경 구성에서 실행하세요. PAI-DSW(단일 카드를 사용하여 실행할 수 있으며 최소 비디오 메모리 요구 사항은 11G입니다.)
Qwen-14B-Chat 모델 링크:
https://modelscope.cn/models/qwen/Qwen -14B-Chat
Qwen-14B 모델 링크:
https://modelscope.cn/models/qwen/Qwen-14B
Qwen-14B-Chat-Int4 모델 링크 :
https://www .modelscope.cn/models/qwen/Qwen-14B-Chat-Int4
커뮤니티는 모델 저장소의 직접 다운로드를 지원합니다:
from modelscope.hub.snapshot_download import snapshot_download
<br>
model_dir = snapshot_download('qwen/Qwen-14B-Chat', 'v1.0.0')
광고 문구: 외부 점프 기사에 포함된 링크(하이퍼링크를 포함하되 이에 국한되지 않음), QR 코드, 비밀번호 등은 더 많은 정보를 전달하고 선택 시간을 절약하는 데 사용됩니다. 이 사이트의 모든 기사에는 이 내용이 포함되어 있습니다.
위 내용은 Alibaba Cloud는 Tongyi Qianwen의 140억 매개변수 모델 Qwen-14B와 해당 대화 모델을 무료로 상업적으로 사용할 수 있도록 오픈 소스화할 것이라고 발표했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!