Tongyi Qianwen は 320 億のパラメータモデルをオープンソース化し、7 つの主要な言語モデルをすべてオープンソースとして実現しました。-AI-php.cn

Tongyi Qianwen は 320 億のパラメータモデルをオープンソース化し、7 つの主要な言語モデルをすべてオープンソースとして実現しました。

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

リリース： 2024-04-08 15:31:27

転載

1148 人が閲覧しました

4 月 7 日、Alibaba Cloud は、オープンソースの 320 億パラメータモデル Qwen1.5-32B がパフォーマンス、効率、メモリ使用量のバランスを最大限に高め、企業や開発者によりコスト効率の高いモデルの選択肢を提供できると Qianwen に通知しました。現在、Notification Qianwen は合計 6 つの大規模な言語モデルをオープンソース化しており、国内外のオープンソースコミュニティでの累計ダウンロード数は 300 万件を超えています。

一般的な質問 Qianwen はこれまでに 5 億、18 億、40 億、70 億、140 億、720 億のパラメータモデルを開発し、すべてバージョン 1.5 にアップグレードされました。その中でもいくつかの小型モデルはデバイス側で簡単に導入でき、720億パラメータモデルは業界トップクラスの性能を持ち、HuggingFaceなどのモデルリストに何度も掲載されています。オープンソースの 320 億パラメータモデルは、パフォーマンス、効率、メモリ使用量の間でより理想的なバランスを実現します。たとえば、14B モデルと比較して、32B はエージェントシナリオにおける機能が強化されており、72B と比較して 32B の推論コストは低くなります。一般問題チームは、32B オープンソースモデルが下流のアプリケーションにより良いソリューションを提供できることを期待しています。

Tongyi Qianwen は 320 億のパラメータモデルをオープンソース化し、7 つの主要な言語モデルをすべてオープンソースとして実現しました。

基本的な機能の点では、Qianwen 320 億パラメータモデルは、MMLU、GSM8K、HumanEval、BBH などの複数のテストで良好なパフォーマンスを示しており、そのパフォーマンスはこれは、Qianwen の 720 億パラメータモデルに近く、300 億レベルのパラメータモデルをはるかに上回っています。

Tongyi Qianwen は 320 億のパラメータモデルをオープンソース化し、7 つの主要な言語モデルをすべてオープンソースとして実現しました。