Rumah > Peranti teknologi > AI > teks badan

Model Alibaba Cloud Tongyi Qianwen 14B adalah sumber terbuka! Prestasi mengatasi Llama2 dan model lain dengan saiz yang sama

王林
Lepaskan: 2023-09-25 22:25:05
ke hadapan
1001 orang telah melayarinya

Pada 25 September 2021, Alibaba Cloud mengeluarkan projek sumber terbuka Tongyi Qianwen 14 bilion model parameter Qwen-14B dan model perbualannya Qwen-14B-Chat, dan ianya percuma untuk kegunaan komersial. Qwen-14B telah menunjukkan prestasi yang baik dalam pelbagai penilaian berwibawa, mengatasi model saiz yang sama, malah beberapa penunjuk hampir dengan Llama2-70B. Sebelum ini, Alibaba Cloud juga membuka sumber model 7 bilion parameter Qwen-7B Jumlah muat turun melebihi 1 juta dalam masa lebih sebulan, menjadikannya projek popular dalam komuniti sumber terbuka

Qwen-14B ialah model berprestasi tinggi. yang menyokong berbilang bahasa Model sumber terbuka menggunakan lebih banyak data berkualiti tinggi daripada model yang serupa, dan data latihan keseluruhan melebihi 3 trilion Token, menjadikan model itu lebih berkuasa dalam keupayaan penaakulan, kognisi, perancangan dan ingatan. Qwen-14B menyokong panjang tetingkap konteks maksimum 8k. Model Alibaba Cloud Tongyi Qianwen 14B adalah sumber terbuka! Prestasi mengatasi Llama2 dan model lain dengan saiz yang sama

Rajah 1: Qwen-14B telah mengatasi model besar SOTA dengan skala yang sama dalam semua aspek dalam dua belas penilaian berwibawa

Qwen-14B-Chat ialah model perbualan yang diperolehi oleh SFT halus pada model asas. Dengan prestasi hebat model asas, ketepatan kandungan yang dihasilkan oleh Qwen-14B-Chat telah dipertingkatkan dengan ketara, dan ia lebih selaras dengan pilihan manusia Imaginasi dan kekayaan penciptaan kandungan juga telah diperluaskan dengan ketara.

Qwen mempunyai keupayaan panggilan alat yang sangat baik, yang boleh membantu pembangun membina ejen berasaskan Qwen dengan lebih pantas. Pembangun boleh menggunakan arahan mudah untuk mengajar Qwen menggunakan alat yang kompleks, seperti menggunakan alat Jurubahasa Kod untuk melaksanakan kod Python untuk pengiraan matematik yang kompleks, analisis data dan lukisan carta. Di samping itu, Qwen juga boleh membangunkan "pembantu digital lanjutan" dengan keupayaan seperti Soal Jawab berbilang dokumen dan penulisan teks panjang model bahasa besar dengan tahap parameter dalam berpuluh bilion kini menjadi pilihan utama bagi pembangun untuk membangunkan dan mengulangi aplikasi. Qwen-14B telah meningkatkan lagi had atas prestasi model bersaiz kecil dan mencapai keputusan terbaik dalam 12 penilaian berwibawa termasuk MMLU, C-Eval, GSM8K, MATH, GaoKao-Bench, dll., mengatasi SOTA (State-Of) dalam semua penilaian -The-Art) model besar, juga melepasi Llama-2-13B sepenuhnya. Pada masa yang sama, Qwen-7B juga telah dinaik taraf sepenuhnya, dengan penunjuk teras meningkat sehingga 22.5%

Model Alibaba Cloud Tongyi Qianwen 14B adalah sumber terbuka! Prestasi mengatasi Llama2 dan model lain dengan saiz yang sama

Kandungan yang ditulis semula: Gambar 2: Qwen-14B menunjukkan prestasi yang lebih kukuh pada model saiz yang sama

Pengguna boleh memuat turun model terus daripada komuniti Moda, atau mengakses dan menghubungi Qwen-14B dan Qwen-14B-Chat melalui platform Alibaba Cloud Lingji. Alibaba Cloud menyediakan perkhidmatan lengkap kepada pengguna, termasuk latihan model, inferens, penggunaan dan penalaan halus

Pada bulan Ogos, Alibaba Cloud membuka model asas parameter Tongyi Qianwen Qwen-7B, yang telah dilancarkan pada HuggingFace dan Github. senarai trend. Dalam masa lebih sebulan, muat turun terkumpul melebihi 1 juta. Lebih daripada 50 model berdasarkan Qwen telah muncul dalam komuniti sumber terbuka, dan banyak alatan serta rangka kerja yang terkenal dalam komuniti telah menyepadukan Qwen.

Model Alibaba Cloud Tongyi Qianwen 14B adalah sumber terbuka! Prestasi mengatasi Llama2 dan model lain dengan saiz yang samaTongyi Qianwen ialah model berskala besar yang paling mendalam dan digunakan secara meluas di China. Sudah terdapat banyak aplikasi domestik yang disambungkan kepada Tongyi Qianwen, dan pengguna aktif bulanan aplikasi ini telah melebihi 100 juta. Banyak perusahaan kecil dan sederhana, institusi penyelidikan saintifik dan pembangun individu menggunakan Tongyi Qianwen untuk membangunkan model atau produk aplikasi berskala besar yang eksklusif. Contohnya, Taobao, DingTalk dan Future Elf Alibaba, serta institusi penyelidikan saintifik luaran dan perusahaan keusahawanan

Zhejiang University and Higher Education Press membangunkan model menegak pendidikan Zhihai-Sanle berdasarkan Qwen-7B, yang telah digunakan di 12 negara. di seluruh negara Permohonan di semua universiti. Model ini mempunyai fungsi seperti menjawab soalan pintar, penjanaan soalan ujian, navigasi pembelajaran, dan penilaian pengajaran. Model ini telah disediakan pada platform Alibaba Cloud Lingji dan boleh dipanggil dengan hanya satu baris kod. Zhejiang Youlu Robot Technology Co., Ltd. telah menyepadukan Qwen-7B ke dalam robot pembersihan jalannya, membolehkan robot berinteraksi dengan pengguna dalam masa nyata dan memahami keperluan mereka. Ia boleh menganalisis dan membuka arahan peringkat tinggi pengguna, melaksanakan analisis logik dan perancangan tugas, dengan itu menyelesaikan tugas pembersihan

Alibaba Cloud CTO Zhou Jingren berkata bahawa Alibaba Cloud akan terus menyokong dan mempromosikan sumber terbuka dan komited untuk mempromosikan pembinaan ekosistem model besar China . Alibaba Cloud yakin dengan kuasa sumber terbuka dan merupakan yang pertama membuka sumber teknologi model besarnya sendiri, dengan harapan untuk membolehkan lebih banyak perusahaan kecil dan sederhana serta pembangun individu mengakses dan menggunakan teknologi model besar dengan lebih pantas

Alibaba Cloud juga menerajui AI terbesar di China Pembinaan ModelScope, sebuah komuniti sumber terbuka model, menyatukan kuasa seluruh industri untuk bersama-sama mempromosikan pempopularan dan aplikasi teknologi model besar. Dalam dua bulan lalu, bilangan muat turun model dalam komuniti Moda telah melonjak daripada 45 juta kepada 85 juta, peningkatan hampir 100%

Kandungan yang ditulis semula adalah seperti berikut: Lampiran:

Alamat model komuniti Moda:

.
    Apakah pengalaman model komuniti Moda? . 2f5 d8b5bc36f60304a15
  • https ://www.php.cn/link/1662d1307aaa81230b651ecf00d27180
  • Kandungan yang perlu ditulis semula ialah: pautan kertas Qwen:

https://www.php90b9c6d/www.php. 33

https:// www .php.cn/link/0247f3dd84906223785fddb18353bafe-Chat

Atas ialah kandungan terperinci Model Alibaba Cloud Tongyi Qianwen 14B adalah sumber terbuka! Prestasi mengatasi Llama2 dan model lain dengan saiz yang sama. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:jiqizhixin.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan