Sebelum Deepseek dapat memudar ke tajuk utama, model AI Cina yang lain telah melangkah. Alibaba gergasi e-dagang Cina telah mengumumkan versi baru model keluarga AI Qwen, dan ada banyak yang disukai-lebih baik daripada Deepseek dan chatgpt dalam beberapa bidang utama.
Qwen Max adalah model AI terkini dan paling kuat dalam keluarga Qwen AI Alibaba. Pada masa ini, model qwen AI berikut boleh didapati:
qwen2.5-plus
- qwen2.5-max
- qwen2.5-vl-72b-instruct-instruct
qwen2.5-14b-instruct-1m -
qvq-72b-preview
qwq-32b-preview -
qwen2.5-coder-32b -Instructi akaun melalui e -mel, Google, atau GitHub. Model AI Qwen juga sumber terbuka, bermakna anda boleh menemui mereka di GitHub atau Huggingface. Anda juga boleh memasangnya secara tempatan pada peranti anda (bergantung kepada spesifikasinya), yang membolehkan anda menjalankan AI di luar talian. MOE) model, menyokong 29 bahasa, dan dilatih lebih dari 20 trilion token. Ia juga boleh mengendalikan sehingga 128,000 token dalam satu perbualan, yang bermaksud menjalankan dokumen yang panjang melalui AI tidak akan menjadi masalah. Jika anda bekerja dengan data, Qwen boleh memproses format berstruktur seperti jadual, CSV, dan fail JSON. Sebagai contoh, QWEN.5-CODER-32B-Instruct Excels pada tugas pengekodan, manakala QWQ-32B-Preview mampu berfikir dan memikirkan. Tidak semua model boleh melakukan segala -galanya, tetapi kebanyakan model boleh mengendalikan teks, serta imej dan generasi video.
Satu lagi ciri yang agak unik adalah keupayaan untuk menggabungkan dua model bersama -sama. Dalam pengalaman saya, anda boleh mendapatkan hasil yang lebih baik apabila menggabungkan dua versi ke dalam pasangan yang lebih kuat. Sebagai contoh, berpasangan Qwen2.5-Max dengan QWEN.5-CODER-32B-Instruct membantu saya menghasilkan kod dengan sedikit petikan dan isu dalam output. Model AI. Anda boleh menaip arahan dan bekerja dengan teks, tetapi terdapat keupayaan generasi imej dan video juga dan dalam pelbagai nisbah aspek. Terdapat ciri carian web yang masih belum dilancarkan.
Di bahagian bawah, kadang -kadang, Qwen mengambil sedikit masa untuk memproses arahan anda. Begitu banyak sehingga, pada mulanya, saya fikir laman web itu tidak berfungsi dengan betul. Saya mendapati bahawa petikan pertama yang anda hantar dalam perbualan boleh mengambil masa kira -kira 30 saat untuk menghasilkan respons, selepas itu respons mempercepatkan. Mereka bukan garis besar ketika datang ke kualiti atau realisme, tetapi jika anda perlu menghasilkan imej yang cepat dalam secubit, mereka akan lakukan. Anda juga boleh mengharapkan sejumlah artifak rawak dalam media yang paling banyak dijana. DeepSeek dan Chatgpt. Saya menerima kesilapan yang menyambung ke Qwen kerana terdapat terlalu banyak permintaan dalam barisan dari semasa ke semasa.
Adakah Qwen lebih baik daripada DeepSeek?
Secara teknikal, Qwen lebih baik daripada Deepseek di seluruh papan. Model Alibaba terasa lebih semula jadi untuk berinteraksi dan berjalan dengan lebih cepat. Walau bagaimanapun, jika anda mengabaikan hasil penanda aras, anda akan tertekan untuk mencari perbezaan antara kedua-dua.
Kelebihan utama Qwen ke atas DeepSeek adalah penjajaran yang lebih baik dengan keutamaan manusia, menjadikannya lebih mudah untuk menaip petunjuk yang lebih rumit dan mendapatkan respons yang tepat tanpa banyak penalaan. Malah satu-liners mudah dapat menghasilkan respons terperinci dengan banyak maklumat. DeepSeek, sementara model AI yang hebat, boleh mengambil beberapa percubaan dan beberapa kejuruteraan segera sebelum anda mendapatkan hasil yang anda inginkan. mempunyai sedikit kelebihan apabila ia datang kepada konsistensi faktual.
Satu kawasan di mana Deepseek adalah pemenang yang jelas, bagaimanapun, adalah kos penggunaan. DeepSeek berharga $ 0.25 per juta token, manakala Qwen berharga $ 0.38. Yang mengatakan, ia masih jauh lebih murah daripada kadar $ 5 dan $ 3 yang ditawarkan oleh GPT-4O dan Claude 3.5, masing-masing. Ketika datang ke tanda aras.
Benchmark
| qwen 2.5 max DeepSeek V3 R1
|
arena-hard Benchmark | Qwen 2.5 Max | DeepSeek V3 R1 |
Arena-Hard | 89.4 | 85.5 | MMLU-Pro | 76.1 | 75.9 | GPQA-Diamond | 60.1 | 59.1 | LiveCodeBench | 38.7 | 37.6 | LiveBench | 62.2 | 60.5 | | 89.4
| 76.1 | 75.9 |
Diamond
| 60.1
| 59.1
|
| 38.7
| 37.6 | livebench | 62.2 | 60.5 | Penanda aras jelas menunjukkan pemahaman dan penjajaran Qwen yang lebih baik dengan nilai -nilai manusia. Selain itu, dari segi pengetahuan dan penalaran, pengetahuan umum, pengekodan, dan keupayaan keseluruhan, ia hanya sedikit lebih baik daripada Deepseek. Terdapat kebimbangan keselamatan dan privasi, walaupun, terutamanya memandangkan DeepSeek telah mengalami pelanggaran data pertamanya. Namun, model AI Qwen dan Deepseek jelas lebih baik daripada rakan -rakan barat mereka dari segi prestasi dan benar -benar meletakkan dunia AI di tepi.
Atas ialah kandungan terperinci Gergasi teknologi Cina ini baru sahaja melancarkan chatbot AI -dan lebih baik daripada DeepSeek. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!