Kurang daripada setahun selepas keluaran GPT-3.5 di luar negara, kurang setengah tahun selepas pengeluaran Wenxinyiyan domestik, China telah meneruskan ke "Battle" daripada Ratusan Model". Peserta termasuk pengeluar besar dan sebilangan besar syarikat permulaan. Walau bagaimanapun, persaingan untuk model besar adalah sengit, dan jika pengguna perusahaan tidak mempunyai mata yang tajam, mereka mungkin akan jatuh ke dalam perangkap, menyebabkan projek itu tidak dapat diselesaikan.
Jurang antara model besar daripada beberapa pengeluar utama, seperti Model Besar Wenxin, Tongyi Qianwen, Model Besar Pangu, dll., semakin melebar. Senarai penilaian terbaru SuperCLUE menunjukkan bahawa Wen Xinyiyan telah mengatasi GPT-3.5turbo, dan model besar domestik seperti GLM-130B juga berada di bahagian atas senarai. Model besar domestik telah menjadi bahagian penting dunia dari segi kuantiti, dan pantas mengejar GPT-4 yang paling canggih dari segi kualiti.
Di sebalik "perang 100 model", industri optimis bahawa inovasi teknologi model besar akan menggalakkan pendigitalan industri dan mencipta trilion nilai pasaran. Dari sudut pandangan semasa, model besar "dihasilkan oleh pengeluar utama" yang diwakili oleh Wen Xinyiyan dan Tongyi Qianwen menduduki kedudukan dominan di peringkat teknikal, mereka juga telah memenangi lebih banyak kerjasama projek dengan membina ekologi perindustrian.
Mengapa model besar yang dihasilkan oleh pengeluar besar lebih berkuasa dan lebih popular di kalangan pelanggan berbanding syarikat permulaan? Pada pendapat penulis, terdapat tiga sebab utama:
Pertama sekali, model besar akhirnya mesti digunakan dalam senario industri, dan ia bukanlah "perjanjian satu pukulan" yang mudah. Sebagai simbol kestabilan, keselamatan dan kebolehpercayaan yang lebih tinggi, pengeluar utama umumnya mempunyai pengumpulan yang mencukupi dalam pangkalan teknologi AI. Pelanggan perusahaan cenderung menumpukan pada tahap aplikasi dan tidak semestinya mempunyai pengumpulan kukuh teknologi AI asas. Pengeluar utama seperti Baidu, Alibaba, dan Huawei telah membina pangkalan AI yang telah diuji dalam pertempuran sebenar Melihat pada permulaan, terdapat banyak sorotan dan penemuan dalam inovasi teknologi Walau bagaimanapun, dari perspektif pengumpulan asas teknologi AI perkhidmatan pelanggan jangka panjang dan stabil, Keupayaan keseluruhan dan hayat bateri masih dipersoalkan.
Kedua, pengeluar besar mempunyai kekuatan komprehensif yang lebih kukuh untuk melabur dalam pembangunan berulang teknologi model besar. Sebagai contoh, Baidu boleh menggerakkan seluruh kumpulan untuk membangunkan Wenxin Yiyan Lelaran terbaru Wenxin Big Model 3.5 mempunyai kelajuan inferens yang 17 kali lebih pantas daripada versi 3.0, dan kesan model dipertingkatkan lebih daripada 50%. Sebaliknya, syarikat permulaan yang paling popular, tahun-tahun ringan, memilih untuk "menjual habis" kepada Meituan dalam masa kurang daripada setengah tahun. Beberapa model besar yang dibangunkan berdasarkan teknologi sumber terbuka kekurangan pengumpulan teknologi asas yang mencukupi dan keupayaan pembangunan autonomi.
Menurut "Laporan Penilaian Keupayaan Teknikal Model Besar AI, 2023" yang dikeluarkan oleh syarikat penyelidikan pasaran IDC, Baidu Wenxin Large Model 3.5 menjaringkan 7 markah penuh dalam 12 petunjuk, termasuk "model algoritma" ", " dan "Liputan Industri" ialah dua penunjuk utama, menduduki tempat pertama dalam skor keseluruhan; Model Besar Alibaba Tongyi, menduduki tempat kedua, menerima markah penuh dalam 6 daripada 11 penunjuk, dan merupakan satu-satunya pengeluar dengan markah penuh dalam "Keupayaan Perkhidmatan".
Ketiga, senario industri pelaksanaan model besar, penghantaran perkhidmatan, operasi dan penyelenggaraan seterusnya, dsb. Bagi pengeluar besar, ia adalah "mudah dikuasai", tetapi bagi syarikat permulaan, ia adalah satu cabaran yang sukar. Pengeluar besar dapat mengerahkan pasukan perkhidmatan khusus untuk industri menegak dan pelanggan utama untuk melegakan pelanggan daripada kebimbangan tentang menerima teknologi baharu Walau bagaimanapun, syarikat permulaan sering kekurangan pengalaman dalam melayani pelanggan kerajaan dan perusahaan yang dibangunkan berdasarkan sumber terbuka teknologi mesti melakukan kerja yang baik dalam semua aspek Perkhidmatan proses adalah dendam.
Ringkasnya, model besar itu bukan sahaja melihat kepada pelbagai parameter teknikal, tetapi juga melihat pada pelaksanaan industri, "pengetahuan" industri dan pengalaman berjaya. Produk yang dikeluarkan oleh pengeluar utama kini menduduki kedudukan dominan dari segi pembangunan teknologi, aplikasi industri dan perkhidmatan. Sudah tentu, "Pertempuran Seratus Model" mungkin bukan "Perang Seratus Rejimen" lebih daripada sepuluh tahun yang lalu, dengan hanya dua pemenang pada akhirnya. Model besar itu masih dalam peringkat awal pembangunan, dan terdapat lebih banyak kemungkinan pada masa hadapan, termasuk kemungkinan mengatasi GPT-4 dan lebih banyak produk pesaing Eropah dan Amerika.
Atas ialah kandungan terperinci Perusahaan 'masuk lubang' model besar, mengapa anda mengesyorkan bahawa mereka dihasilkan oleh pengeluar besar?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!