Menurut berita dari laman web ini pada 30 Mei, Liu Weihong, naib presiden Tencent Cloud dan ketua Tencent Hunyuan Large Model, berkata bahawa kadar penembusan rendah semasa storan model besar adalah disebabkan oleh dua sebab utama: Di satu pihak, model besar masih dalam peringkat pembangunan, dan produk AI Penyelesaiannya tidak matang sebaliknya, kesedaran pengguna masih diwujudkan, dan permintaan untuk AI tertumpu pada carian/kecekapan.
Liu Yuhong berkata bahawa enjin carian asal mungkin telah melakukan kerja yang baik, dan model besar semasa boleh membuat carian lebih baik. Sejak Tencent mengeluarkan produk model besarnya pada September tahun lepas, kecekapan model telah meningkat sebanyak 50%, daripada 100 bilion parameter kepada 1 trilion parameter, dan menyokong konteks tetingkap asli 256k dan penjanaan video 16 saat. Pada masa ini, lebih daripada 600 perniagaan dalam Tencent telah mengakses model besar Hunyuan.
Pada 22 Mei 2021, Tencent Cloud mengeluarkan pelan harga model besar baharu Salah satu model utama ialah model Hunyuan lite Jumlah panjang input dan output API dirancang untuk dinaik taraf daripada 4k semasa kepada 256k. harga diselaraskan daripada 0.008 yuan/ribu token Ia adalah percuma.
Harga input API standard Hunyuan turun daripada 0.01 yuan/ribu token kepada 0.0045 yuan/ribu token, penurunan sebanyak 55%, dan harga output API turun daripada 0.01 token0/ribu token/token , penurunan 50%. Hunyuan-standard-256k yang baru dilancarkan mempunyai keupayaan untuk memproses teks ultra-panjang lebih daripada 380,000 aksara. Harga input API dikurangkan kepada 0.015 yuan/ribu token, penurunan sebanyak 87.5%, dan harga output API dikurangkan kepada 0.06 yuan/ribu token, penurunan sebanyak 50%.
Model parameter terkonfigurasi trilion tertinggi Hunyuan-pro, harga input API turun daripada 0.1 yuan/ribu token kepada 0.03 yuan/ribu token, penurunan sebanyak 70%.
Pelarasan harga di atas berkuatkuasa serta merta. Pada masa yang sama, untuk memberi perkhidmatan yang lebih baik kepada pembangun, Tencent Yuanqi, platform penciptaan dan pengedaran ejen sehenti, juga telah meningkatkan secara komprehensif pelan sokongan sumber modelnya: pengguna bukan sahaja boleh mengedarkan ejen AI eksklusif ke saluran global Tencent dengan satu klik , tetapi juga menerima sumber model besar Hunyuan percuma dan sokongan trafik juga boleh digunakan untuk mengedar dan menggunakan ejen dalam bentuk API kepada pelbagai senario Had token percuma telah ditingkatkan daripada 1 juta sebelumnya kepada 100 juta.
Atas ialah kandungan terperinci Tencent Cloud Liu Yuhong bercakap tentang kadar penembusan rendah model besar: masih dalam peringkat pembangunan, penyelesaian produk AI masih belum matang. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!