


'Momen Android' model AI besar domestik telah tiba! Alibaba Cloud Tongyi Qianwen adalah percuma, sumber terbuka dan tersedia untuk kegunaan komersial
Selepas Meta di luar negara, Alibaba telah menjadi satu lagi gergasi teknologi yang mempromosikan trend "momen Android" model besar kecerdasan buatan (AI)
Menurut laporan daripada Beijing Business Daily, Alibaba Cloud akan mengeluarkan model soalan dan jawapan umum sumber terbuka Qwen-7B dan model perbualan Qwen-7B-Chat pada Khamis, 3 Ogos. Kedua-dua model mempunyai 7 bilion parameter. Mereka telah melancarkan platform terbuka "Model sebagai Perkhidmatan" pertama di China, Komuniti Ajaib, dan ia boleh digunakan secara percuma, dan penggunaan komersial juga dibenarkan
Pengguna boleh mengukur Qwen-7B dan Qwen-7B-Chat melalui kod sumber terbuka, dan menggunakan serta menjalankan model pada kad grafik gred pengguna. Mereka boleh memuat turun model secara terus daripada komuniti Moda, atau mengakses dan menghubungi Qwen-7B dan Qwen-7B-Chat melalui platform Alibaba Cloud Lingji. Alibaba Cloud menyediakan perkhidmatan kepada pengguna termasuk latihan model, inferens, penggunaan dan penalaan halus
Pada komuniti Menara Ajaib, terdapat siaran khusus untuk memperkenalkan kaedah pemasangan model Tongyi Qianwen, pengalaman membuat ruang, amalan terbaik penaakulan model dan latihan model, dan juga melampirkan tangkapan skrin pautan model dan status muat turun
Menurut maklumat awam, Qwen-7B ialah model asas yang telah dilatih terlebih dahulu menggunakan lebih daripada 2.2 trilion token selepas penyahduplikasian dan penapisan. Ia menyokong berbilang bahasa seperti Cina dan Inggeris, dan mempunyai panjang tetingkap konteks 8k. Model ini mengandungi data Cina, Inggeris, berbilang bahasa, kod, matematik dan data lain yang berkualiti tinggi, meliputi keseluruhan teks rangkaian, ensiklopedia, buku, kod, matematik dan medan menegak dalam pelbagai bidang
Menurut keputusan penilaian MMLU, Qwen-7B menunjukkan prestasi yang baik dalam penilaian Bahasa Inggeris, mengatasi model pra-latihan sumber terbuka lain yang serupa dan bersaing dengan model berskala lebih besar. Dari segi penilaian Cina, Qwen-7B mencapai skor tertinggi pada set pengesahan C-Eval dan berdaya saing walaupun dengan model skala yang lebih besar
Berikut ialah perbandingan keputusan ketepatan 5 pukulan MMLU Qwen-7B
Alibaba Cloud telah membina pembantu AI Qwen-7B-Chat berdasarkan model asas melalui mekanisme penjajaran Ia adalah model bahasa besar dialog Cina dan Inggeris berdasarkan Transformer, yang telah berjaya mencapai penjajaran dengan kognisi manusia. Model ini menggunakan pelbagai data pra-latihan, termasuk teks dalam talian, buku profesional, kod, dsb., meliputi pelbagai topik
Ketepatan tangkapan sifar model Qwen-7B-Chat pada kedua-dua set pengesahan C-Eval dan set penilaian MMLU melebihi model penjajaran serupa yang lain
Berikut ialah perbandingan keputusan ketepatan pukulan sifar pada set ujian C-Eval
Alibaba Cloud menjadi syarikat teknologi besar pertama di China yang menyertai barisan model besar sumber terbuka Pada Julai tahun ini, ia bersama-sama mengeluarkan versi komersial model AI sumber terbuka Llama 2 dengan Meta, yang boleh menggantikan model OpenAI dan Google. . Selain itu, Zhipu AI dan Tsinghua KEG Laboratory juga mengumumkan model besar sumber terbuka teratas China pada bulan Julai
Kelebihan model sumber terbuka adalah untuk meningkatkan penerimaan pengguna dan menyediakan lebih banyak data untuk pemprosesan kecerdasan buatan. Lebih besar volum data LLM, lebih berkuasa fungsinya. Selain itu, model sumber terbuka membantu penyelidik dan pembangun menemui dan menyelesaikan kelemahan, meningkatkan tahap teknologi dan keselamatan
Di Sidang Kemuncak Awan Alibaba pada April 2023, Alibaba mengumumkan pembukaan Tongyi Qianwen kepada perusahaan, membolehkan perusahaan menggunakan keupayaan Tongyi Qianwen untuk melatih model besar mereka sendiri
Ketua Pegawai Teknologi (CTO) Kumpulan Perisikan Awan Alibaba, Zhou Jingren berkata, pada masa hadapan, perusahaan boleh menggunakan sepenuhnya keupayaan Tongyi Qianwen Alibaba Cloud dan menggabungkan pengetahuan industri dan senario aplikasi mereka sendiri untuk melatih model besar perusahaan tersuai. Sebagai contoh, setiap syarikat boleh mempunyai perkhidmatan pelanggan pintar sendiri, panduan membeli-belah pintar, pembantu suara pintar, pembantu penulisan salinan, pereka AI dan model memandu sendiri serta fungsi lain
Zhang Yong, Ketua Pegawai Eksekutif Kumpulan Alibaba dan Ketua Pegawai Eksekutif Alibaba Cloud Intelligence Group, berkata bahawa semua produk Alibaba akan disepadukan dengan model besar Tongyi Qianwen
Alibaba Cloud berharap dapat membantu lebih banyak perusahaan menggunakan model besar untuk menyesuaikan diri dengan keperluan era AI, supaya setiap perusahaan boleh mempunyai model besar keupayaan industri eksklusifnya sendiri, dan membina semulanya berdasarkan Tongyi Qianwen
Atas ialah kandungan terperinci 'Momen Android' model AI besar domestik telah tiba! Alibaba Cloud Tongyi Qianwen adalah percuma, sumber terbuka dan tersedia untuk kegunaan komersial. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Menurut berita dari laman web ini pada 5 Ogos, Alibaba Cloud mengumumkan bahawa Persidangan Yunqi 2024 akan diadakan di Bandar Yunqi, Hangzhou dari 19 hingga 21 September akan ada forum utama selama tiga hari, 400 sub-forum dan topik selari. serta hampir empat Sepuluh ribu meter persegi kawasan pameran. Persidangan Yunqi adalah percuma dan terbuka kepada orang ramai Mulai sekarang, orang ramai boleh memohon tiket percuma melalui laman web rasmi Persidangan Yunqi Tiket semua lulus sebanyak 5,000 yuan. https://yunqi.aliyun.com/2024 /ticket-list Menurut laporan, Persidangan Yunqi bermula pada 2009 dan pada asalnya dinamakan Forum Pembangunan Laman Web China Pertama pada 2011, ia berkembang menjadi Persidangan Pembangun Awan Alibaba pada 2015 , ia secara rasmi dinamakan semula sebagai "Persidangan Yunqi" dan terus berjaya bergerak

Pada 30 Mei, Tencent mengumumkan peningkatan menyeluruh model Hunyuannya Apl "Tencent Yuanbao" berdasarkan model Hunyuan telah dilancarkan secara rasmi dan boleh dimuat turun dari kedai aplikasi Apple dan Android. Berbanding dengan versi applet Hunyuan dalam peringkat ujian sebelumnya, Tencent Yuanbao menyediakan keupayaan teras seperti carian AI, ringkasan AI, dan penulisan AI untuk senario kecekapan kerja untuk senario kehidupan harian, permainan Yuanbao juga lebih kaya dan menyediakan pelbagai ciri , dan kaedah permainan baharu seperti mencipta ejen peribadi ditambah. "Tencent tidak akan berusaha untuk menjadi yang pertama membuat model besar, Liu Yuhong, naib presiden Tencent Cloud dan orang yang bertanggungjawab bagi model besar Tencent Hunyuan, berkata: "Pada tahun lalu, kami terus mempromosikan keupayaan untuk Model besar Tencent Hunyuan Dalam teknologi Poland yang kaya dan besar dalam senario perniagaan sambil mendapatkan cerapan tentang keperluan sebenar pengguna

Tan Dai, Presiden Volcano Engine, berkata syarikat yang ingin melaksanakan model besar dengan baik menghadapi tiga cabaran utama: kesan model, kos inferens dan kesukaran pelaksanaan: mereka mesti mempunyai sokongan model besar asas yang baik untuk menyelesaikan masalah yang kompleks, dan mereka juga mesti mempunyai inferens kos rendah. Perkhidmatan membolehkan model besar digunakan secara meluas, dan lebih banyak alat, platform dan aplikasi diperlukan untuk membantu syarikat melaksanakan senario. ——Tan Dai, Presiden Huoshan Engine 01. Model pundi kacang besar membuat kemunculan sulungnya dan banyak digunakan Menggilap kesan model adalah cabaran paling kritikal untuk pelaksanaan AI. Tan Dai menegaskan bahawa hanya melalui penggunaan meluas model yang baik boleh digilap. Pada masa ini, model Doubao memproses 120 bilion token teks dan menjana 30 juta imej setiap hari. Untuk membantu perusahaan melaksanakan senario model berskala besar, model berskala besar beanbao yang dibangunkan secara bebas oleh ByteDance akan dilancarkan melalui gunung berapi

1. Kedudukan produk TensorRT-LLM TensorRT-LLM ialah penyelesaian inferens berskala yang dibangunkan oleh NVIDIA untuk model bahasa besar (LLM). Ia membina, menyusun dan melaksanakan graf pengiraan berdasarkan rangka kerja kompilasi pembelajaran mendalam TensorRT dan menggunakan pelaksanaan Kernel yang cekap dalam FastTransformer. Selain itu, ia menggunakan NCCL untuk komunikasi antara peranti. Pembangun boleh menyesuaikan operator untuk memenuhi keperluan khusus berdasarkan pembangunan teknologi dan perbezaan permintaan, seperti membangunkan GEMM tersuai berdasarkan cutlass. TensorRT-LLM ialah penyelesaian inferens rasmi NVIDIA, komited untuk menyediakan prestasi tinggi dan terus meningkatkan kepraktisannya. TensorRT-LL

Menurut berita pada 4 April, Pentadbiran Ruang Siber China baru-baru ini mengeluarkan senarai model besar yang didaftarkan, dan "Model Besar Interaksi Bahasa Semula Jadi Jiutian" China Mobile disertakan di dalamnya, menandakan model besar Jiutian AI China Mobile secara rasmi boleh menyediakan tiruan generatif. perkhidmatan perisikan kepada dunia luar. China Mobile menyatakan bahawa ini adalah model berskala besar pertama yang dibangunkan oleh perusahaan pusat yang telah lulus kedua-dua "Pendaftaran Perkhidmatan Kecerdasan Buatan Generatif" nasional dan "Pendaftaran Algoritma Perkhidmatan Sintetik Dalam Domestik" dwi pendaftaran. Menurut laporan, model besar interaksi bahasa semula jadi Jiutian mempunyai ciri-ciri keupayaan industri yang dipertingkatkan, keselamatan dan kredibiliti, dan menyokong penyetempatan timbunan penuh Ia telah membentuk berbilang versi parameter seperti 9 bilion, 13.9 bilion, 57 bilion dan 100 bilion. dan boleh digunakan secara fleksibel dalam Awan, tepi dan hujung adalah situasi yang berbeza

1. Latar Belakang Pengenalan Pertama, mari kita perkenalkan sejarah pembangunan Teknologi Yunwen. Syarikat Teknologi Yunwen...2023 ialah tempoh apabila model besar berleluasa Banyak syarikat percaya bahawa kepentingan graf telah dikurangkan dengan ketara selepas model besar, dan sistem maklumat pratetap yang dikaji sebelum ini tidak lagi penting. Walau bagaimanapun, dengan promosi RAG dan kelaziman tadbir urus data, kami mendapati bahawa tadbir urus data yang lebih cekap dan data berkualiti tinggi adalah prasyarat penting untuk meningkatkan keberkesanan model besar yang diswastakan Oleh itu, semakin banyak syarikat mula memberi perhatian kepada kandungan berkaitan pembinaan pengetahuan. Ini juga menggalakkan pembinaan dan pemprosesan pengetahuan ke peringkat yang lebih tinggi, di mana terdapat banyak teknik dan kaedah yang boleh diterokai. Dapat dilihat bahawa kemunculan teknologi baru tidak mengalahkan semua teknologi lama, tetapi mungkin juga mengintegrasikan teknologi baru dan lama.

Jika soalan ujian terlalu mudah, kedua-dua pelajar terbaik dan pelajar lemah boleh mendapat 90 mata, dan jurang tidak boleh diluaskan... Dengan keluaran model yang lebih kukuh seperti Claude3, Llama3 dan juga GPT-5 kemudiannya, industri berada dalam keperluan mendesak untuk penanda aras model yang lebih sukar dan berbeza. LMSYS, organisasi di sebalik arena model besar, melancarkan penanda aras generasi akan datang, Arena-Hard, yang menarik perhatian meluas. Terdapat juga rujukan terkini untuk kekuatan dua versi arahan Llama3 yang diperhalusi. Berbanding dengan MTBench, yang mempunyai markah yang sama sebelum ini, diskriminasi Arena-Hard meningkat daripada 22.6% kepada 87.4%, yang lebih kuat dan lemah secara sepintas lalu. Arena-Hard dibina menggunakan data manusia masa nyata dari arena dan mempunyai kadar konsistensi 89.1% dengan keutamaan manusia.

Menurut berita pada 13 Jun, menurut akaun awam “Volcano Engine” Byte, pembantu kecerdasan buatan Xiaomi “Xiao Ai” telah mencapai kerjasama dengan Volcano Engine Kedua-dua pihak akan mencapai pengalaman interaktif AI yang lebih pintar berdasarkan model besar beanbao . Dilaporkan bahawa model beanbao berskala besar yang dicipta oleh ByteDance boleh memproses sehingga 120 bilion token teks dengan cekap dan menjana 30 juta keping kandungan setiap hari. Xiaomi menggunakan model besar Doubao untuk meningkatkan keupayaan pembelajaran dan penaakulan modelnya sendiri dan mencipta "Xiao Ai Classmate", yang bukan sahaja memahami keperluan pengguna dengan lebih tepat, tetapi juga menyediakan kelajuan tindak balas yang lebih pantas dan perkhidmatan kandungan yang lebih komprehensif. Contohnya, apabila pengguna bertanya tentang konsep saintifik yang kompleks, &ldq
