


CHEATC2023|Chen Xiaoping, Universiti Sains dan Teknologi China: Daripada model besar kepada robot lembut
Sejak awal tahun ini, dengan populariti berterusan ChatGPT, model besar juga telah memasuki tempoh pembangunan pesat Banyak syarikat teknologi dalam dan luar negara yang terkenal telah melancarkan produk model besar yang dibangunkan secara bebas. Jadi apakah prinsip teknikal model besar?
Pada 18 Mei, Profesor Chen Xiaoping, pengarah Makmal Robotik Universiti Sains dan Teknologi China, yang dijemput untuk menghadiri Persidangan Teknologi Peralatan Rumah China 2023 (CHEATC2023), berkongsi penyelidikan dan pandangannya juga pengarah Etika Kepintaran Buatan Persatuan Kepintaran Buatan China Bersama Pengerusi Jawatankuasa Tadbir Urus, Profesor Chen Xiaoping menyampaikan ucaptama mengenai "Perkembangan Baru dalam Kepintaran Buatan: Daripada Model Besar kepada Robot Lembut" pada persidangan ini, memperkenalkan prinsip teknikal model kecerdasan buatan yang besar dan perkembangan baharu dalam penerapan trend Teknologi.
Profesor Chen Xiaoping dari Universiti Sains dan Teknologi China
"Prinsip asas model besar ialah membuat ramalan," kata Chen Xiaoping, pembangunan kecerdasan buatan kini telah memulakan proses gelombang keempat, dan model data juga telah beralih daripada dipacu data besar kepada latihan besar-. dipandu. Berbeza daripada tiga gelombang sebelumnya, peringkat baharu kecerdasan buatan mempunyai keperluan baharu untuk kualiti, kuantiti dan kaedah pemerolehan data latihan, dan akhirnya membentuk model contoh yang boleh digunakan pada adegan sebenar berskala besar. Beliau menekankan bahawa model besar ialah sistem pintar yang disepadukan oleh pelbagai teknologi, bukannya gabungan mudah satu atau beberapa teknologi. ”
Kebangkitan model besar datang daripada kecerdasan buatan generatif Pada masa ini, kecerdasan buatan generatif bukan lagi sekadar penjanaan kandungan seperti bahasa dan imej, tetapi berdasarkan pemprosesan tepat bahasa semula jadi manusia untuk melengkapkan kecerdasan. interaksi komputer. Chen Xiaoping berkata: "Pada peringkat ini, jangkaan kami untuk pemprosesan bahasa mesin ialah ia boleh bercakap bahasa manusia, memahami bahasa manusia, dan menjawab soalan, walaupun jawapannya mungkin tidak betul. Antaranya, keperluan asas ialah pertuturan itu. mesti mematuhi tabiat bahasa manusia "Memandangkan tiada piawaian saintifik untuk tabiat bahasa manusia tetapi terdapat standard empirikal, bagaimana mesin boleh menguasai dan menggunakan tabiat bahasa manusia? Chen Xiaoping berkata: "Idea penyelidikan asas dan rahsia kejayaan model besar. ialah: ekstrak bahasa daripada corpora manusia berskala besar dan digunakan dalam interaksi bahasa semula jadi manusia-komputer”
.Model besar mengekstrak unsur semantik termasuk aksara, perkataan, tanda baca, dsb. daripada korpus asal manusia, dan kemudian menyemak elemen semantik berdasarkan korelasi antara unsur semantik sebelum dan seterusnya, dan akhirnya mencapai ramalan tingkah laku. Pada dasarnya, lebih banyak bilangan elemen semantik yang dilihat ke belakang, lebih tinggi ketepatan ramalan. Sekurang-kurangnya 4,000 token boleh disemak oleh model besar, dan sesetengah model boleh menyemak sehingga 100,000 token. "Chen Xiaoping berkata. Sistem teknologi model besar menggunakan model pra-latihan sebagai asas untuk model besar, dan kemudian menggunakan model khas terlatih khas untuk bekerjasama dengan model panduan pengguna untuk memahami dengan tepat dan menjawab soalan pengguna. Ketiga-tiga model utama bekerjasama antara satu sama lain, dan kualiti jawapan kecerdasan buatan boleh Mencapai peningkatan yang ketara
.Walaupun kemunculan model berskala besar telah membawa hala tuju inovatif baharu untuk kecerdasan buatan, ia tidak sesuai untuk semua aspek senario kehidupan sebenar. Menurut Chen Xiaoping, tiga bidang utama kecerdasan buatan yang perlu ditakluki China pada masa ini ialah pembuatan pintar, pertanian pintar dan penjagaan warga emas inklusif. "Mengatasi tiga pertempuran utama ini akan mengubah sepenuhnya landskap global kita, sebaliknya, model besar membawa perubahan besar tetapi juga membawa cabaran baharu." Apabila model besar didasarkan pada tiruan fungsi manusia, mereka mungkin dianggap sebagai mempunyai emosi dan kesedaran. Ini kerana manusia lazimnya mengaplikasikan pemahaman mereka tentang sesuatu konsep kepada keseluruhan struktur yang melibatkan konsep itu, memikirkan bahawa maklumat yang dinyatakan oleh struktur itu juga mempunyai makna yang sama, tetapi sebenarnya ini tidak berlaku. "Chen Xiaoping berkata bahawa penggunaan model besar mungkin juga mempunyai keselamatan awam, pekerjaan dan kesan jangka panjang.
Selain model berskala besar, Profesor Chen Xiaoping juga mencapai hasil penyelidikan saintifik baharu mengenai "kecerdasan buatan dalam dunia fizikal". Pada masa ini, bentuk fizikal kecerdasan buatan yang kami gunakan adalah terutamanya robot tegar Robot jenis ini mempunyai ketepatan pengulangan yang tinggi, tetapi ketangkasan dan keselamatan yang rendah Ia sesuai untuk persekitaran berstruktur, tetapi perlu dijalankan dalam persekitaran yang tidak berstruktur. Pengukuran, pemodelan dan pengiraan yang tepat memerlukan keperluan teknikal yang tinggi dan pada masa ini tidak sesuai untuk kebanyakan industri. Sebagai tindak balas kepada kelemahan robot tegar ini, Chen Xiaoping mencadangkan prinsip gabungan, di bawah tiga andaian asas bahawa pengukuran tepat objek operasi robot pintar tidak boleh dilaksanakan, pemodelan tepat persekitaran kerja dan objek operasi tidak boleh dilaksanakan, dan membuat keputusan yang tepat tidak dapat dilaksanakan, membangunkan cabang perisian rangkaian sarang lebah pneumatik. Lengan jenis ini mempunyai prestasi yang baik dari segi fleksibiliti dan kapasiti beban, dan boleh mencapai kawalan yang tepat apabila terdapat gangguan luar dan pergerakan objek yang tidak teratur. Teknologi ini dijangka mempunyai prospek aplikasi yang luas dalam bidang seperti perkhidmatan rumah, interaksi emosi dan pemanduan autonomi. Sebaliknya, pasukan Chen Xiaoping juga menggabungkan lengan fleksibel dengan mesin tegar, menghasilkan hasil eksperimen "kuku tegar dan lembut", yang boleh merealisasikan kawalan tanpa mengubah parameter program dan perkakasan dan tanpa menggunakan sensor maklum balas daya mencengkam objek pelbagai bentuk.
Atas ialah kandungan terperinci CHEATC2023|Chen Xiaoping, Universiti Sains dan Teknologi China: Daripada model besar kepada robot lembut. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Pada 30 Mei, Tencent mengumumkan peningkatan menyeluruh model Hunyuannya Apl "Tencent Yuanbao" berdasarkan model Hunyuan telah dilancarkan secara rasmi dan boleh dimuat turun dari kedai aplikasi Apple dan Android. Berbanding dengan versi applet Hunyuan dalam peringkat ujian sebelumnya, Tencent Yuanbao menyediakan keupayaan teras seperti carian AI, ringkasan AI, dan penulisan AI untuk senario kecekapan kerja untuk senario kehidupan harian, permainan Yuanbao juga lebih kaya dan menyediakan pelbagai ciri , dan kaedah permainan baharu seperti mencipta ejen peribadi ditambah. "Tencent tidak akan berusaha untuk menjadi yang pertama membuat model besar, Liu Yuhong, naib presiden Tencent Cloud dan orang yang bertanggungjawab bagi model besar Tencent Hunyuan, berkata: "Pada tahun lalu, kami terus mempromosikan keupayaan untuk Model besar Tencent Hunyuan Dalam teknologi Poland yang kaya dan besar dalam senario perniagaan sambil mendapatkan cerapan tentang keperluan sebenar pengguna

Tan Dai, Presiden Volcano Engine, berkata syarikat yang ingin melaksanakan model besar dengan baik menghadapi tiga cabaran utama: kesan model, kos inferens dan kesukaran pelaksanaan: mereka mesti mempunyai sokongan model besar asas yang baik untuk menyelesaikan masalah yang kompleks, dan mereka juga mesti mempunyai inferens kos rendah. Perkhidmatan membolehkan model besar digunakan secara meluas, dan lebih banyak alat, platform dan aplikasi diperlukan untuk membantu syarikat melaksanakan senario. ——Tan Dai, Presiden Huoshan Engine 01. Model pundi kacang besar membuat kemunculan sulungnya dan banyak digunakan Menggilap kesan model adalah cabaran paling kritikal untuk pelaksanaan AI. Tan Dai menegaskan bahawa hanya melalui penggunaan meluas model yang baik boleh digilap. Pada masa ini, model Doubao memproses 120 bilion token teks dan menjana 30 juta imej setiap hari. Untuk membantu perusahaan melaksanakan senario model berskala besar, model berskala besar beanbao yang dibangunkan secara bebas oleh ByteDance akan dilancarkan melalui gunung berapi

"Kerumitan tinggi, pemecahan tinggi dan merentas domain" sentiasa menjadi titik kesakitan utama dalam perjalanan ke peningkatan digital dan pintar industri pengangkutan. Baru-baru ini, "Model Trafik Qinling·Qinchuan" dengan skala parameter 100 bilion, dibina bersama oleh China Science Vision, Kerajaan Daerah Xi'an Yanta, dan Pusat Pengkomputeran Kecerdasan Buatan Masa Depan Xi'an, berorientasikan bidang pengangkutan pintar dan menyediakan perkhidmatan kepada Xi'an dan kawasan sekitarnya Rantau ini akan mewujudkan titik tumpu untuk inovasi pengangkutan pintar. "Model Trafik Qinling·Qinchuan" menggabungkan data ekologi trafik tempatan besar-besaran Xi'an dalam senario terbuka, algoritma lanjutan asal yang dibangunkan secara bebas oleh China Science Vision dan kuasa pengkomputeran berkuasa Shengteng AI dari Pusat Pengkomputeran Kecerdasan Buatan Masa Depan Xi'an untuk menyediakan pemantauan rangkaian jalan raya, senario pengangkutan Pintar seperti arahan kecemasan, pengurusan penyelenggaraan dan perjalanan awam membawa perubahan digital dan pintar. Pengurusan trafik mempunyai ciri yang berbeza di bandar yang berbeza, dan trafik di jalan yang berbeza

1. Kedudukan produk TensorRT-LLM TensorRT-LLM ialah penyelesaian inferens berskala yang dibangunkan oleh NVIDIA untuk model bahasa besar (LLM). Ia membina, menyusun dan melaksanakan graf pengiraan berdasarkan rangka kerja kompilasi pembelajaran mendalam TensorRT dan menggunakan pelaksanaan Kernel yang cekap dalam FastTransformer. Selain itu, ia menggunakan NCCL untuk komunikasi antara peranti. Pembangun boleh menyesuaikan operator untuk memenuhi keperluan khusus berdasarkan pembangunan teknologi dan perbezaan permintaan, seperti membangunkan GEMM tersuai berdasarkan cutlass. TensorRT-LLM ialah penyelesaian inferens rasmi NVIDIA, komited untuk menyediakan prestasi tinggi dan terus meningkatkan kepraktisannya. TensorRT-LL

Menurut berita pada 4 April, Pentadbiran Ruang Siber China baru-baru ini mengeluarkan senarai model besar yang didaftarkan, dan "Model Besar Interaksi Bahasa Semula Jadi Jiutian" China Mobile disertakan di dalamnya, menandakan model besar Jiutian AI China Mobile secara rasmi boleh menyediakan tiruan generatif. perkhidmatan perisikan kepada dunia luar. China Mobile menyatakan bahawa ini adalah model berskala besar pertama yang dibangunkan oleh perusahaan pusat yang telah lulus kedua-dua "Pendaftaran Perkhidmatan Kecerdasan Buatan Generatif" nasional dan "Pendaftaran Algoritma Perkhidmatan Sintetik Dalam Domestik" dwi pendaftaran. Menurut laporan, model besar interaksi bahasa semula jadi Jiutian mempunyai ciri-ciri keupayaan industri yang dipertingkatkan, keselamatan dan kredibiliti, dan menyokong penyetempatan timbunan penuh Ia telah membentuk berbilang versi parameter seperti 9 bilion, 13.9 bilion, 57 bilion dan 100 bilion. dan boleh digunakan secara fleksibel dalam Awan, tepi dan hujung adalah situasi yang berbeza

1. Latar Belakang Pengenalan Pertama, mari kita perkenalkan sejarah pembangunan Teknologi Yunwen. Syarikat Teknologi Yunwen...2023 ialah tempoh apabila model besar berleluasa Banyak syarikat percaya bahawa kepentingan graf telah dikurangkan dengan ketara selepas model besar, dan sistem maklumat pratetap yang dikaji sebelum ini tidak lagi penting. Walau bagaimanapun, dengan promosi RAG dan kelaziman tadbir urus data, kami mendapati bahawa tadbir urus data yang lebih cekap dan data berkualiti tinggi adalah prasyarat penting untuk meningkatkan keberkesanan model besar yang diswastakan Oleh itu, semakin banyak syarikat mula memberi perhatian kepada kandungan berkaitan pembinaan pengetahuan. Ini juga menggalakkan pembinaan dan pemprosesan pengetahuan ke peringkat yang lebih tinggi, di mana terdapat banyak teknik dan kaedah yang boleh diterokai. Dapat dilihat bahawa kemunculan teknologi baru tidak mengalahkan semua teknologi lama, tetapi mungkin juga mengintegrasikan teknologi baru dan lama.

Jika soalan ujian terlalu mudah, kedua-dua pelajar terbaik dan pelajar lemah boleh mendapat 90 mata, dan jurang tidak boleh diluaskan... Dengan keluaran model yang lebih kukuh seperti Claude3, Llama3 dan juga GPT-5 kemudiannya, industri berada dalam keperluan mendesak untuk penanda aras model yang lebih sukar dan berbeza. LMSYS, organisasi di sebalik arena model besar, melancarkan penanda aras generasi akan datang, Arena-Hard, yang menarik perhatian meluas. Terdapat juga rujukan terkini untuk kekuatan dua versi arahan Llama3 yang diperhalusi. Berbanding dengan MTBench, yang mempunyai markah yang sama sebelum ini, diskriminasi Arena-Hard meningkat daripada 22.6% kepada 87.4%, yang lebih kuat dan lemah secara sepintas lalu. Arena-Hard dibina menggunakan data manusia masa nyata dari arena dan mempunyai kadar konsistensi 89.1% dengan keutamaan manusia.

Menurut berita pada 13 Jun, menurut akaun awam “Volcano Engine” Byte, pembantu kecerdasan buatan Xiaomi “Xiao Ai” telah mencapai kerjasama dengan Volcano Engine Kedua-dua pihak akan mencapai pengalaman interaktif AI yang lebih pintar berdasarkan model besar beanbao . Dilaporkan bahawa model beanbao berskala besar yang dicipta oleh ByteDance boleh memproses sehingga 120 bilion token teks dengan cekap dan menjana 30 juta keping kandungan setiap hari. Xiaomi menggunakan model besar Doubao untuk meningkatkan keupayaan pembelajaran dan penaakulan modelnya sendiri dan mencipta "Xiao Ai Classmate", yang bukan sahaja memahami keperluan pengguna dengan lebih tepat, tetapi juga menyediakan kelajuan tindak balas yang lebih pantas dan perkhidmatan kandungan yang lebih komprehensif. Contohnya, apabila pengguna bertanya tentang konsep saintifik yang kompleks, &ldq
