Rumah > Peranti teknologi > AI > teks badan

Dijual dalam talian! Forum teknologi Heart of Machine AI yang pertama mencapai kesimpulan yang berjaya. Maklumat teknikal model besar ini patut ditonton berulang kali.

PHPz
Lepaskan: 2023-09-14 09:49:02
ke hadapan
599 orang telah melayarinya

线上开售!首场机器之心 AI 技术论坛圆满收官,这些大模型技术干货值得反复观看

Kecerdasan buatan telah memasuki era model besar, yang akan mengubah sepenuhnya model pelaksanaan AI dalam pelbagai industri, dan juga mengemukakan keperluan kemahiran AI baharu untuk R&D dan pengamal teknikal dalam pelbagai industri.

Untuk membantu menaik taraf teknologi model besar, kami mengadakan acara yang dipanggil "Llama 2 Large Model Algorithm and Application Practice" Forum teknologi AI ini telah berjaya dimuktamadkan. Pada hari acara itu, dewan pelbagai fungsi di tingkat dua Menara B Pusat Wangjing Pohang di Beijing dipenuhi 200 peserta dari lebih sepuluh bandar di seluruh negara. Di bawah bimbingan empat pakar teknologi model besar, kami mengkaji secara sistematik teknologi model besar yang mendasari Llama 2, dan secara peribadi membina model besar eksklusif kami sendiri, dan bersama-sama menyelesaikan peningkatan teknologi model besar

线上开售!首场机器之心 AI 技术论坛圆满收官,这些大模型技术干货值得反复观看

Diperoleh daripada Acara Acara ini mendapat pujian secara meluas oleh para peserta

Kandungan adalah berkualiti tinggi, melebihi jangkaan, penerangan yang menarik dan mendalam, pertukaran Soal Jawab di tapak adalah mencerahkan, dan perkhidmatan yang komprehensif dan bertimbang rasa... Peserta memberikan acara pujian meluas dan menyatakan keinginan mereka untuk lebih tahap harapan kandungan yang kaya dan mendalam mengenai aktiviti teknikal.

Selain itu, kerana jarak bandar, jadual perjalanan dan sebab-sebab lain, ramai rakan-rakan yang berminat dengan majlis tersebut malangnya tidak dapat hadir ke venue. Untuk menjawab keperluan pembelajaran dan amalan semua orang, stesen pengetahuan rasmi laman web ini (https://vtizr.xet.tech/s/1GOWfs) kini dalam talian dengan video langsung forum ini. Set penuh video berharga 699 yuan (selepas pembelian berjaya, sila tambah ID pembantu tapak web ini: 13661489516 untuk mendapatkan pakej bahan pembelajaran pra dan pasca persidangan yang menyokong). Beli kursus sekarang dan mulakan perjalanan anda menaik taraf teknologi model besar!

Penjelasan sistematik: kemajuan teknologi terkini dan kes aplikasi canggih

线上开售!首场机器之心 AI 技术论坛圆满收官,这些大模型技术干货值得反复观看

Liu Pengfei, profesor bersekutu di Institut Penyelidikan Qingyuan Universiti Jiao Tong Shanghai dan ketua Kumpulan Penyelidikan Kepintaran Buatan Generatif

GAIR

"Latih model Ia cukup teliti dan boleh mencapai prestasi yang sangat baik dalam model yang agak kecil."

Llama 2 ialah model bahasa pra-latihan dengan tahap keaslian tertinggi, butiran teknikal latihan yang paling telus dan reputasi terbaik di pasaran, serta mempunyai nilai penyelidikan yang sangat tinggi. Kali ini Liu Pengfei mengambil "Tafsiran Teknikal Model Besar Llama 2" Bermula dari latar belakang kelahiran LLaMA, konsep-konsep penting, teknologi latihan Llama 2 dan teknologi penjajaran, Liu Pengfei mentafsir secara mendalam butiran tindanan teknologi yang terlibat. dalam Llama 2 dan versi Sembangnya Dia juga berkongsi pengalaman praktikalnya dalam pengoptimuman, termasuk butiran teknikal seperti pemberat sumber data dan pensampelan, dan membincangkan kesukaran dalam menerobos pembangunan model besar

线上开售!首场机器之心 AI 技术论坛圆满收官,这些大模型技术干货值得反复观看

Teknologi NLP Liu Shuo lama. pengarang akaun awam dan peminat sumber terbuka Liu Huanyong

Ditulis semula: Model asas mempunyai keperluan yang sangat tinggi pada kuasa pengkomputeran dan algoritma Oleh itu, dalam lebih banyak aplikasi industri, ia dipilih untuk membina model industri yang besar berdasarkan model asas dan seterusnya membahagikan lagi. padang. Speaker Liu Huanyong berkata: "Berdasarkan model industri yang besar, model asas mengandungi kurang data medan menegak, yang terdedah kepada halusinasi dan kesannya tidak memuaskan walaupun Llama bukanlah pilihan terbaik untuk pasaran China, kerana ia adalah pertama menjadi sumber terbuka dan boleh Untuk kegunaan komersil, kes-kes pelaksanaan industri yang kaya terkumpul adalah sangat berharga

Beliau berkongsi perbandingan model siri Llama dengan model sumber terbuka lain dan mekanisme Chinaisasinya di bawah tajuk "Tafsiran Paradigma Praktikal dan Kes untuk Pelaksanaan Industri Berdasarkan Model Sumber Terbuka Siri Llama". Mentafsir kes model penalaan halus domain berdasarkan model siri Llama dan kes pelaksanaan "berdasarkan model siri Llama + peningkatan pangkalan pengetahuan". Ia meringkaskan keadaan kuasa pengkomputeran, kuantiti data dan keperluan kualiti, ROI dan senario dan syarat lain yang diperlukan untuk model penalaan halus industri dalam bidang industri Ia menekankan bahawa bentuk pelaksanaan model besar dalam industri mungkin data heterogen berbilang sumber. analisis pintar dokumen, spesifikasi asas pengetahuan.

线上开售!首场机器之心 AI 技术论坛圆满收官,这些大模型技术干货值得反复观看Shi Yemin, Ketua Pegawai Eksekutif LinkSoul.AI dan pemula projek Llama 2 7B Cina

Dengan pembangunan teknologi model besar, model besar berbilang modal semakin menjadi kunci untuk memacu kecerdasan yang terkandung dan pengalaman pengguna yang lebih baik, dan pasti akan menjadi Komponen utama teknologi kecerdasan buatan generasi akan datang. Transformasi berasaskan LLM kini merupakan salah satu penyelesaian model berbilang modal terbaik dan mempunyai penyelidikan dan nilai praktikal yang hebat.

Shi Yemin bercakap tentang tema "Teknologi dan Amalan Model Besar Multimodal Berdasarkan Llama 2", berkongsi mod dan prinsip model multimodal, dan membincangkan secara mendalam model besar multimodal visual dan amalan Penambahbaikan multimodal pertuturan untuk model besar. Beliau menyebut bagaimana model lama boleh menyokong modaliti baharu dan apakah perkara utama yang perlu diberi perhatian apabila mempertimbangkan keupayaan baharu. Selain itu, beliau turut memperkenalkan beberapa penyelesaian untuk penambahbaikan pelbagai modal dan menekankan perkara yang perlu diberi perhatian dalam butiran latihan. Shi Yemin percaya bahawa cabaran terbesar model multimodal terletak pada data Dia berkongsi beberapa kaedah dan laluan untuk menjana gambar atau data grafik berdasarkan model

线上开售!首场机器之心 AI 技术论坛圆满收官,这些大模型技术干货值得反复观看

Penginjil model berskala besar China adalah penyumbang kepada Llama 2 7B

.

Dalam tinjauan acara ini, kandungan aplikasi industri yang paling diberi perhatian oleh peserta ialah "kuantifikasi dan penalaan halus". Dalam perkongsiannya, Su Yang memperkenalkan kandungan istimewa "Kuantiti Model Sumber Terbuka Llama 2 dan Amalan Penalaan Halus Kos Rendah", termasuk status semasa ekologi model sumber terbuka dan ekologi Llama, kuantifikasi arus perdana dan penyelesaian penalaan halus, dan kemudahan dua perkara ini#🎜 🎜#

"Untuk penalaan halus, adalah disyorkan untuk menggunakan penyelesaian Sota yang dikongsi oleh industri sumber terbuka, dan bukannya mengejar keaslian secara membuta tuli." penalaan agak praktikal berdasarkan mengikut pelbagai prinsip. Proses pengkuantifikasian model sebenar bukanlah satu proses yang mudah untuk semua. Terdapat banyak dimensi dan parameter Kuantifikasi atau transformasi yang paling munasabah mesti dilakukan pada setiap lapisan dan lajur juga perlu mengambil kira yang khusus persekitaran latihan, persekitaran perkakasan dan Persekitaran asas, Su Yang memberikan penjelasan yang mendalam tentang perkara ini.

线上开售!首场机器之心 AI 技术论坛圆满收官,这些大模型技术干货值得反复观看

线上开售!首场机器之心 AI 技术论坛圆满收官,这些大模型技术干货值得反复观看

#🎜🎜 ##🎜 sesi latihan sedang berjalan Selepas tafsiran teknikal terperinci dan analisis kes, Shi Yemin dan Su Yang mengetuai para hadirin untuk memulakan latihan model besar, kuantifikasi dan amalan penalaan halus. 线上开售!首场机器之心 AI 技术论坛圆满收官,这些大模型技术干货值得反复观看

Shi Yemin menumpukan pada pemilihan model asas, kemahiran latihan dan pengalaman, termasuk dua laluan: latihan dari awal berdasarkan model asas dan latihan pengembangan kosa kata berdasarkan model sumber terbuka, serta seni bina yang sepadan, saiz model, sama ada Boleh digunakan secara komersil, sama ada untuk mengembangkan senarai perbendaharaan kata dan syarat penapisan lain, dan menjawab set data SFT dan soalan lain yang berkaitan.

Su Yang mengetuai peserta di tapak untuk menyelesaikan satu siri operasi, termasuk menggunakan imej, memuatkan model, memuatkan set data, menetapkan parameter QLoRA, mengkonfigurasi parameter SFT, menggunakan pakej parameter pengubah, dsb. Melalui penalaan halus, model persendirian yang besar berjaya dijalankan untuk membantu peserta menyerap lebih baik kandungan acara ini

Pada masa hadapan, kami akan terus memberi perhatian dan menjejaki perkembangan terkini dalam industri dan pembangunan pembangun Untuk memenuhi permintaan, kami akan terus mengadakan aktiviti teknikal berskala besar berkualiti tinggi untuk membantu pembangun dengan cepat meningkatkan amalan kejuruteraan dan keupayaan aplikasi inovatif mereka, dan bersedia untuk era model besar. Selamat datang semua orang untuk terus memberi perhatian kepada aktiviti forum teknologi AI kami

Atas ialah kandungan terperinci Dijual dalam talian! Forum teknologi Heart of Machine AI yang pertama mencapai kesimpulan yang berjaya. Maklumat teknikal model besar ini patut ditonton berulang kali.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:jiqizhixin.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan