Rumah web3.0 IVG: Mengintegrasikan Nilai Manusia ke dalam Model Bahasa Besar pada Masa Inferens

IVG: Mengintegrasikan Nilai Manusia ke dalam Model Bahasa Besar pada Masa Inferens

Oct 03, 2024 pm 03:16 PM
AI Integrated Value Guidance Implicit and Explicit Value Functions Token-Wise Sampling Chunk-Level Beam Search

Penyelidik membangunkan kaedah penjajaran masa Inferens untuk menyepadukan nilai manusia selepas menyempurnakan LLM menggunakan fungsi tersirat dan eksplisit tanpa mengubah model asas.

IVG: Mengintegrasikan Nilai Manusia ke dalam Model Bahasa Besar pada Masa Inferens

Menyepadukan nilai kemanusiaan selepas melatih model dengan algoritma berasaskan Pembelajaran memerlukan LLM yang diperhalusi, yang mahal dari segi pengiraan dan memakan masa. Selain itu, ia menghasilkan tindak balas yang berat sebelah dan tidak diingini oleh pengguna. Model yang cekap boleh menyesuaikan diri dengan pilihan pengguna dalam masa nyata dengan menyepadukan algoritma yang boleh mengganggu pada masa inferens diperlukan. Kaedah ini akan mengelak daripada melatih semula model berulang kali untuk hasil yang diingini dengan membekukan model asas dan mengurangkan kos pengiraan penalaan halus LLM.

Penyelidik membangunkan kaedah penjajaran masa Inferens untuk menyepadukan nilai manusia selepas menyempurnakan LLM menggunakan fungsi tersirat dan eksplisit tanpa mengubah model asas. Fungsi tersirat digunakan untuk penjanaan token, yang menjalankan penilaian perkataan demi perkataan dan memilih output dengan kebarangkalian tertinggi. Sebaliknya, fungsi eksplisit memerlukan struktur tegar untuk menilai ketulan teks yang lebih besar dan menjana urutan perkataan berikut dengan kebarangkalian tertinggi sambil mengekalkan konteks keseluruhan. Fungsi eksplisit tidak fleksibel dan mahal dari segi pengiraan, gagal menangani pengoptimuman peringkat token, manakala fungsi tersirat menghadapi isu kebolehtafsiran dan memerlukan hantaran hadapan yang kerap, yang membawa kepada kecekapan masa nyata yang rendah.

Untuk menangani kelemahan kedua-dua fungsi, kaedah yang dicadangkan, Bimbingan Nilai Bersepadu (IVG), menggabungkan pengoptimuman tahap token fungsi tersirat dan perspektif yang lebih luas fungsi eksplisit. Ia dapat menangkis cabaran penyesuaian dan pertukaran dalam keberkesanan penjajaran, yang membawa kepada penurunan percanggahan prestasi dan menjadikannya lebih mudah untuk dilaksanakan. Kelebihan ini memudahkan prestasi yang lebih baik pada tugas seperti penjanaan sentimen terkawal dan ringkasan. IVG, digabungkan dengan model yang lebih kecil seperti GPT-2, boleh bersaing dengan model yang lebih tinggi.

IVG menggabungkan dua fungsi nilai, fungsi tersirat dan eksplisit, untuk menyelaraskan model dengan nilai manusia. Pertama, pensampelan mengikut token memperhalusi token individu kepada panjang jujukan tertentu, menjana berbilang jujukan. Kemudian, carian rasuk peringkat ketulan membandingkan kebarangkalian jujukan ini dan memilih satu yang mempunyai kebarangkalian tertinggi. Walaupun kaedah ini memastikan bahawa output lebih mantap, kuasa pengiraan meningkat semasa masa inferens disebabkan oleh hantaran ke hadapan yang kerap, yang membawa kepada tindak balas yang lebih perlahan.

Penyelidik telah menggunakan dua set-up percubaan untuk menilai IVG: 1. Penjanaan sentimen terkawal dan Rumusan, dan 2. Mengikuti arahan. Dalam yang pertama, keluarga model GPT-2 digunakan dengan memanfaatkan set data sintetik daripada model ganjaran emas untuk menjana ulasan filem yang positif dan meringkaskan siaran Reddit. Sebagai perbandingan, yang kedua memerlukan model yang ditala arahan, AlpacaEval 2.0. Ia menggunakan Tulu Guidance, yang menggunakan model khusus untuk fungsi tersirat dan melatih model berasaskan ganjaran untuk fungsi eksplisit, dan Ultraguidance, yang memperhalusi model dengan Pengoptimuman Keutamaan Terus (DPO) untuk kedua-dua fungsi. GPT-4-turbo telah digunakan sebagai rujukan untuk menilai respons dalam percubaan kedua, dan IVG secara konsisten menunjukkan prestasi yang baik.

Selain dua eksperimen ini, kajian ablasi membuktikan bahawa Carian Rasuk Tahap Chunk (CBS) mempunyai kecekapan kelajuan yang lebih tinggi daripada Penalaan Halus Emulator (EFT), yang menggunakan fungsi tersirat untuk penalaan halus. Keputusan ini telah membuktikan bahawa CBS adalah lebih baik untuk digunakan dalam amalan.

Kesimpulannya, Bimbingan Nilai Bersepadu (IVG) menawarkan pendekatan baru dan cekap untuk menyelaraskan model bahasa besar dengan keutamaan manusia semata-mata pada masa inferens, memintas kerumitan penalaan halus tradisional. Dengan memanfaatkan fungsi nilai tersirat dan eksplisit, IVG meningkatkan prestasi dalam kedua-dua pensampelan mengikut token dan penyahkodan tahap ketulan, seperti yang ditunjukkan melalui peningkatan ketara dalam penjanaan sentimen, ringkasan dan tugasan mengikut arahan. Keputusan menunjukkan bahawa IVG ialah kaedah serba boleh, memberikan bukti empirikal yang kukuh tentang keupayaannya untuk mengatasi pendekatan sedia ada, menjadikannya penyelesaian yang menjanjikan untuk memperhalusi model besar dalam aplikasi dunia sebenar.

Jangan Lupa sertai 50k ML SubReddit kami

Ingin tampil di hadapan 1 Juta Pembaca AI? Bekerjasama dengan kami di sini

Atas ialah kandungan terperinci IVG: Mengintegrasikan Nilai Manusia ke dalam Model Bahasa Besar pada Masa Inferens. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Pasaran Intel (INTL) Boleh Menjadi Kripto Tahun Ini kerana Pemegang Cardano (ADA) Mempelbagaikan Menjelang Hard Fork Pasaran Intel (INTL) Boleh Menjadi Kripto Tahun Ini kerana Pemegang Cardano (ADA) Mempelbagaikan Menjelang Hard Fork Aug 25, 2024 am 03:49 AM

Pasaran kripto sedang mengalami anjakan sentimen yang ketara apabila modal terpinggir mula masuk. Projek seperti Near Protocol (NEAR) dan Cardano (ADA) sedang hangat untuk menjangkakan perhimpunan yang akan datang.

Shytoshi Kusama Petunjuk untuk Kerjasama Akan Datang dengan AI Project NFA Labs Shytoshi Kusama Petunjuk untuk Kerjasama Akan Datang dengan AI Project NFA Labs Aug 09, 2024 am 06:27 AM

Shytoshi Kusama, tokoh misteri yang menerajui ekosistem Shiba Inu, telah mencetuskan spekulasi mengenai kerjasama yang akan datang dengan projek AI.

Coinbase dan Tether Memperkenalkan Platform Dikuasakan AI untuk Memperkasakan Pembangun dalam Ruang Blockchain Coinbase dan Tether Memperkenalkan Platform Dikuasakan AI untuk Memperkasakan Pembangun dalam Ruang Blockchain Oct 29, 2024 am 03:24 AM

Platform “Agen Berasaskan” Coinbase dan SDK AI Tempatan Tether bertujuan untuk memudahkan pembangunan ejen mata wang kripto dipacu AI.

Apple AI Akan Menjadi Penukar Permainan, AI Syiling Kemungkinan Berhimpun Minggu Depan Apple AI Akan Menjadi Penukar Permainan, AI Syiling Kemungkinan Berhimpun Minggu Depan Sep 09, 2024 am 03:15 AM

Apple sudah bersedia untuk pelancaran iPhone 16 pada hari Isnin, bersiap sedia untuk dorongan besar kepada AI generatif dengan memperkenalkannya kepada pengguna iPhonenya

Firecoin Meningkatkan $1.2M untuk Membawa Cerapan Token Dikuasakan AI kepada Ekosistem TON Firecoin Meningkatkan $1.2M untuk Membawa Cerapan Token Dikuasakan AI kepada Ekosistem TON Oct 25, 2024 am 12:12 AM

Melabur dalam pasaran kripto boleh menjadi sangat menguntungkan, dengan token baharu kadang-kadang menghasilkan lebih daripada 160,000% dalam pulangan tahunan untuk pelabur.

Launchpool Inkubasi ONAI, Ekosistem AI Berdasarkan Rantaian TON Launchpool Inkubasi ONAI, Ekosistem AI Berdasarkan Rantaian TON Aug 05, 2024 pm 03:32 PM

Perkongsian ini menandakan kemajuan penting ke arah menyepadukan ejen AI komersial dan automasi ke dalam ruang Web3.

Sui (SUI) dan GoodEgg (GEGG): Dua Projek Menjanjikan untuk Ditonton dalam Pasaran Matawang Kripto September Sui (SUI) dan GoodEgg (GEGG): Dua Projek Menjanjikan untuk Ditonton dalam Pasaran Matawang Kripto September Sep 12, 2024 pm 09:01 PM

Memandangkan pasaran mata wang kripto menghadapi trend yang berubah-ubah, pelabur yang bijak mula mengalihkan perhatian mereka ke arah projek baru muncul yang menunjukkan daya tahan dan potensi pertumbuhan. Dengan kebimbangan mengenai trajektori harga yang tidak menentu Bitcoin (BTC).

Walaupun Naratif 'Syiling Mati', Cardano (ADA) Mengekalkan Kedudukan Sepuluh Teratas, Meneroka Integrasi AI Walaupun Naratif 'Syiling Mati', Cardano (ADA) Mengekalkan Kedudukan Sepuluh Teratas, Meneroka Integrasi AI Aug 17, 2024 am 06:41 AM

Dalam beberapa bulan kebelakangan ini, Cardano [ADA] telah menghadapi kritikan, dengan sesetengah pihak melabelkannya sebagai "syiling mati" disebabkan oleh aliran harganya. Walau bagaimanapun, walaupun ini negatif