Rumah > Peranti teknologi > AI > Google mengeluarkan ASPIRE, rangka kerja latihan model yang membolehkan AI menilai ketepatan output secara bebas

Google mengeluarkan ASPIRE, rangka kerja latihan model yang membolehkan AI menilai ketepatan output secara bebas

王林
Lepaskan: 2024-01-23 17:36:10
ke hadapan
1163 orang telah melayarinya

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

Google baru-baru ini mengeluarkan kenyataan akhbar yang mengumumkan pelancaran rangka kerja latihan ASPIRE, yang direka khas untuk model bahasa besar. Rangka kerja ini bertujuan untuk meningkatkan keupayaan ramalan terpilih model AI.

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

Google menyebut bahawa model bahasa besar sedang berkembang pesat dalam pemahaman bahasa semula jadi dan penjanaan kandungan, dan telah digunakan untuk membina pelbagai aplikasi inovatif, tetapi masih tidak sesuai untuk menggunakannya pada situasi membuat keputusan berisiko tinggi. Ini disebabkan oleh ketidakpastian dan kemungkinan "halusinasi" dalam ramalan model Oleh itu, Google telah membangunkan rangka kerja latihan ASPIRE, yang memperkenalkan mekanisme "kredibiliti" kepada satu siri model , setiap Jawapan semuanya akan mempunyai skor kebarangkalian untuk betul .

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

▲ Sumber imej Siaran akhbar Google (sama di bawah)

Di peringkat teknikal, rangka kerja latihan boleh dibahagikan kepada tiga peringkat: pelarasan khusus tugasan, pensampelan jawapan dan pembelajaran penilaian kendiri.

Peringkat "pelarasan tugas khusus" adalah untuk menjalankan latihan mendalam model bahasa berskala besar yang telah menerima latihan asas,

memfokuskan kepada pengukuhan keupayaan ramalan model. Penyelidik terutamanya memperkenalkan satu siri parameter boleh laras kepada model dan memperhalusi model bahasa pra-latihan pada set data latihan tugasan tertentu, dengan itu meningkatkan prestasi ramalan model dan membolehkan model menyelesaikan masalah tertentu dengan lebih baik.

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

Peringkat kedua ialah "persampelan jawapan". Selepas penalaan halus tertentu, model boleh menggunakan parameter boleh laras yang dipelajari sebelum ini untuk menjana jawapan yang berbeza bagi setiap soalan latihan dan mencipta set data untuk pembelajaran penilaian kendiri satu siri jawapan dengan kredibiliti tinggi.

Para penyelidik menggunakan kedua-dua kaedah "Carian Pancaran" dan algoritma Rouge-L untuk menilai kualiti jawapan, dan memasukkan semula jawapan dan markah yang dijana ke dalam model untuk memulakan peringkat ketiga.

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

Dalam peringkat ketiga "pembelajaran penilaian kendiri", para penyelidik menambah set parameter boleh laras pada model khusus untuk meningkatkan keupayaan penilaian kendiri model.

Matlamat peringkat ini adalah untuk membiarkan model belajar "menghakimi ketepatan jawapan output dengan sendirinya", supaya apabila model bahasa besar menjana jawapan, ia juga akan melampirkan skor kebarangkalian jawapan yang betul.

Penyelidik Google menggunakan tiga set data soal jawab, CoQA, TriviaQA dan SQuAD, untuk mengesahkan keputusan rangka kerja latihan ASPIRE Dikatakan bahawa "model kecil OPT-2.7B yang diselaraskan oleh ASPIRE jauh mengatasi OPT- yang lebih besar. model 30B." Keputusan eksperimen juga menunjukkan bahawa dengan pelarasan yang sesuai, walaupun model bahasa yang kecil boleh mengatasi model bahasa yang besar dalam beberapa senario.

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

Para penyelidik membuat kesimpulan bahawa

latihan rangka kerja ASPIRE boleh meningkatkan ketepatan output model bahasa besar dengan ketara, malah model yang lebih kecil boleh membuat ramalan "tepat dan yakin" selepas penalaan halus.

Atas ialah kandungan terperinci Google mengeluarkan ASPIRE, rangka kerja latihan model yang membolehkan AI menilai ketepatan output secara bebas. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:51cto.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan