Google baru-baru ini mengeluarkan kenyataan akhbar yang mengumumkan pelancaran rangka kerja latihan ASPIRE, yang direka khas untuk model bahasa besar. Rangka kerja ini bertujuan untuk meningkatkan keupayaan ramalan terpilih model AI.
Google menyebut bahawa model bahasa besar sedang berkembang pesat dalam pemahaman bahasa semula jadi dan penjanaan kandungan, dan telah digunakan untuk membina pelbagai aplikasi inovatif, tetapi masih tidak sesuai untuk menggunakannya pada situasi membuat keputusan berisiko tinggi. Ini disebabkan oleh ketidakpastian dan kemungkinan "halusinasi" dalam ramalan model Oleh itu, Google telah membangunkan rangka kerja latihan ASPIRE, yang memperkenalkan mekanisme "kredibiliti" kepada satu siri model , setiap Jawapan semuanya akan mempunyai skor kebarangkalian untuk betul .
▲ Sumber imej Siaran akhbar Google (sama di bawah) Di peringkat teknikal, rangka kerja latihan boleh dibahagikan kepada tiga peringkat: pelarasan khusus tugasan, pensampelan jawapan dan pembelajaran penilaian kendiri. Peringkat "pelarasan tugas khusus" adalah untuk menjalankan latihan mendalam model bahasa berskala besar yang telah menerima latihan asas,memfokuskan kepada pengukuhan keupayaan ramalan model. Penyelidik terutamanya memperkenalkan satu siri parameter boleh laras kepada model dan memperhalusi model bahasa pra-latihan pada set data latihan tugasan tertentu, dengan itu meningkatkan prestasi ramalan model dan membolehkan model menyelesaikan masalah tertentu dengan lebih baik.
Peringkat kedua ialah "persampelan jawapan". Selepas penalaan halus tertentu, model boleh menggunakan parameter boleh laras yang dipelajari sebelum ini untuk menjana jawapan yang berbeza bagi setiap soalan latihan dan mencipta set data untuk pembelajaran penilaian kendiri satu siri jawapan dengan kredibiliti tinggi.Para penyelidik menggunakan kedua-dua kaedah "Carian Pancaran" dan algoritma Rouge-L untuk menilai kualiti jawapan, dan memasukkan semula jawapan dan markah yang dijana ke dalam model untuk memulakan peringkat ketiga.
Dalam peringkat ketiga "pembelajaran penilaian kendiri", para penyelidik menambah set parameter boleh laras pada model khusus untuk meningkatkan keupayaan penilaian kendiri model.Matlamat peringkat ini adalah untuk membiarkan model belajar "menghakimi ketepatan jawapan output dengan sendirinya", supaya apabila model bahasa besar menjana jawapan, ia juga akan melampirkan skor kebarangkalian jawapan yang betul.
Penyelidik Google menggunakan tiga set data soal jawab, CoQA, TriviaQA dan SQuAD, untuk mengesahkan keputusan rangka kerja latihan ASPIRE Dikatakan bahawa "model kecil OPT-2.7B yang diselaraskan oleh ASPIRE jauh mengatasi OPT- yang lebih besar. model 30B." Keputusan eksperimen juga menunjukkan bahawa dengan pelarasan yang sesuai, walaupun model bahasa yang kecil boleh mengatasi model bahasa yang besar dalam beberapa senario. Para penyelidik membuat kesimpulan bahawalatihan rangka kerja ASPIRE boleh meningkatkan ketepatan output model bahasa besar dengan ketara, malah model yang lebih kecil boleh membuat ramalan "tepat dan yakin" selepas penalaan halus.
Atas ialah kandungan terperinci Google mengeluarkan ASPIRE, rangka kerja latihan model yang membolehkan AI menilai ketepatan output secara bebas. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!