Halusinasi
LLM ialah fenomena di mana model bahasa besar (LLM) menjana output yang tidak bermakna atau tidak tepat yang tidak mengikut corak atau objek sebenar. Output AI yang salah ini berpunca daripada pelbagai faktor, termasuk:
Overfitting: LLM mempelajari bunyi bising dan berat sebelah dalam data latihan sebagai corak, menyebabkan model menghasilkan output yang salah pada data ujian.
Kerumitan model yang tinggi: LLM mempunyai kerumitan model yang tinggi, yang membolehkan mereka melihat korelasi yang tidak wujud, dengan itu mencipta ilusi.
Syarikat utama yang membangunkan sistem AI generatif sedang mengambil langkah untuk menangani masalah halusinasi AI, walaupun sesetengah pakar percaya menghapuskan sepenuhnya keluaran yang salah mungkin mustahil.
Google menghubungkan modelnya ke Internet untuk melatih respons darat daripada data dan maklumat rangkaian, dengan itu mengurangkan pemasangan berlebihan.
OpenAI menggunakan maklum balas manusia dan pembelajaran pengukuhan untuk memperhalusi output ChatGPT. Mereka mencadangkan "penyeliaan proses" yang memberi ganjaran kepada model untuk langkah penaakulan yang betul, bukan hanya jawapan akhir. Ini boleh meningkatkan kebolehjelasan, tetapi ada yang mempersoalkan keberkesanannya terhadap fabrikasi.
Walaupun terdapat risiko halusinasi AI, syarikat dan pengguna masih boleh mengambil langkah untuk mengimbangi dan mengehadkan potensi bahaya mereka. Berikut ialah beberapa cara untuk menyelesaikannya:
Gunakan data latihan berkualiti tinggi
Menggunakan data latihan berkualiti tinggi adalah kunci untuk mengurangkan halusinasi AI. Data latihan berkualiti tinggi hendaklah pelbagai, seimbang, tersusun dengan baik dan mencerminkan situasi dunia sebenar.
Jelaskan Tujuan Penggunaan
Mentakrifkan dengan jelas tujuan khusus dan penggunaan yang dibenarkan bagi sistem AI boleh membantu menjauhkannya daripada kandungan halusinasi. Pembangun dan pengguna harus memahami dengan jelas fungsi dan kegunaan model kecerdasan buatan dan mematuhinya dengan tegas apabila menggunakannya.
Gunakan templat data untuk membimbing output kecerdasan buatan
Menggunakan templat data berstruktur boleh membantu model kecerdasan buatan menjana output yang mematuhi corak yang dijangkakan. Templat ini menyediakan format yang konsisten untuk input data ke dalam model dan mengehadkan skop inferens model.
Limit Reaction
Menetapkan kekangan dan had pada potensi keluaran model boleh mengurangkan spekulasi yang tidak terkawal. Sebagai contoh, anda boleh menentukan ambang kebarangkalian yang jelas dan menggunakan alat penapisan untuk menapis respons yang tidak memenuhi jangkaan.
Menguji dan menambah baik sistem secara berterusan
Melalui ujian menyeluruh dan pemantauan berterusan, prestasi sistem kecerdasan buatan boleh dipertingkatkan secara berterusan. Menilai output boleh mengenal pasti kawasan yang memerlukan tweaker, manakala data baharu boleh digunakan untuk melatih semula model dan mengemas kini pengetahuannya.
Bergantung pada pengawasan manusia
Termasuk pengawasan manusia boleh memberikan perlindungan kritikal. Apabila pakar manusia menyemak output, mereka boleh menangkap dan membetulkan sebarang kandungan ilusi melalui pertimbangan kontekstual.
Thought Prompt Chain
Thought Prompt Chain ialah teknologi yang membantu model kecerdasan buatan melakukan penaakulan pelbagai langkah dengan menyediakan rantaian pemikiran logik. Pendekatan ini boleh meningkatkan prestasi model kecerdasan buatan dalam tugasan seperti matematik.
Penguraian Tugas dan Ejen
Penguraian Tugas dan Ejen ialah kaedah untuk meningkatkan prestasi model kecerdasan buatan dengan memecahkan tugas yang kompleks kepada berbilang subtugas. Kaedah ini boleh mengambil kesempatan daripada kelebihan model kecerdasan buatan yang berbeza dan meningkatkan keupayaan penaakulan model kecerdasan buatan.
Halusinasi kecerdasan buatan adalah satu cabaran untuk pembangunan kecerdasan buatan, tetapi dengan mengambil langkah yang berkesan, risikonya dapat dikurangkan dengan berkesan.
Atas ialah kandungan terperinci Bagaimana untuk mengurangkan halusinasi model bahasa yang besar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!