Pembelajaran mesin telah mencapai kemajuan yang besar baru-baru ini, tetapi masih terdapat cabaran besar: keperluan untuk sejumlah besar data berlabel untuk melatih model.
Kadangkala data jenis ini tidak tersedia di dunia nyata. Ambil penjagaan kesihatan sebagai contoh, kita mungkin tidak mempunyai imbasan X-ray yang mencukupi untuk memeriksa penyakit baharu. Tetapi melalui pembelajaran beberapa pukulan, model boleh mempelajari pengetahuan daripada beberapa contoh sahaja!
Jadi pembelajaran beberapa pukulan (FSL) ialah subbidang pembelajaran mesin, yang menyelesaikan tugas mempelajari tugasan baharu dengan hanya bilangan kecil masalah contoh berlabel. Inti FSL adalah untuk membolehkan model pembelajaran mesin mempelajari perkara baharu dengan sedikit data, yang berguna dalam situasi di mana pengumpulan sekumpulan data berlabel adalah terlalu mahal, mengambil masa terlalu lama atau tidak praktikal.
Sokongan set sampel/pertanyaan: gunakan sebilangan kecil imej untuk mengklasifikasikan set pertanyaan.
Terdapat tiga kaedah utama untuk difahami dalam pembelajaran beberapa pukulan: pembelajaran meta, peringkat data dan peringkat parameter.
Meta-pembelajaran (belajar cara belajar). Kaedah ini melatih model untuk mempelajari cara mempelajari tugasan baharu dengan cekap. Model ini adalah tentang mengenal pasti persamaan antara tugasan yang berbeza dan menggunakan pengetahuan ini untuk mempelajari perkara baharu dengan cepat dengan beberapa contoh.
Algoritma meta-pembelajaran biasanya melatih model pada set tugasan yang berkaitan dan belajar mengekstrak ciri bebas tugas dan khusus tugas daripada data yang tersedia. Ciri bebas tugasan menangkap pengetahuan umum tentang data, manakala ciri khusus tugasan menangkap butiran tugas semasa. Semasa latihan, algoritma belajar menyesuaikan diri dengan tugasan baharu dengan mengemas kini parameter model menggunakan hanya beberapa contoh berlabel bagi setiap tugasan baharu. Ini membolehkan model membuat generalisasi kepada tugasan baharu dengan beberapa contoh.
Kaedah peringkat data memfokuskan pada mengembangkan data sedia ada, yang boleh membantu model memahami struktur asas data dengan lebih baik, dengan itu meningkatkan prestasi generalisasi model.
Idea utama adalah untuk mencipta contoh baharu dengan menggunakan pelbagai transformasi pada contoh sedia ada, yang boleh membantu model memahami dengan lebih baik struktur asas data.
Terdapat dua jenis kaedah peringkat data:
Kaedah peringkat data:
Matlamat kaedah peringkat parameter ialah untuk mempelajari perwakilan ciri yang lebih mantap yang boleh digeneralisasikan dengan lebih baik kepada tugasan baharu.
Terdapat dua kaedah peringkat parameter:
Algoritma meta-pembelajaran
Algoritma meta-pembelajaran boleh dibahagikan secara meluas kepada dua jenis: berasaskan metrik dan berasaskan kecerunan.
Pembelajaran meta berasaskan metrik
Algoritma berasaskan metrik yang popular ialah Rangkaian Siam, yang mempelajari cara mengukur jarak antara dua contoh input dengan menggunakan dua sub-rangkaian yang sama. Sub-rangkaian ini menjana perwakilan ciri untuk setiap contoh input dan kemudian membandingkan outputnya menggunakan ukuran jarak seperti jarak Euclidean atau persamaan kosinus.
Pembelajaran berasaskan meta kecerunan
Algoritma ini melatih model untuk mempelajari set parameter awal dan cepat menyesuaikan diri dengan tugasan baharu dengan hanya beberapa contoh. MAML (model-agnostik meta-pembelajaran) ialah algoritma meta-pembelajaran berasaskan kecerunan yang popular yang mempelajari cara mengoptimumkan parameter model untuk menyesuaikan diri dengan cepat kepada tugasan baharu. Ia melatih model melalui satu siri tugasan yang berkaitan dan mengemas kini parameter model menggunakan beberapa contoh daripada setiap tugasan. Setelah model mempelajari parameter ini, ia boleh memperhalusinya menggunakan contoh lain daripada tugas semasa, meningkatkan prestasinya.
FSL mempunyai beberapa algoritma, termasuk:
Idea utama MAML adalah untuk mempelajari pemulaan parameter model yang boleh disesuaikan dengan tugasan baharu dengan beberapa contoh. Semasa latihan, MAML menerima satu set tugasan yang berkaitan dan belajar mengemas kini parameter model menggunakan hanya beberapa contoh berlabel bagi setiap tugasan. Proses ini membolehkan model membuat generalisasi kepada tugasan baharu dengan mempelajari pemulaan parameter model yang baik yang boleh disesuaikan dengan cepat kepada tugasan baharu.
Rangkaian Padanan ialah satu lagi algoritma pengelasan imej beberapa tangkapan yang biasa digunakan. Daripada mempelajari metrik atau parameter tetap, ia mempelajari metrik dinamik berdasarkan set sokongan semasa. Ini bermakna metrik yang digunakan untuk membandingkan imej pertanyaan dan set sokongan berbeza untuk setiap imej pertanyaan.
Algoritma rangkaian padanan menggunakan mekanisme perhatian untuk mengira jumlah wajaran ciri set sokongan untuk setiap imej pertanyaan. Pemberatan dipelajari berdasarkan persamaan antara imej pertanyaan dan setiap imej set sokongan. Jumlah wajaran ciri set sokongan kemudiannya digabungkan dengan ciri imej pertanyaan, dan vektor yang terhasil disalurkan melalui beberapa lapisan bersambung sepenuhnya untuk menghasilkan klasifikasi akhir.
Rangkaian Prototaip ialah algoritma pengelasan imej beberapa sampel yang mudah dan berkesan. Ia mempelajari perwakilan imej dan mengira prototaip untuk setiap kelas menggunakan purata ciri pembenaman contoh sokongan. Semasa ujian, jarak antara imej pertanyaan dan setiap prototaip kelas dikira dan kelas dengan prototaip terdekat diberikan kepada pertanyaan.
Rangkaian perhubungan belajar membandingkan pasangan contoh dalam set sokongan dan menggunakan maklumat ini untuk mengklasifikasikan contoh pertanyaan. Rangkaian perhubungan merangkumi dua sub-rangkaian: rangkaian pembenaman ciri dan rangkaian perhubungan. Rangkaian pembenaman ciri memetakan setiap contoh dalam set sokongan dan contoh pertanyaan ke dalam ruang ciri. Rangkaian hubungan kemudian mengira skor hubungan antara contoh pertanyaan dan setiap contoh set sokongan. Akhirnya markah perhubungan ini digunakan untuk mengklasifikasikan contoh pertanyaan.
Pembelajaran beberapa pukulan mempunyai banyak aplikasi dalam bidang yang berbeza, termasuk:
Dalam pelbagai tugas penglihatan komputer, termasuk pengelasan imej, pengesanan sasaran dan pembahagian. Pembelajaran beberapa pukulan boleh mengenal pasti objek baharu dalam imej yang tidak terdapat dalam data latihan.
Dalam tugas pemprosesan bahasa semula jadi, seperti klasifikasi teks, analisis sentimen dan pemodelan bahasa, pembelajaran beberapa pukulan membantu meningkatkan prestasi model bahasa pada bahasa sumber rendah.
Gunakan pembelajaran beberapa pukulan dalam robotik untuk membolehkan robot mempelajari tugas baharu dengan pantas dan menyesuaikan diri dengan persekitaran baharu. Sebagai contoh, robot boleh belajar mengambil objek baharu dengan hanya beberapa contoh.
Beberapa sampel boleh mengenal pasti penyakit jarang berlaku dan keabnormalan dalam diagnostik perubatan yang datanya terhad, dan boleh membantu memperibadikan rawatan dan meramalkan hasil pesakit.
Pembelajaran beberapa pukulan ialah teknik berkuasa yang membolehkan model belajar daripada sebilangan kecil contoh. Ia mempunyai banyak aplikasi dalam pelbagai bidang dan berpotensi untuk merevolusikan pembelajaran mesin. Dengan penyelidikan dan pembangunan yang berterusan, pembelajaran beberapa pukulan boleh membuka jalan untuk sistem pembelajaran mesin yang lebih cekap dan berkesan.
Atas ialah kandungan terperinci Kajian semula pembelajaran beberapa pukulan: teknik, algoritma dan model. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!