Rumah > Peranti teknologi > AI > teks badan

Kajian semula pembelajaran beberapa pukulan: teknik, algoritma dan model

WBOY
Lepaskan: 2023-04-12 14:52:03
ke hadapan
1567 orang telah melayarinya

Pembelajaran mesin telah mencapai kemajuan yang besar baru-baru ini, tetapi masih terdapat cabaran besar: keperluan untuk sejumlah besar data berlabel untuk melatih model.

Kadangkala data jenis ini tidak tersedia di dunia nyata. Ambil penjagaan kesihatan sebagai contoh, kita mungkin tidak mempunyai imbasan X-ray yang mencukupi untuk memeriksa penyakit baharu. Tetapi melalui pembelajaran beberapa pukulan, model boleh mempelajari pengetahuan daripada beberapa contoh sahaja!

Jadi pembelajaran beberapa pukulan (FSL) ialah subbidang pembelajaran mesin, yang menyelesaikan tugas mempelajari tugasan baharu dengan hanya bilangan kecil masalah contoh berlabel. Inti FSL adalah untuk membolehkan model pembelajaran mesin mempelajari perkara baharu dengan sedikit data, yang berguna dalam situasi di mana pengumpulan sekumpulan data berlabel adalah terlalu mahal, mengambil masa terlalu lama atau tidak praktikal.

Kaedah pembelajaran beberapa pukulan

Kajian semula pembelajaran beberapa pukulan: teknik, algoritma dan model

Sokongan set sampel/pertanyaan: gunakan sebilangan kecil imej untuk mengklasifikasikan set pertanyaan.

Terdapat tiga kaedah utama untuk difahami dalam pembelajaran beberapa pukulan: pembelajaran meta, peringkat data dan peringkat parameter.

  • Pembelajaran meta: Pembelajaran meta melibatkan latihan model untuk mempelajari cara mempelajari tugas baharu dengan cekap
  • Peringkat data: Kaedah peringkat data memfokuskan pada peningkatan data yang tersedia untuk dipertingkatkan generalisasi prestasi model;
  • Tahap parameter: Kaedah peringkat parameter bertujuan untuk mempelajari perwakilan ciri yang lebih mantap untuk generalisasi yang lebih baik kepada tugas baharu

Pembelajaran meta

Meta-pembelajaran (belajar cara belajar). Kaedah ini melatih model untuk mempelajari cara mempelajari tugasan baharu dengan cekap. Model ini adalah tentang mengenal pasti persamaan antara tugasan yang berbeza dan menggunakan pengetahuan ini untuk mempelajari perkara baharu dengan cepat dengan beberapa contoh.

Algoritma meta-pembelajaran biasanya melatih model pada set tugasan yang berkaitan dan belajar mengekstrak ciri bebas tugas dan khusus tugas daripada data yang tersedia. Ciri bebas tugasan menangkap pengetahuan umum tentang data, manakala ciri khusus tugasan menangkap butiran tugas semasa. Semasa latihan, algoritma belajar menyesuaikan diri dengan tugasan baharu dengan mengemas kini parameter model menggunakan hanya beberapa contoh berlabel bagi setiap tugasan baharu. Ini membolehkan model membuat generalisasi kepada tugasan baharu dengan beberapa contoh.

Kaedah peringkat data

Kaedah peringkat data memfokuskan pada mengembangkan data sedia ada, yang boleh membantu model memahami struktur asas data dengan lebih baik, dengan itu meningkatkan prestasi generalisasi model.

Idea utama adalah untuk mencipta contoh baharu dengan menggunakan pelbagai transformasi pada contoh sedia ada, yang boleh membantu model memahami dengan lebih baik struktur asas data.

Terdapat dua jenis kaedah peringkat data:

  • Pembesaran data: Pembesaran data melibatkan mencipta contoh baharu dengan menggunakan transformasi berbeza pada data sedia ada
  • Penjanaan data : Penjanaan data melibatkan penjanaan contoh baharu dari awal menggunakan rangkaian adversarial generatif (GAN).

Kaedah peringkat data:

Matlamat kaedah peringkat parameter ialah untuk mempelajari perwakilan ciri yang lebih mantap yang boleh digeneralisasikan dengan lebih baik kepada tugasan baharu.

Terdapat dua kaedah peringkat parameter:

  • Pengekstrakan ciri: Pengekstrakan ciri melibatkan pembelajaran set ciri daripada data, yang boleh digunakan untuk tugasan baharu; 🎜>Penalaan halus: Penalaan halus melibatkan penyesuaian model pra-latihan kepada tugas baharu dengan mempelajari parameter optimum.
  • Contohnya, katakan anda mempunyai model terlatih yang boleh mengecam pelbagai bentuk dan warna dalam imej. Dengan memperhalusi model pada set data baharu, ia boleh belajar mengenali kategori baharu dengan cepat dengan hanya beberapa contoh.

Algoritma meta-pembelajaran

Meta-pembelajaran ialah pendekatan popular untuk FSL, yang melibatkan latihan model tentang pelbagai tugasan yang berkaitan supaya ia boleh mempelajari cara mempelajari tugasan baharu dengan cekap. Algoritma belajar untuk mengekstrak ciri bebas tugas dan khusus tugas daripada data yang tersedia, dengan cepat menyesuaikan diri dengan tugasan baharu.

Algoritma meta-pembelajaran boleh dibahagikan secara meluas kepada dua jenis: berasaskan metrik dan berasaskan kecerunan.

Pembelajaran meta berasaskan metrik

Algoritma pembelajaran meta berasaskan metrik mempelajari cara khas untuk membandingkan contoh yang berbeza untuk setiap tugasan baharu. Mereka mencapai ini dengan memetakan contoh input ke dalam ruang ciri khas, di mana contoh yang serupa adalah berdekatan dan contoh yang tidak serupa adalah berjauhan. Model boleh menggunakan metrik jarak ini untuk mengklasifikasikan contoh baharu ke dalam kategori yang betul.

Algoritma berasaskan metrik yang popular ialah Rangkaian Siam, yang mempelajari cara mengukur jarak antara dua contoh input dengan menggunakan dua sub-rangkaian yang sama. Sub-rangkaian ini menjana perwakilan ciri untuk setiap contoh input dan kemudian membandingkan outputnya menggunakan ukuran jarak seperti jarak Euclidean atau persamaan kosinus.

Pembelajaran berasaskan meta kecerunan

Pembelajaran meta berasaskan kecerunan mempelajari cara mengemas kini parameter mereka supaya mereka boleh menyesuaikan diri dengan cepat kepada cabaran baharu.

Algoritma ini melatih model untuk mempelajari set parameter awal dan cepat menyesuaikan diri dengan tugasan baharu dengan hanya beberapa contoh. MAML (model-agnostik meta-pembelajaran) ialah algoritma meta-pembelajaran berasaskan kecerunan yang popular yang mempelajari cara mengoptimumkan parameter model untuk menyesuaikan diri dengan cepat kepada tugasan baharu. Ia melatih model melalui satu siri tugasan yang berkaitan dan mengemas kini parameter model menggunakan beberapa contoh daripada setiap tugasan. Setelah model mempelajari parameter ini, ia boleh memperhalusinya menggunakan contoh lain daripada tugas semasa, meningkatkan prestasinya.

Algoritma pengelasan imej berdasarkan pembelajaran beberapa pukulan

FSL mempunyai beberapa algoritma, termasuk:

  • Pembelajaran Meta Model-Agnostik ): MAML ialah meta- algoritma pembelajaran yang mempelajari permulaan yang baik untuk model dan kemudian boleh menyesuaikan diri dengan tugasan baharu dengan sejumlah kecil contoh.
  • Rangkaian Pemadanan: Rangkaian pemadanan belajar untuk memadankan contoh baharu dengan contoh berlabel dengan mengira persamaan.
  • Rangkaian Prototaip: Rangkaian Prototaip mempelajari perwakilan prototaip untuk setiap kelas dan mengelaskan contoh baharu berdasarkan persamaannya dengan prototaip.
  • Rangkaian Perhubungan: Rangkaian perhubungan belajar membandingkan pasangan contoh dan membuat ramalan tentang contoh baharu.

Pembelajaran meta-agnostik model

Idea utama MAML adalah untuk mempelajari pemulaan parameter model yang boleh disesuaikan dengan tugasan baharu dengan beberapa contoh. Semasa latihan, MAML menerima satu set tugasan yang berkaitan dan belajar mengemas kini parameter model menggunakan hanya beberapa contoh berlabel bagi setiap tugasan. Proses ini membolehkan model membuat generalisasi kepada tugasan baharu dengan mempelajari pemulaan parameter model yang baik yang boleh disesuaikan dengan cepat kepada tugasan baharu.

Rangkaian Padanan

Rangkaian Padanan ialah satu lagi algoritma pengelasan imej beberapa tangkapan yang biasa digunakan. Daripada mempelajari metrik atau parameter tetap, ia mempelajari metrik dinamik berdasarkan set sokongan semasa. Ini bermakna metrik yang digunakan untuk membandingkan imej pertanyaan dan set sokongan berbeza untuk setiap imej pertanyaan.

Algoritma rangkaian padanan menggunakan mekanisme perhatian untuk mengira jumlah wajaran ciri set sokongan untuk setiap imej pertanyaan. Pemberatan dipelajari berdasarkan persamaan antara imej pertanyaan dan setiap imej set sokongan. Jumlah wajaran ciri set sokongan kemudiannya digabungkan dengan ciri imej pertanyaan, dan vektor yang terhasil disalurkan melalui beberapa lapisan bersambung sepenuhnya untuk menghasilkan klasifikasi akhir.

Rangkaian Prototaip

Rangkaian Prototaip ialah algoritma pengelasan imej beberapa sampel yang mudah dan berkesan. Ia mempelajari perwakilan imej dan mengira prototaip untuk setiap kelas menggunakan purata ciri pembenaman contoh sokongan. Semasa ujian, jarak antara imej pertanyaan dan setiap prototaip kelas dikira dan kelas dengan prototaip terdekat diberikan kepada pertanyaan.

Rangkaian Perhubungan

Rangkaian perhubungan belajar membandingkan pasangan contoh dalam set sokongan dan menggunakan maklumat ini untuk mengklasifikasikan contoh pertanyaan. Rangkaian perhubungan merangkumi dua sub-rangkaian: rangkaian pembenaman ciri dan rangkaian perhubungan. Rangkaian pembenaman ciri memetakan setiap contoh dalam set sokongan dan contoh pertanyaan ke dalam ruang ciri. Rangkaian hubungan kemudian mengira skor hubungan antara contoh pertanyaan dan setiap contoh set sokongan. Akhirnya markah perhubungan ini digunakan untuk mengklasifikasikan contoh pertanyaan.

Aplikasi pembelajaran beberapa pukulan

Pembelajaran beberapa pukulan mempunyai banyak aplikasi dalam bidang yang berbeza, termasuk:

Dalam pelbagai tugas penglihatan komputer, termasuk pengelasan imej, pengesanan sasaran dan pembahagian. Pembelajaran beberapa pukulan boleh mengenal pasti objek baharu dalam imej yang tidak terdapat dalam data latihan.

Dalam tugas pemprosesan bahasa semula jadi, seperti klasifikasi teks, analisis sentimen dan pemodelan bahasa, pembelajaran beberapa pukulan membantu meningkatkan prestasi model bahasa pada bahasa sumber rendah.

Gunakan pembelajaran beberapa pukulan dalam robotik untuk membolehkan robot mempelajari tugas baharu dengan pantas dan menyesuaikan diri dengan persekitaran baharu. Sebagai contoh, robot boleh belajar mengambil objek baharu dengan hanya beberapa contoh.

Beberapa sampel boleh mengenal pasti penyakit jarang berlaku dan keabnormalan dalam diagnostik perubatan yang datanya terhad, dan boleh membantu memperibadikan rawatan dan meramalkan hasil pesakit.

Ringkasan

Pembelajaran beberapa pukulan ialah teknik berkuasa yang membolehkan model belajar daripada sebilangan kecil contoh. Ia mempunyai banyak aplikasi dalam pelbagai bidang dan berpotensi untuk merevolusikan pembelajaran mesin. Dengan penyelidikan dan pembangunan yang berterusan, pembelajaran beberapa pukulan boleh membuka jalan untuk sistem pembelajaran mesin yang lebih cekap dan berkesan.

Atas ialah kandungan terperinci Kajian semula pembelajaran beberapa pukulan: teknik, algoritma dan model. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:51cto.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan