Kajian semula pembelajaran beberapa pukulan: teknik, algoritma dan model
Pembelajaran mesin telah mencapai kemajuan yang besar baru-baru ini, tetapi masih terdapat cabaran besar: keperluan untuk sejumlah besar data berlabel untuk melatih model.
Kadangkala data jenis ini tidak tersedia di dunia nyata. Ambil penjagaan kesihatan sebagai contoh, kita mungkin tidak mempunyai imbasan X-ray yang mencukupi untuk memeriksa penyakit baharu. Tetapi melalui pembelajaran beberapa pukulan, model boleh mempelajari pengetahuan daripada beberapa contoh sahaja!
Jadi pembelajaran beberapa pukulan (FSL) ialah subbidang pembelajaran mesin, yang menyelesaikan tugas mempelajari tugasan baharu dengan hanya bilangan kecil masalah contoh berlabel. Inti FSL adalah untuk membolehkan model pembelajaran mesin mempelajari perkara baharu dengan sedikit data, yang berguna dalam situasi di mana pengumpulan sekumpulan data berlabel adalah terlalu mahal, mengambil masa terlalu lama atau tidak praktikal.
Kaedah pembelajaran beberapa pukulan
Sokongan set sampel/pertanyaan: gunakan sebilangan kecil imej untuk mengklasifikasikan set pertanyaan.
Terdapat tiga kaedah utama untuk difahami dalam pembelajaran beberapa pukulan: pembelajaran meta, peringkat data dan peringkat parameter.
- Pembelajaran meta: Pembelajaran meta melibatkan latihan model untuk mempelajari cara mempelajari tugas baharu dengan cekap
- Peringkat data: Kaedah peringkat data memfokuskan pada peningkatan data yang tersedia untuk dipertingkatkan generalisasi prestasi model;
- Tahap parameter: Kaedah peringkat parameter bertujuan untuk mempelajari perwakilan ciri yang lebih mantap untuk generalisasi yang lebih baik kepada tugas baharu
Pembelajaran meta
Meta-pembelajaran (belajar cara belajar). Kaedah ini melatih model untuk mempelajari cara mempelajari tugasan baharu dengan cekap. Model ini adalah tentang mengenal pasti persamaan antara tugasan yang berbeza dan menggunakan pengetahuan ini untuk mempelajari perkara baharu dengan cepat dengan beberapa contoh.
Algoritma meta-pembelajaran biasanya melatih model pada set tugasan yang berkaitan dan belajar mengekstrak ciri bebas tugas dan khusus tugas daripada data yang tersedia. Ciri bebas tugasan menangkap pengetahuan umum tentang data, manakala ciri khusus tugasan menangkap butiran tugas semasa. Semasa latihan, algoritma belajar menyesuaikan diri dengan tugasan baharu dengan mengemas kini parameter model menggunakan hanya beberapa contoh berlabel bagi setiap tugasan baharu. Ini membolehkan model membuat generalisasi kepada tugasan baharu dengan beberapa contoh.
Kaedah peringkat data
Kaedah peringkat data memfokuskan pada mengembangkan data sedia ada, yang boleh membantu model memahami struktur asas data dengan lebih baik, dengan itu meningkatkan prestasi generalisasi model.
Idea utama adalah untuk mencipta contoh baharu dengan menggunakan pelbagai transformasi pada contoh sedia ada, yang boleh membantu model memahami dengan lebih baik struktur asas data.
Terdapat dua jenis kaedah peringkat data:
- Pembesaran data: Pembesaran data melibatkan mencipta contoh baharu dengan menggunakan transformasi berbeza pada data sedia ada
- Penjanaan data : Penjanaan data melibatkan penjanaan contoh baharu dari awal menggunakan rangkaian adversarial generatif (GAN).
Kaedah peringkat data:
Matlamat kaedah peringkat parameter ialah untuk mempelajari perwakilan ciri yang lebih mantap yang boleh digeneralisasikan dengan lebih baik kepada tugasan baharu.
Terdapat dua kaedah peringkat parameter:
- Pengekstrakan ciri: Pengekstrakan ciri melibatkan pembelajaran set ciri daripada data, yang boleh digunakan untuk tugasan baharu; 🎜>Penalaan halus: Penalaan halus melibatkan penyesuaian model pra-latihan kepada tugas baharu dengan mempelajari parameter optimum.
- Contohnya, katakan anda mempunyai model terlatih yang boleh mengecam pelbagai bentuk dan warna dalam imej. Dengan memperhalusi model pada set data baharu, ia boleh belajar mengenali kategori baharu dengan cepat dengan hanya beberapa contoh.
Algoritma meta-pembelajaran
Meta-pembelajaran ialah pendekatan popular untuk FSL, yang melibatkan latihan model tentang pelbagai tugasan yang berkaitan supaya ia boleh mempelajari cara mempelajari tugasan baharu dengan cekap. Algoritma belajar untuk mengekstrak ciri bebas tugas dan khusus tugas daripada data yang tersedia, dengan cepat menyesuaikan diri dengan tugasan baharu.
Algoritma meta-pembelajaran boleh dibahagikan secara meluas kepada dua jenis: berasaskan metrik dan berasaskan kecerunan.
Pembelajaran meta berasaskan metrik
Algoritma pembelajaran meta berasaskan metrik mempelajari cara khas untuk membandingkan contoh yang berbeza untuk setiap tugasan baharu. Mereka mencapai ini dengan memetakan contoh input ke dalam ruang ciri khas, di mana contoh yang serupa adalah berdekatan dan contoh yang tidak serupa adalah berjauhan. Model boleh menggunakan metrik jarak ini untuk mengklasifikasikan contoh baharu ke dalam kategori yang betul.
Algoritma berasaskan metrik yang popular ialah Rangkaian Siam, yang mempelajari cara mengukur jarak antara dua contoh input dengan menggunakan dua sub-rangkaian yang sama. Sub-rangkaian ini menjana perwakilan ciri untuk setiap contoh input dan kemudian membandingkan outputnya menggunakan ukuran jarak seperti jarak Euclidean atau persamaan kosinus.
Pembelajaran berasaskan meta kecerunan
Pembelajaran meta berasaskan kecerunan mempelajari cara mengemas kini parameter mereka supaya mereka boleh menyesuaikan diri dengan cepat kepada cabaran baharu.
Algoritma ini melatih model untuk mempelajari set parameter awal dan cepat menyesuaikan diri dengan tugasan baharu dengan hanya beberapa contoh. MAML (model-agnostik meta-pembelajaran) ialah algoritma meta-pembelajaran berasaskan kecerunan yang popular yang mempelajari cara mengoptimumkan parameter model untuk menyesuaikan diri dengan cepat kepada tugasan baharu. Ia melatih model melalui satu siri tugasan yang berkaitan dan mengemas kini parameter model menggunakan beberapa contoh daripada setiap tugasan. Setelah model mempelajari parameter ini, ia boleh memperhalusinya menggunakan contoh lain daripada tugas semasa, meningkatkan prestasinya.
Algoritma pengelasan imej berdasarkan pembelajaran beberapa pukulan
FSL mempunyai beberapa algoritma, termasuk:
- Pembelajaran Meta Model-Agnostik ): MAML ialah meta- algoritma pembelajaran yang mempelajari permulaan yang baik untuk model dan kemudian boleh menyesuaikan diri dengan tugasan baharu dengan sejumlah kecil contoh.
- Rangkaian Pemadanan: Rangkaian pemadanan belajar untuk memadankan contoh baharu dengan contoh berlabel dengan mengira persamaan.
- Rangkaian Prototaip: Rangkaian Prototaip mempelajari perwakilan prototaip untuk setiap kelas dan mengelaskan contoh baharu berdasarkan persamaannya dengan prototaip.
- Rangkaian Perhubungan: Rangkaian perhubungan belajar membandingkan pasangan contoh dan membuat ramalan tentang contoh baharu.
Pembelajaran meta-agnostik model
Idea utama MAML adalah untuk mempelajari pemulaan parameter model yang boleh disesuaikan dengan tugasan baharu dengan beberapa contoh. Semasa latihan, MAML menerima satu set tugasan yang berkaitan dan belajar mengemas kini parameter model menggunakan hanya beberapa contoh berlabel bagi setiap tugasan. Proses ini membolehkan model membuat generalisasi kepada tugasan baharu dengan mempelajari pemulaan parameter model yang baik yang boleh disesuaikan dengan cepat kepada tugasan baharu.
Rangkaian Padanan
Rangkaian Padanan ialah satu lagi algoritma pengelasan imej beberapa tangkapan yang biasa digunakan. Daripada mempelajari metrik atau parameter tetap, ia mempelajari metrik dinamik berdasarkan set sokongan semasa. Ini bermakna metrik yang digunakan untuk membandingkan imej pertanyaan dan set sokongan berbeza untuk setiap imej pertanyaan.
Algoritma rangkaian padanan menggunakan mekanisme perhatian untuk mengira jumlah wajaran ciri set sokongan untuk setiap imej pertanyaan. Pemberatan dipelajari berdasarkan persamaan antara imej pertanyaan dan setiap imej set sokongan. Jumlah wajaran ciri set sokongan kemudiannya digabungkan dengan ciri imej pertanyaan, dan vektor yang terhasil disalurkan melalui beberapa lapisan bersambung sepenuhnya untuk menghasilkan klasifikasi akhir.
Rangkaian Prototaip
Rangkaian Prototaip ialah algoritma pengelasan imej beberapa sampel yang mudah dan berkesan. Ia mempelajari perwakilan imej dan mengira prototaip untuk setiap kelas menggunakan purata ciri pembenaman contoh sokongan. Semasa ujian, jarak antara imej pertanyaan dan setiap prototaip kelas dikira dan kelas dengan prototaip terdekat diberikan kepada pertanyaan.
Rangkaian Perhubungan
Rangkaian perhubungan belajar membandingkan pasangan contoh dalam set sokongan dan menggunakan maklumat ini untuk mengklasifikasikan contoh pertanyaan. Rangkaian perhubungan merangkumi dua sub-rangkaian: rangkaian pembenaman ciri dan rangkaian perhubungan. Rangkaian pembenaman ciri memetakan setiap contoh dalam set sokongan dan contoh pertanyaan ke dalam ruang ciri. Rangkaian hubungan kemudian mengira skor hubungan antara contoh pertanyaan dan setiap contoh set sokongan. Akhirnya markah perhubungan ini digunakan untuk mengklasifikasikan contoh pertanyaan.
Aplikasi pembelajaran beberapa pukulan
Pembelajaran beberapa pukulan mempunyai banyak aplikasi dalam bidang yang berbeza, termasuk:
Dalam pelbagai tugas penglihatan komputer, termasuk pengelasan imej, pengesanan sasaran dan pembahagian. Pembelajaran beberapa pukulan boleh mengenal pasti objek baharu dalam imej yang tidak terdapat dalam data latihan.
Dalam tugas pemprosesan bahasa semula jadi, seperti klasifikasi teks, analisis sentimen dan pemodelan bahasa, pembelajaran beberapa pukulan membantu meningkatkan prestasi model bahasa pada bahasa sumber rendah.
Gunakan pembelajaran beberapa pukulan dalam robotik untuk membolehkan robot mempelajari tugas baharu dengan pantas dan menyesuaikan diri dengan persekitaran baharu. Sebagai contoh, robot boleh belajar mengambil objek baharu dengan hanya beberapa contoh.
Beberapa sampel boleh mengenal pasti penyakit jarang berlaku dan keabnormalan dalam diagnostik perubatan yang datanya terhad, dan boleh membantu memperibadikan rawatan dan meramalkan hasil pesakit.
Ringkasan
Pembelajaran beberapa pukulan ialah teknik berkuasa yang membolehkan model belajar daripada sebilangan kecil contoh. Ia mempunyai banyak aplikasi dalam pelbagai bidang dan berpotensi untuk merevolusikan pembelajaran mesin. Dengan penyelidikan dan pembangunan yang berterusan, pembelajaran beberapa pukulan boleh membuka jalan untuk sistem pembelajaran mesin yang lebih cekap dan berkesan.
Atas ialah kandungan terperinci Kajian semula pembelajaran beberapa pukulan: teknik, algoritma dan model. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Dalam bidang pembelajaran mesin dan sains data, kebolehtafsiran model sentiasa menjadi tumpuan penyelidik dan pengamal. Dengan aplikasi meluas model yang kompleks seperti kaedah pembelajaran mendalam dan ensemble, memahami proses membuat keputusan model menjadi sangat penting. AI|XAI yang boleh dijelaskan membantu membina kepercayaan dan keyakinan dalam model pembelajaran mesin dengan meningkatkan ketelusan model. Meningkatkan ketelusan model boleh dicapai melalui kaedah seperti penggunaan meluas pelbagai model yang kompleks, serta proses membuat keputusan yang digunakan untuk menerangkan model. Kaedah ini termasuk analisis kepentingan ciri, anggaran selang ramalan model, algoritma kebolehtafsiran tempatan, dsb. Analisis kepentingan ciri boleh menerangkan proses membuat keputusan model dengan menilai tahap pengaruh model ke atas ciri input. Anggaran selang ramalan model

Cabaran biasa yang dihadapi oleh algoritma pembelajaran mesin dalam C++ termasuk pengurusan memori, multi-threading, pengoptimuman prestasi dan kebolehselenggaraan. Penyelesaian termasuk menggunakan penunjuk pintar, perpustakaan benang moden, arahan SIMD dan perpustakaan pihak ketiga, serta mengikuti garis panduan gaya pengekodan dan menggunakan alat automasi. Kes praktikal menunjukkan cara menggunakan perpustakaan Eigen untuk melaksanakan algoritma regresi linear, mengurus memori dengan berkesan dan menggunakan operasi matriks berprestasi tinggi.

Penterjemah |. Disemak oleh Li Rui |. Chonglou Model kecerdasan buatan (AI) dan pembelajaran mesin (ML) semakin kompleks hari ini, dan output yang dihasilkan oleh model ini adalah kotak hitam – tidak dapat dijelaskan kepada pihak berkepentingan. AI Boleh Dijelaskan (XAI) bertujuan untuk menyelesaikan masalah ini dengan membolehkan pihak berkepentingan memahami cara model ini berfungsi, memastikan mereka memahami cara model ini sebenarnya membuat keputusan, dan memastikan ketelusan dalam sistem AI, Amanah dan akauntabiliti untuk menyelesaikan masalah ini. Artikel ini meneroka pelbagai teknik kecerdasan buatan (XAI) yang boleh dijelaskan untuk menggambarkan prinsip asasnya. Beberapa sebab mengapa AI boleh dijelaskan adalah penting Kepercayaan dan ketelusan: Untuk sistem AI diterima secara meluas dan dipercayai, pengguna perlu memahami cara keputusan dibuat

Pembelajaran mesin ialah cabang penting kecerdasan buatan yang memberikan komputer keupayaan untuk belajar daripada data dan meningkatkan keupayaan mereka tanpa diprogramkan secara eksplisit. Pembelajaran mesin mempunyai pelbagai aplikasi dalam pelbagai bidang, daripada pengecaman imej dan pemprosesan bahasa semula jadi kepada sistem pengesyoran dan pengesanan penipuan, dan ia mengubah cara hidup kita. Terdapat banyak kaedah dan teori yang berbeza dalam bidang pembelajaran mesin, antaranya lima kaedah yang paling berpengaruh dipanggil "Lima Sekolah Pembelajaran Mesin". Lima sekolah utama ialah sekolah simbolik, sekolah sambungan, sekolah evolusi, sekolah Bayesian dan sekolah analogi. 1. Simbolisme, juga dikenali sebagai simbolisme, menekankan penggunaan simbol untuk penaakulan logik dan ekspresi pengetahuan. Aliran pemikiran ini percaya bahawa pembelajaran adalah proses penolakan terbalik, melalui sedia ada

01Garis prospek Pada masa ini, sukar untuk mencapai keseimbangan yang sesuai antara kecekapan pengesanan dan hasil pengesanan. Kami telah membangunkan algoritma YOLOv5 yang dipertingkatkan untuk pengesanan sasaran dalam imej penderiaan jauh optik resolusi tinggi, menggunakan piramid ciri berbilang lapisan, strategi kepala pengesanan berbilang dan modul perhatian hibrid untuk meningkatkan kesan rangkaian pengesanan sasaran dalam imej penderiaan jauh optik. Menurut set data SIMD, peta algoritma baharu adalah 2.2% lebih baik daripada YOLOv5 dan 8.48% lebih baik daripada YOLOX, mencapai keseimbangan yang lebih baik antara hasil pengesanan dan kelajuan. 02 Latar Belakang & Motivasi Dengan perkembangan pesat teknologi penderiaan jauh, imej penderiaan jauh optik resolusi tinggi telah digunakan untuk menggambarkan banyak objek di permukaan bumi, termasuk pesawat, kereta, bangunan, dll. Pengesanan objek dalam tafsiran imej penderiaan jauh

MetaFAIR bekerjasama dengan Harvard untuk menyediakan rangka kerja penyelidikan baharu untuk mengoptimumkan bias data yang dijana apabila pembelajaran mesin berskala besar dilakukan. Adalah diketahui bahawa latihan model bahasa besar sering mengambil masa berbulan-bulan dan menggunakan ratusan atau bahkan ribuan GPU. Mengambil model LLaMA270B sebagai contoh, latihannya memerlukan sejumlah 1,720,320 jam GPU. Melatih model besar memberikan cabaran sistemik yang unik disebabkan oleh skala dan kerumitan beban kerja ini. Baru-baru ini, banyak institusi telah melaporkan ketidakstabilan dalam proses latihan apabila melatih model AI generatif SOTA Mereka biasanya muncul dalam bentuk lonjakan kerugian Contohnya, model PaLM Google mengalami sehingga 20 lonjakan kerugian semasa proses latihan. Bias berangka adalah punca ketidaktepatan latihan ini,

Dalam C++, pelaksanaan algoritma pembelajaran mesin termasuk: Regresi linear: digunakan untuk meramalkan pembolehubah berterusan Langkah-langkah termasuk memuatkan data, mengira berat dan berat sebelah, mengemas kini parameter dan ramalan. Regresi logistik: digunakan untuk meramalkan pembolehubah diskret Proses ini serupa dengan regresi linear, tetapi menggunakan fungsi sigmoid untuk ramalan. Mesin Vektor Sokongan: Algoritma klasifikasi dan regresi yang berkuasa yang melibatkan pengkomputeran vektor sokongan dan label ramalan.

Potensi aplikasi bahasa Go dalam bidang pembelajaran mesin adalah besar Kelebihannya ialah: Concurrency: Ia menyokong pengaturcaraan selari dan sesuai untuk operasi intensif pengiraan dalam tugas pembelajaran mesin. Kecekapan: Pengumpul sampah dan ciri bahasa memastikan kod itu cekap, walaupun semasa memproses set data yang besar. Kemudahan penggunaan: Sintaksnya ringkas, menjadikannya mudah untuk belajar dan menulis aplikasi pembelajaran mesin.
