


USB: Penanda aras pembelajaran klasifikasi separa seliaan pertama yang menyatukan tugas klasifikasi visual, bahasa dan audio
Pada masa ini, perkembangan pembelajaran separa penyeliaan sedang rancak dijalankan. Walau bagaimanapun, tanda aras pembelajaran separa penyeliaan sedia ada kebanyakannya terhad kepada tugas klasifikasi penglihatan komputer, tidak termasuk penilaian tugas klasifikasi yang konsisten dan pelbagai seperti pemprosesan bahasa semula jadi dan pemprosesan audio. Di samping itu, kebanyakan kertas kerja separa penyeliaan diterbitkan oleh institusi besar, dan selalunya sukar bagi makmal akademik untuk mengambil bahagian dalam memajukan bidang tersebut kerana keterbatasan dalam sumber pengkomputeran.
Untuk tujuan ini, penyelidik dari Microsoft Research Asia, bersama penyelidik dari Westlake University, Tokyo Institute of Technology, Carnegie Mellon University, Max Planck Institute dan institusi lain, mencadangkan Unified SSL Benchmark ( USB): penanda aras pembelajaran klasifikasi separa seliaan pertama yang menyatukan tugas klasifikasi visual, bahasa dan audio.
Kertas kerja ini bukan sahaja memperkenalkan medan aplikasi yang lebih pelbagai, tetapi juga menggunakan model pra-latihan visual buat kali pertama untuk mengurangkan masa pengesahan algoritma separa diselia dengan banyak, menjadikan separa- penyelidikan diselia lebih mudah untuk penyelidik Terutama kumpulan penyelidikan kecil lebih mesra. Kertas kerja yang berkaitan telah diterima oleh NeurIPS 2022, persidangan akademik antarabangsa teratas dalam bidang kecerdasan buatan.
Pautan artikel: https://arxiv.org/pdf/2208.07204.pdf
Pautan kod: https://github.com/microsoft/Semi-supervised-learning
Pembelajaran diselia Dengan membina model agar sesuai dengan data berlabel, model rangkaian saraf menghasilkan hasil yang kompetitif apabila dilatih pada sejumlah besar data berlabel berkualiti tinggi menggunakan pembelajaran terselia.
Contohnya, mengikut statistik daripada laman web Paperswithcode, pada set data peringkat juta ImageNet, kaedah pembelajaran diselia tradisional boleh mencapai ketepatan lebih daripada 88%. Walau bagaimanapun, mendapatkan sejumlah besar data berlabel selalunya memakan masa dan susah payah.
Untuk mengurangkan kebergantungan pada data berlabel, pembelajaran separuh seliaan (SSL) komited untuk menggunakan sejumlah besar data tidak berlabel apabila terdapat hanya sejumlah kecil data berlabel. untuk menambah baik generalisasi model. Pembelajaran separa penyeliaan juga merupakan salah satu topik penting pembelajaran mesin. Sebelum pembelajaran mendalam, penyelidik dalam bidang ini mencadangkan algoritma klasik seperti mesin vektor sokongan separa diselia, penyusunan entropi dan latihan kolaboratif.
Pembelajaran separa penyeliaan mendalam
Dengan peningkatan pembelajaran mendalam, algoritma pembelajaran separa penyeliaan mendalam juga telah mencapai kemajuan yang besar. Pada masa yang sama, syarikat teknologi termasuk Microsoft, Google dan Meta juga telah mengiktiraf potensi besar pembelajaran separa penyeliaan dalam senario praktikal.
Sebagai contoh, Google menggunakan latihan pelajar yang bising, algoritma separa diawasi, untuk meningkatkan prestasi cariannya [1]. Algoritma separa selia yang paling mewakili pada masa ini menggunakan kehilangan entropi silang untuk latihan pada data berlabel, dan penyelarasan konsistensi pada data tidak berlabel untuk menggalakkan ramalan invarian kepada gangguan input.
Sebagai contoh, algoritma FixMatch[2] yang dicadangkan oleh Google di NeurIPS 2020 menggunakan teknologi penambat pembesaran dan ambang tetap untuk mempertingkatkan model bagi meningkatkan data dengan kekuatan yang berbeza dan mengurangkan kesan daripada label pseudo yang bising. Semasa latihan, FixMatch menapis data tidak berlabel di bawah ambang yang disediakan pengguna/ditetapkan sebelumnya.
FlexMatch[3], yang dicadangkan bersama oleh Microsoft Research Asia dan Tokyo Institute of Technology di NeurIPS 2021, mengambil kira kesukaran pembelajaran yang berbeza antara kategori yang berbeza, jadi ia mencadangkan label pseudo kursus teknologi ( pelabelan pseudo kurikulum), ambang yang berbeza harus digunakan untuk kategori yang berbeza.
Khususnya, untuk kategori yang mudah dipelajari, model harus menetapkan ambang yang tinggi untuk mengurangkan kesan label pseudo yang bising untuk kategori yang sukar dipelajari, model itu hendaklah tetapkan ambang rendah untuk menggalakkan pemadanan kategori ini. Penilaian kesukaran pembelajaran setiap kelas bergantung pada bilangan sampel data tidak berlabel yang jatuh ke dalam kelas tersebut dan melebihi nilai tetap.
Pada masa yang sama, penyelidik dari Microsoft Research Asia juga bekerjasama untuk mencadangkan perpustakaan kod kaedah separuh seliaan berasaskan Pytorch bersatu TorchSSL[4], yang menyediakan kaedah mendalam dan data biasa dalam medan. Set dan hasil penanda aras disokong secara seragam.
Rajah 1: Proses algoritma FlexMatch
Masalah dan cabaran dalam perpustakaan kod pembelajaran separa penyeliaan semasa
Walaupun pembangunan pembelajaran separa penyeliaan sedang giat dijalankan, penyelidik mendapati bahawa kebanyakan kertas kerja semasa dalam arah separa penyeliaan hanya memfokuskan kepada tugasan pengelasan penglihatan komputer (CV) Untuk bidang lain, seperti pemprosesan bahasa semula jadi (. NLP) dan pemprosesan audio (audio), Penyelidik tidak dapat mengetahui sama ada algoritma yang berkesan dalam tugasan CV ini masih berkesan dalam bidang yang berbeza.
Selain itu, kebanyakan kertas kerja separuh penyeliaan diterbitkan oleh institusi besar, dan selalunya sukar bagi makmal akademik untuk mengambil bahagian dalam mempromosikan pembangunan bidang ini kerana keterbatasan sumber pengkomputeran. . Secara umumnya, tanda aras pembelajaran separa penyeliaan pada masa ini mempunyai dua masalah berikut:
(1) Kepelbagaian yang tidak mencukupi. Kebanyakan tanda aras pembelajaran separa penyeliaan sedia ada terhad kepada tugas klasifikasi CV (iaitu, CIFAR-10/100, SVHN, STL-10 dan klasifikasi ImageNet), tidak termasuk penilaian tugas klasifikasi yang konsisten dan pelbagai seperti NLP, audio, dsb. , manakala dalam NLP Kekurangan data berlabel yang mencukupi dalam dan audio juga merupakan masalah biasa.
(2) Memakan masa dan tidak mesra akademik. Penanda aras pembelajaran separa penyeliaan sedia ada seperti TorchSSL selalunya memakan masa dan tidak mesra alam kerana ia sering memerlukan latihan model rangkaian saraf dalam dari awal. Khususnya, menilai FixMatch[1] menggunakan TorchSSL memerlukan kira-kira 300 hari GPU. Kos latihan yang tinggi sedemikian menjadikan penyelidikan berkaitan SSL tidak mampu dimiliki untuk kebanyakan makmal penyelidikan (terutamanya dalam kumpulan akademik atau penyelidikan kecil), sekali gus menghalang kemajuan SSL.
USB: Perpustakaan penanda aras baharu dengan pelbagai tugas dan lebih mesra penyelidik
Untuk menyelesaikan masalah di atas, penyelidik dari Microsoft Research Asia bekerjasama dengan Westlake University , Penyelidik Tokyo dari TU, Universiti Carnegie Mellon, Institut Max Planck dan institusi lain mencadangkan Penanda Aras SSL Bersepadu (USB), yang merupakan klasifikasi separa penyeliaan pertama untuk menyatukan tugas klasifikasi visual, bahasa dan audio Penanda Aras Pembelajaran.
Berbanding dengan tanda aras pembelajaran separa penyeliaan sebelumnya (seperti TorchSSL) yang hanya memfokuskan pada sebilangan kecil tugas visual, penanda aras ini bukan sahaja memperkenalkan medan aplikasi yang lebih pelbagai, tetapi juga menggunakan visual pra-latihan buat kali pertama Model (Pengubah penglihatan pralatihan) sangat mengurangkan masa pengesahan algoritma separa penyeliaan (daripada 7000 jam GPU kepada 900 jam GPU), menjadikan penyelidikan separa penyeliaan lebih mesra penyelidik, terutamanya kumpulan penyelidikan kecil.
Kertas kerja berkaitan telah diterima oleh NeurIPS 2022, persidangan akademik teratas dalam bidang kecerdasan buatan antarabangsa. (Klik "Baca teks asal" untuk mengetahui lebih lanjut)
Penyelesaian yang disediakan oleh USB
Jadi, bagaimanakah USB boleh menyelesaikan masalah penanda aras separa seliaan semasa dalam satu pergi? Para penyelidik terutamanya membuat penambahbaikan berikut:
(1) Untuk meningkatkan kepelbagaian tugas, USB memperkenalkan 5 set data CV, 5 set data NLP dan 5 set data audio, dan menyediakan pelbagai dan penanda aras yang mencabar yang membolehkan penilaian yang konsisten terhadap pelbagai tugas daripada domain yang berbeza. Jadual 1 menyediakan perbandingan terperinci tugas dan masa latihan antara USB dan TorchSSL.
Jadual 1: Perbandingan masa tugas dan latihan antara rangka kerja USB dan TorchSSL
(2) Untuk meningkatkan kecekapan latihan, penyelidik memperkenalkan Transformer visi pra-latihan ke dalam SSL dan bukannya melatih ResNets dari awal. Khususnya, penyelidik mendapati bahawa menggunakan model pra-latihan boleh mengurangkan bilangan lelaran latihan dengan ketara tanpa menjejaskan prestasi (cth., mengurangkan bilangan lelaran latihan untuk tugas CV daripada 1 juta langkah kepada 200,000 langkah).
(3) Untuk menjadi lebih mesra kepada penyelidik, penyelidik telah melaksanakan 14 algoritma SSL sebagai pustaka kod modular sumber terbuka dan sumber terbuka dan fail konfigurasi yang berkaitan untuk penyelidik menghasilkan semula keputusan dalam laporan USB dengan mudah. Untuk bermula dengan cepat, USB juga menyediakan dokumentasi dan tutorial terperinci. Selain itu, USB juga menyediakan pakej pip untuk pengguna menghubungi terus algoritma SSL. Para penyelidik berjanji untuk terus menambah algoritma baharu (seperti algoritma separa penyeliaan yang tidak seimbang, dsb.) dan set data yang lebih mencabar ke USB pada masa hadapan. Jadual 2 menunjukkan algoritma dan modul yang disokong dalam USB.
Jadual 2: Algoritma dan modul yang disokong dalam USB
Separuh pembelajaran yang diselia mempunyai nilai penyelidikan dan aplikasi yang penting pada masa hadapan dengan menggunakan sejumlah besar data tidak berlabel untuk melatih model yang lebih tepat dan mantap. Penyelidik di Microsoft Research Asia berharap untuk menggunakan kerja USB ini untuk membantu akademia dan industri mencapai kemajuan yang lebih besar dalam bidang pembelajaran separa penyeliaan.
Atas ialah kandungan terperinci USB: Penanda aras pembelajaran klasifikasi separa seliaan pertama yang menyatukan tugas klasifikasi visual, bahasa dan audio. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Koridor Keganasan ialah misi dalam Simulator Kambing 3. Bagaimanakah anda boleh menyelesaikan misi ini dengan kaedah pelepasan terperinci dan proses yang sepadan, dan dapat menyelesaikan cabaran yang sepadan dalam misi ini Panduan untuk mempelajari maklumat berkaitan. Simulator Kambing 3 Panduan Koridor Keganasan 1. Mula-mula, pemain perlu pergi ke Silent Hill di sudut kiri atas peta. 2. Di sini anda boleh melihat sebuah rumah dengan tulisan RESTSTOP di atas bumbung Pemain perlu mengendalikan kambing untuk memasuki rumah ini. 3. Selepas masuk ke dalam bilik, kami mula-mula pergi terus ke hadapan, dan kemudian belok kanan. Ada pintu di hujung sini, dan kami terus masuk dari sini. 4. Selepas masuk, kita juga perlu berjalan ke hadapan dan kemudian belok ke kanan apabila sampai ke pintu di sini, pintu akan ditutup dan kita perlu berpatah balik.

Untuk mengautomasikan tugas dan mengurus berbilang sistem, perisian perancangan tugas ialah alat yang berharga dalam senjata anda, terutamanya sebagai pentadbir sistem. Penjadual Tugas Windows melakukan tugas dengan sempurna, tetapi baru-baru ini ramai orang telah melaporkan ralat permintaan yang ditolak oleh operator. Masalah ini wujud dalam semua lelaran sistem pengendalian, dan walaupun ia telah dilaporkan dan dilindungi secara meluas, tiada penyelesaian yang berkesan. Teruskan membaca untuk mengetahui perkara yang mungkin berkesan untuk orang lain! Apakah permintaan dalam Penjadual Tugas 0x800710e0 yang dinafikan oleh pengendali atau pentadbir? Penjadual Tugas membolehkan mengautomasikan pelbagai tugas dan aplikasi tanpa input pengguna. Anda boleh menggunakannya untuk menjadualkan dan mengatur aplikasi tertentu, mengkonfigurasi pemberitahuan automatik, membantu menghantar mesej dan banyak lagi. ia

Simulator Kambing 3 ialah permainan dengan permainan simulasi klasik, membolehkan pemain mengalami sepenuhnya keseronokan simulasi aksi kasual Permainan ini juga mempunyai banyak tugas khas yang menarik Antaranya, tugas Makam Imperial Kambing memerlukan pemain mencari menara loceng. Sesetengah pemain tidak pasti bagaimana untuk mengendalikan tiga jam pada masa yang sama Berikut adalah panduan untuk misi Makam dalam Simulator Kambing 3 Panduan untuk misi Makam dalam Simulator Kambing 3 adalah untuk membunyikan loceng mengikut tertib. Perluasan langkah terperinci 1. Mula-mula, pemain perlu membuka peta dan pergi ke Tanah Perkuburan Wuqiu. 2. Kemudian naik ke menara loceng akan ada tiga loceng di dalam. 3. Kemudian, mengikut urutan daripada terbesar kepada terkecil, ikut kebiasaan 222312312. 4. Selepas selesai mengetuk, anda boleh menyelesaikan misi dan membuka pintu untuk mendapatkan lightsaber.

Rescue Steve ialah tugas unik dalam Goat Simulator 3. Apakah sebenarnya yang perlu dilakukan untuk menyelesaikannya? Tugas ini agak mudah, tetapi kami perlu berhati-hati agar tidak salah faham maksudnya. Di sini kami akan membawa anda untuk menyelamatkan Steve dalam Goat Simulator 3 Panduan tugas dapat menyelesaikan tugasan yang berkaitan dengan lebih baik. Simulator Kambing 3 Menyelamatkan Steve Strategi Misi 1. Mula-mula datang ke mata air panas di sudut kanan bawah peta. 2. Selepas tiba di kolam air panas, anda boleh mencetuskan tugas untuk menyelamatkan Steve. 3. Perhatikan bahawa terdapat seorang lelaki di kolam air panas Walaupun namanya Steve, dia bukan sasaran misi ini. 4. Cari ikan bernama Steve di kolam air panas ini dan bawa ia ke darat untuk menyelesaikan tugasan ini.

Sebagai salah satu platform media sosial yang paling popular pada masa ini, TikTok telah menarik sejumlah besar pengguna untuk mengambil bahagian. Di Douyin, terdapat banyak tugas kumpulan peminat yang pengguna boleh selesaikan untuk mendapatkan ganjaran dan faedah tertentu. Jadi, di manakah saya boleh mencari tugas kelab peminat Douyin? 1. Di manakah saya boleh mencari tugas kelab peminat Douyin? Untuk mencari tugas kumpulan peminat Douyin, anda perlu melawati laman utama peribadi Douyin. Pada halaman utama, anda akan melihat pilihan yang dipanggil "Kelab Peminat." Klik pilihan ini dan anda boleh menyemak imbas kumpulan peminat yang telah anda sertai dan tugasan yang berkaitan. Dalam lajur tugas kelab peminat, anda akan melihat pelbagai jenis tugasan, seperti suka, ulasan, perkongsian, pemajuan, dsb. Setiap tugasan mempunyai ganjaran dan keperluan yang sepadan Secara umumnya, selepas menyelesaikan tugasan, anda akan menerima sejumlah syiling emas atau mata pengalaman.

Ditulis sebelum ini, hari ini kita membincangkan bagaimana teknologi pembelajaran mendalam boleh meningkatkan prestasi SLAM berasaskan penglihatan (penyetempatan dan pemetaan serentak) dalam persekitaran yang kompleks. Dengan menggabungkan kaedah pengekstrakan ciri dalam dan pemadanan kedalaman, di sini kami memperkenalkan sistem SLAM visual hibrid serba boleh yang direka untuk meningkatkan penyesuaian dalam senario yang mencabar seperti keadaan cahaya malap, pencahayaan dinamik, kawasan bertekstur lemah dan seks yang teruk. Sistem kami menyokong berbilang mod, termasuk konfigurasi monokular, stereo, monokular-inersia dan stereo-inersia lanjutan. Selain itu, ia juga menganalisis cara menggabungkan SLAM visual dengan kaedah pembelajaran mendalam untuk memberi inspirasi kepada penyelidikan lain. Melalui percubaan yang meluas pada set data awam dan data sampel sendiri, kami menunjukkan keunggulan SL-SLAM dari segi ketepatan kedudukan dan keteguhan penjejakan.

1 Pengenalan Medan Sinaran Neural (NeRF) adalah paradigma yang agak baharu dalam bidang pembelajaran mendalam dan penglihatan komputer. Teknologi ini telah diperkenalkan dalam kertas kerja ECCV2020 "NeRF: Mewakili Pemandangan sebagai Medan Sinaran Neural untuk Sintesis Pandangan" (yang memenangi Anugerah Kertas Terbaik) dan sejak itu telah menjadi sangat popular, dengan hampir 800 petikan sehingga kini [1]. Pendekatan ini menandakan perubahan besar dalam cara tradisional pembelajaran mesin memproses data 3D. Perwakilan pemandangan medan sinaran saraf dan proses pemaparan yang boleh dibezakan: imej komposit dengan mensampel koordinat 5D (kedudukan dan arah tontonan) sepanjang sinar kamera menyuapkan kedudukan ini ke dalam MLP untuk menghasilkan ketumpatan warna dan isipadu dan menggabungkan nilai ini menggunakan imej teknik pemaparan volumetrik; ; fungsi rendering boleh dibezakan, jadi ia boleh diluluskan

Mencapai kepelbagaian tugas ialah isu teras dalam penyelidikan model asas pembelajaran mendalam, dan juga merupakan salah satu fokus utama dalam hala tuju terkini model besar. Walau bagaimanapun, dalam bidang siri masa, pelbagai jenis tugasan analisis sangat berbeza-beza, termasuk tugas ramalan yang memerlukan tugas pemodelan dan pengelasan yang terperinci yang memerlukan pengekstrakan maklumat semantik peringkat tinggi. Bagaimana untuk membina model asas mendalam bersatu untuk menyelesaikan pelbagai tugas analisis masa dengan cekap masih belum diwujudkan. Untuk tujuan ini, pasukan dari Sekolah Perisian Universiti Tsinghua menjalankan penyelidikan mengenai isu asas pemodelan perubahan masa dan cadangan TimesNet, model asas pemasaan tugasan universal yang telah diterima oleh ICLR 2023. Senarai pengarang: Wu Haixu*, Hu Tengge*, Liu Yong*, Zhou Hang, Wang Jianmin, Long Mingsheng Pautan: https://ope
