Microsoft mencadangkan OTO, rangka kerja pemangkasan latihan rangkaian saraf automatik, untuk mendapatkan model ringan berprestasi tinggi dalam sehenti-AI-php.cn

Jadual Kandungan

Algoritma pemangkasan struktur yang ideal hendaklah: untuk rangkaian saraf am, berlatih secara automatik dari awal dalam satu hentian, sambil mencapai model berprestasi tinggi dan ringan, tanpa memerlukan Penalaan Halus susulan. Tetapi kerana kerumitan rangkaian saraf, mencapai matlamat ini amat mencabar. Untuk mencapai matlamat utama ini, tiga soalan teras berikut perlu diselesaikan secara sistematik:

Percubaan berangka

Kesimpulan

Rumah

Peranti teknologi

Microsoft mencadangkan OTO, rangka kerja pemangkasan latihan rangkaian saraf automatik, untuk mendapatkan model ringan berprestasi tinggi dalam sehenti

PHPz

Apr 04, 2023 pm 12:50 PM

Microsoft rangkaian saraf

OTO ialah rangka kerja mampatan struktur dan latihan rangkaian saraf automatik, sehenti, mesra pengguna dan serba boleh yang pertama dalam industri.

Dalam era kecerdasan buatan, cara menggunakan dan menyelenggara rangkaian saraf adalah isu utama untuk pengeluaran Untuk menjimatkan kos pengkomputeran sambil meminimumkan kehilangan prestasi model sebanyak mungkin, memampatkan rangkaian saraf telah menjadi. salah satu kunci untuk menghasilkan DNN.

Microsoft mencadangkan OTO, rangka kerja pemangkasan latihan rangkaian saraf automatik, untuk mendapatkan model ringan berprestasi tinggi dalam sehenti

Mampatan DNN secara amnya mempunyai tiga kaedah, pemangkasan, penyulingan pengetahuan dan kuantisasi. Pemangkasan bertujuan untuk mengenal pasti dan membuang struktur berlebihan, melangsingkan DNN sambil mengekalkan prestasi model sebanyak mungkin, dan merupakan kaedah pemampatan yang paling serba boleh dan berkesan. Secara umumnya, ketiga-tiga kaedah boleh saling melengkapi dan bekerjasama untuk mencapai kesan mampatan terbaik.

Microsoft mencadangkan OTO, rangka kerja pemangkasan latihan rangkaian saraf automatik, untuk mendapatkan model ringan berprestasi tinggi dalam sehenti

Walau bagaimanapun, kebanyakan kaedah pemangkasan sedia ada hanya disasarkan pada model tertentu dan tugas khusus, dan memerlukan pengetahuan domain profesional yang kukuh, jadi ia biasanya memerlukan pembangun AI untuk berbelanja banyak Penggunaan kaedah ini pada senario anda sendiri memerlukan banyak tenaga kerja dan sumber material.

Gambaran Keseluruhan OTO

Untuk menyelesaikan masalah kaedah pemangkasan sedia ada dan memberikan kemudahan kepada pembangun AI, pasukan Microsoft mencadangkan rangka kerja OTO Only-Train-Once. OTO ialah rangka kerja latihan rangkaian saraf dan pemampatan struktur automatik, sehenti, mesra pengguna dan universal yang pertama dalam industri Satu siri kerja telah diterbitkan dalam ICLR2023 dan NeurIPS2021.

Dengan menggunakan OTO, jurutera AI boleh melatih rangkaian saraf sasaran dengan mudah dan memperoleh model berprestasi tinggi dan ringan dalam satu perhentian. OTO meminimumkan pelaburan pemaju dalam masa dan usaha kejuruteraan, dan tidak memerlukan pra-latihan yang memakan masa dan penalaan halus model tambahan yang biasanya diperlukan oleh kaedah sedia ada.

Pautan kertas:
OTOv2 ICLR 2023: https://openreview.net/pdf?id=7ynoX1ojPMt
OTOv1 NeurIPS 2021: https://proceedings .neurips.cc/paper_files/paper/2021/file/a376033f78e144f494bfc743c0be3330-Paper.pdf
Pautan kod:
https://github.com/tianyic_>

Algoritma pemangkasan struktur yang ideal hendaklah: untuk rangkaian saraf am, berlatih secara automatik dari awal dalam satu hentian, sambil mencapai model berprestasi tinggi dan ringan, tanpa memerlukan Penalaan Halus susulan. Tetapi kerana kerumitan rangkaian saraf, mencapai matlamat ini amat mencabar. Untuk mencapai matlamat utama ini, tiga soalan teras berikut perlu diselesaikan secara sistematik:

Bagaimana untuk mengetahui struktur rangkaian yang boleh dialih keluar?

Bagaimana untuk mengalih keluar struktur rangkaian tanpa kehilangan prestasi model sebanyak mungkin?
Bagaimanakah kita boleh mencapai dua mata di atas secara automatik?
Pasukan Microsoft mereka bentuk dan melaksanakan tiga set algoritma teras, secara sistematik dan menyeluruh menyelesaikan tiga masalah teras ini buat kali pertama.

Kumpulan Sifar-Invarian Automatik

Disebabkan oleh kerumitan dan korelasi struktur rangkaian, pemadaman mana-mana struktur rangkaian boleh mengakibatkan baki Struktur rangkaian tidak sah. Oleh itu, salah satu masalah terbesar dalam pemampatan struktur rangkaian automatik ialah bagaimana untuk mencari parameter model yang mesti dipangkas bersama supaya rangkaian yang tinggal masih sah. Untuk menyelesaikan masalah ini, pasukan Microsoft mencadangkan Zero-Invariant Groups (ZIGs) dalam OTOv1. Kumpulan sifar-invarian boleh difahami sebagai jenis unit boleh alih terkecil, supaya rangkaian yang tinggal masih sah selepas struktur rangkaian kumpulan yang sepadan dialih keluar. Satu lagi sifat hebat kumpulan sifar-invarian ialah jika kumpulan sifar-invarian adalah sama dengan sifar, maka tidak kira apa nilai input, nilai output sentiasa sifar. Dalam OTOv2, para penyelidik seterusnya mencadangkan dan melaksanakan satu set algoritma automatik untuk menyelesaikan masalah pengelompokan kumpulan sifar-invarian dalam rangkaian umum. Algoritma pengelompokan automatik ialah gabungan yang direka dengan teliti bagi siri algoritma graf Keseluruhan algoritma adalah sangat cekap dan mempunyai kerumitan masa dan ruang linear.

Microsoft mencadangkan OTO, rangka kerja pemangkasan latihan rangkaian saraf automatik, untuk mendapatkan model ringan berprestasi tinggi dalam sehenti

Dual Half Plane Projected Gradient Optimization Algorithm (DHSPG)

Selepas membahagikan semua kumpulan sifar-invarian rangkaian sasaran, maka Latihan model berikut dan tugas pemangkasan perlu mengetahui kumpulan sifar-invarian yang berlebihan dan yang mana yang penting. Struktur rangkaian yang sepadan dengan kumpulan sifar-invarian berlebihan perlu dipadamkan, dan kumpulan sifar-invarian yang penting perlu dikekalkan untuk memastikan prestasi model mampatan. Para penyelidik merumuskan masalah ini sebagai masalah sparsifikasi struktur dan mencadangkan algoritma pengoptimuman Dual Half-Space Projected Gradient (DHSPG) baharu untuk menyelesaikannya.

Microsoft mencadangkan OTO, rangka kerja pemangkasan latihan rangkaian saraf automatik, untuk mendapatkan model ringan berprestasi tinggi dalam sehenti

DHSPG boleh mencari kumpulan invarian sifar yang berlebihan dan mengunjurkannya kepada sifar, dan terus melatih kumpulan sifar-invarian yang penting untuk mencapai prestasi yang setanding dengan model asal.

Berbanding dengan algoritma pengoptimuman jarang tradisional, DHSPG mempunyai keupayaan penerokaan struktur jarang yang lebih kukuh dan stabil, dan mengembangkan ruang carian latihan dan oleh itu biasanya mencapai hasil prestasi sebenar yang lebih tinggi.

Microsoft mencadangkan OTO, rangka kerja pemangkasan latihan rangkaian saraf automatik, untuk mendapatkan model ringan berprestasi tinggi dalam sehenti

Membina model mampatan ringan secara automatik

Dengan menggunakan DHSPG untuk melatih model, kami akan mendapat model A invarian sifar penyelesaian dengan kesederhanaan struktur kumpulan yang tinggi, iaitu penyelesaian dengan banyak kumpulan invarian sifar yang diunjurkan kepada sifar, juga akan mempunyai prestasi model yang tinggi. Seterusnya, penyelidik memadamkan semua struktur yang sepadan dengan kumpulan invarian sifar berlebihan untuk membina rangkaian mampatan secara automatik. Disebabkan oleh ciri-ciri kumpulan sifar-invarian, iaitu, jika kumpulan sifar-invarian adalah sama dengan sifar, maka tidak kira apa nilai input, nilai output akan sentiasa sifar, jadi memadam kumpulan sifar-invarian berlebihan tidak akan mempunyai sebarang kesan ke atas rangkaian. Oleh itu, rangkaian termampat yang diperoleh melalui OTO akan mempunyai output yang sama seperti rangkaian penuh, tanpa memerlukan penalaan halus model lanjut yang diperlukan oleh kaedah tradisional.

Percubaan berangka

Tugas pengelasan

Microsoft mencadangkan OTO, rangka kerja pemangkasan latihan rangkaian saraf automatik, untuk mendapatkan model ringan berprestasi tinggi dalam sehenti

Jadual 1: VGG16 dan VGG16- dalam CIFAR10 BN prestasi model

Dalam percubaan VGG16 CIFAR10, OTO mengurangkan nombor titik terapung sebanyak 86.6% dan bilangan parameter sebanyak 97.5%, dan prestasinya mengagumkan.

Microsoft mencadangkan OTO, rangka kerja pemangkasan latihan rangkaian saraf automatik, untuk mendapatkan model ringan berprestasi tinggi dalam sehenti

Jadual 2: Percubaan ResNet50 CIFAR10

Dalam percubaan ResNet50 CIFAR10, OTO mengatasi prestasi tanpa pengkuantitian Pemampatan rangkaian saraf SOTA rangka kerja AMC dan ANNC hanya menggunakan 7.8% daripada FLOP dan 4.1% daripada parameter.

Microsoft mencadangkan OTO, rangka kerja pemangkasan latihan rangkaian saraf automatik, untuk mendapatkan model ringan berprestasi tinggi dalam sehenti

Jadual 3. Percubaan ResNet50 ImageNet

Dalam percubaan ResNet50 ImageNet, OTOv2 di bawah sasaran sparsifikasi struktur yang berbeza, Ia menunjukkan prestasi yang setanding atau lebih baik daripada kaedah SOTA sedia ada.

Microsoft mencadangkan OTO, rangka kerja pemangkasan latihan rangkaian saraf automatik, untuk mendapatkan model ringan berprestasi tinggi dalam sehenti

Jadual 4: Lebih banyak struktur dan set data

OTO juga telah mencapai lebih banyak set data dan struktur model Bukan prestasi yang buruk.

Tugas Penglihatan Peringkat Rendah

Microsoft mencadangkan OTO, rangka kerja pemangkasan latihan rangkaian saraf automatik, untuk mendapatkan model ringan berprestasi tinggi dalam sehenti

Jadual 4: Eksperimen CARNx2

Dalam tugas resolusi super, latihan sehenti OTO memampatkan rangkaian CARNx2, mencapai prestasi kompetitif dengan model asal dan memampatkan jumlah pengiraan dan saiz model lebih daripada 75%.

Tugas model bahasa

Microsoft mencadangkan OTO, rangka kerja pemangkasan latihan rangkaian saraf automatik, untuk mendapatkan model ringan berprestasi tinggi dalam sehenti

Selain itu, penyelidik juga menjalankan salah satu algoritma teras, algoritma pengoptimuman DHSPG, pada Bert . Percubaan perbandingan mengesahkan prestasi tingginya berbanding dengan algoritma pengoptimuman jarang yang lain. Ia boleh didapati bahawa pada Skuad, pengurangan parameter dan prestasi model yang diperoleh dengan menggunakan DHSPG untuk latihan adalah jauh lebih baik daripada algoritma pengoptimuman jarang yang lain.

Kesimpulan

Pasukan Microsoft mencadangkan rangka kerja pemangkasan struktur latihan rangkaian saraf sehenti automatik yang dipanggil OTO (Only-Train-Once). Ia secara automatik boleh memampatkan rangkaian saraf yang lengkap ke dalam rangkaian ringan sambil mengekalkan prestasi tinggi. OTO sangat memudahkan proses pelbagai peringkat kompleks kaedah pemangkasan struktur sedia ada, sesuai untuk pelbagai seni bina rangkaian dan aplikasi, dan meminimumkan pelaburan kejuruteraan tambahan pengguna. Ia serba boleh, berkesan dan mudah digunakan.

Atas ialah kandungan terperinci Microsoft mencadangkan OTO, rangka kerja pemangkasan latihan rangkaian saraf automatik, untuk mendapatkan model ringan berprestasi tinggi dalam sehenti. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

3 minggu yang lalu By DDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

2 minggu yang lalu By DDD

Akan R.E.P.O. Ada Crossplay?

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7552

Tutorial CakePHP

1382

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Peningkatan Microsoft Edge: Fungsi penjimatan kata laluan automatik diharamkan? ! Pengguna terkejut! Apr 19, 2024 am 08:13 AM

Berita pada 18 April: Baru-baru ini, beberapa pengguna pelayar Microsoft Edge menggunakan saluran Canary melaporkan bahawa selepas menaik taraf kepada versi terkini, mereka mendapati bahawa pilihan untuk menyimpan kata laluan secara automatik telah dilumpuhkan. Selepas penyiasatan, didapati bahawa ini adalah pelarasan kecil selepas naik taraf penyemak imbas, bukannya pembatalan fungsi. Sebelum menggunakan penyemak imbas Edge untuk mengakses laman web, pengguna melaporkan bahawa penyemak imbas akan muncul tetingkap bertanya sama ada mereka mahu menyimpan kata laluan log masuk untuk tapak web tersebut. Selepas memilih untuk menyimpan, Edge secara automatik akan mengisi akaun dan kata laluan yang disimpan apabila anda log masuk seterusnya, memberikan pengguna kemudahan yang hebat. Tetapi kemas kini terkini menyerupai tweak, menukar tetapan lalai. Pengguna perlu memilih untuk menyimpan kata laluan dan kemudian menghidupkan pengisian automatik akaun yang disimpan dan kata laluan dalam tetapan.

Microsoft mengeluarkan kemas kini kumulatif Win11 Ogos: meningkatkan keselamatan, mengoptimumkan skrin kunci, dsb. Aug 14, 2024 am 10:39 AM

Menurut berita dari tapak ini pada 14 Ogos, semasa hari acara August Patch Tuesday hari ini, Microsoft mengeluarkan kemas kini kumulatif untuk sistem Windows 11, termasuk kemas kini KB5041585 untuk 22H2 dan 23H2, dan kemas kini KB5041592 untuk 21H2. Selepas peralatan yang disebutkan di atas dipasang dengan kemas kini kumulatif Ogos, perubahan nombor versi yang dilampirkan pada tapak ini adalah seperti berikut: Selepas pemasangan peralatan 21H2, nombor versi meningkat kepada Build22000.314722H2 Selepas pemasangan peralatan, nombor versi meningkat kepada Build22621.403723H2 Selepas pemasangan peralatan, nombor versi meningkat kepada Build22631.4037 Kandungan utama kemas kini KB5041585 untuk Windows 1121H2 adalah seperti berikut: Penambahbaikan.

Pop timbul skrin penuh Microsoft menggesa pengguna Windows 10 untuk menyegerakan dan menaik taraf kepada Windows 11 Jun 06, 2024 am 11:35 AM

Menurut berita pada 3 Jun, Microsoft sedang aktif menghantar pemberitahuan skrin penuh kepada semua pengguna Windows 10 untuk menggalakkan mereka menaik taraf kepada sistem pengendalian Windows 11. Langkah ini melibatkan peranti yang konfigurasi perkakasannya tidak menyokong sistem baharu. Sejak 2015, Windows 10 telah menduduki hampir 70% bahagian pasaran, dengan kukuh mengukuhkan penguasaannya sebagai sistem pengendalian Windows. Walau bagaimanapun, bahagian pasaran jauh melebihi bahagian pasaran 82%, dan bahagian pasaran jauh melebihi Windows 11, yang akan dikeluarkan pada 2021. Walaupun Windows 11 telah dilancarkan selama hampir tiga tahun, penembusan pasarannya masih perlahan. Microsoft telah mengumumkan bahawa ia akan menamatkan sokongan teknikal untuk Windows 10 selepas 14 Oktober 2025 untuk memberi tumpuan lebih kepada

Fungsi Microsoft Win11 untuk memampatkan fail 7z dan TAR telah diturunkan daripada versi 24H2 kepada 23H2/22H2 Apr 28, 2024 am 09:19 AM

Menurut berita dari laman web ini pada 27 April, Microsoft mengeluarkan kemas kini versi pratonton Windows 11 Build 26100 ke saluran Canary dan Dev awal bulan ini, yang dijangka menjadi calon versi RTM bagi kemas kini Windows 1124H2. Perubahan utama dalam versi baharu ialah peneroka fail, penyepaduan Copilot, penyuntingan metadata fail PNG, penciptaan fail termampat TAR dan 7z, dsb. @PhantomOfEarth mendapati bahawa Microsoft telah menurunkan beberapa fungsi versi 24H2 (Germanium) kepada versi 23H2/22H2 (Nikel), seperti mencipta fail mampat TAR dan 7z. Seperti yang ditunjukkan dalam rajah, Windows 11 akan menyokong penciptaan asli TAR

Kemas kini pelayar Microsoft Edge: Menambah fungsi 'zum dalam imej' untuk meningkatkan pengalaman pengguna Mar 21, 2024 pm 01:40 PM

Menurut berita pada 21 Mac, Microsoft baru-baru ini mengemas kini pelayar Microsoft Edge dan menambah fungsi "besarkan imej" praktikal. Kini, apabila menggunakan pelayar Edge, pengguna boleh mencari ciri baharu ini dengan mudah dalam menu pop timbul dengan hanya mengklik kanan pada imej. Apa yang lebih mudah ialah pengguna juga boleh menuding kursor pada imej dan kemudian klik dua kali kekunci Ctrl untuk menggunakan fungsi mengezum masuk dengan cepat pada imej. Mengikut pemahaman editor, pelayar Microsoft Edge yang baru dikeluarkan telah diuji untuk ciri-ciri baru dalam saluran Canary. Versi pelayar yang stabil juga secara rasminya telah melancarkan fungsi "besarkan imej" praktikal, memberikan pengguna pengalaman menyemak imbas imej yang lebih mudah. Media sains dan teknologi asing turut memberi perhatian kepada perkara ini

Meneroka rangkaian Siam menggunakan kehilangan kontrastif untuk perbandingan persamaan imej Apr 02, 2024 am 11:37 AM

Pengenalan Dalam bidang penglihatan komputer, mengukur kesamaan imej dengan tepat adalah tugas kritikal dengan pelbagai aplikasi praktikal. Daripada enjin carian imej kepada sistem pengecaman muka dan sistem pengesyoran berasaskan kandungan, keupayaan untuk membandingkan dan mencari imej serupa dengan cekap adalah penting. Rangkaian Siam digabungkan dengan kehilangan kontras menyediakan rangka kerja yang kuat untuk mempelajari persamaan imej dalam cara yang dipacu data. Dalam catatan blog ini, kami akan menyelami butiran rangkaian Siam, meneroka konsep kehilangan kontras dan meneroka cara kedua-dua komponen ini berfungsi bersama untuk mencipta model persamaan imej yang berkesan. Pertama, rangkaian Siam terdiri daripada dua subrangkaian yang sama yang berkongsi berat dan parameter yang sama. Setiap sub-rangkaian mengekod imej input ke dalam vektor ciri, yang

Microsoft merancang untuk menghapuskan NTLM secara berperingkat dalam Windows 11 pada separuh kedua 2024 dan beralih sepenuhnya kepada pengesahan Kerberos Jun 09, 2024 pm 04:17 PM

Pada separuh kedua 2024, Blog Keselamatan Microsoft rasmi menerbitkan mesej sebagai respons kepada panggilan daripada komuniti keselamatan. Syarikat itu merancang untuk menghapuskan protokol pengesahan Pengurus NTLAN (NTLM) dalam Windows 11, dikeluarkan pada separuh kedua 2024, untuk meningkatkan keselamatan. Menurut penjelasan sebelum ini, Microsoft telah pun membuat langkah serupa sebelum ini. Pada 12 Oktober tahun lepas, Microsoft mencadangkan pelan peralihan dalam siaran akhbar rasmi yang bertujuan untuk menghapuskan kaedah pengesahan NTLM secara berperingkat dan mendorong lebih banyak perusahaan dan pengguna beralih kepada Kerberos. Untuk membantu perusahaan yang mungkin mengalami masalah dengan aplikasi dan perkhidmatan berwayar tegar selepas mematikan pengesahan NTLM, Microsoft menyediakan IAKerb dan

Microsoft melancarkan versi baharu Outlook untuk Windows: peningkatan komprehensif fungsi kalendar Apr 27, 2024 pm 03:44 PM

Dalam berita pada 27 April, Microsoft mengumumkan bahawa ia tidak lama lagi akan mengeluarkan ujian versi baharu klien Outlook untuk Windows. Kemas kini ini tertumpu terutamanya pada mengoptimumkan fungsi kalendar, bertujuan untuk meningkatkan kecekapan kerja pengguna dan memudahkan lagi aliran kerja harian. Penambahbaikan versi baharu klien Outlook untuk Windows terletak pada fungsi pengurusan kalendarnya yang lebih berkuasa. Kini, pengguna boleh berkongsi maklumat masa kerja dan lokasi peribadi dengan lebih mudah, menjadikan perancangan mesyuarat lebih cekap. Selain itu, Outlook juga telah menambah tetapan mesra pengguna, membolehkan pengguna menetapkan mesyuarat untuk tamat awal secara automatik atau bermula kemudian, memberikan pengguna lebih fleksibiliti, sama ada mereka ingin menukar bilik mesyuarat, berehat atau menikmati secawan kopi . mengikut

See all articles