Jadual Kandungan
Memecah dan menyusun semula model yang mendalam
Hasil eksperimen
Penyusunan semula model sesuai untuk pembelajaran pemindahan" >Penyusunan semula model sesuai untuk pembelajaran pemindahan
Ringkasan
Rumah Peranti teknologi AI Cara yang betul untuk bermain pembelajaran mendalam blok binaan! Universiti Nasional Singapura mengeluarkan DeRy, paradigma pembelajaran pemindahan baharu yang menukar pemindahan pengetahuan kepada percetakan jenis alih

Cara yang betul untuk bermain pembelajaran mendalam blok binaan! Universiti Nasional Singapura mengeluarkan DeRy, paradigma pembelajaran pemindahan baharu yang menukar pemindahan pengetahuan kepada percetakan jenis alih

Apr 11, 2023 pm 08:43 PM
Model pembelajaran yang mendalam

Semasa zaman Qingli Renzong dalam Dinasti Song Utara 980 tahun yang lalu, revolusi pengetahuan sedang berlaku secara senyap-senyap di China.

Pencetus semua ini bukanlah kata-kata orang bijak yang tinggal di kuil, tetapi batu bata tanah liat dengan tulisan biasa yang dibakar sekeping demi sekeping.

Revolusi ini betul-betul "cetakan jenis alih".

Kehalusan percetakan jenis alih terletak pada idea "pemasangan blok bangunan": tukang mula-mula membuat acuan aksara terbalik bagi aksara tunggal, dan kemudian menambah aksara tunggal mengikut manuskrip Dipilih dan dicetak dengan dakwat, fon ini boleh digunakan seberapa banyak yang diperlukan.

Berbanding dengan proses rumit "satu cetakan, satu versi" cetakan kayu, Modular-Assemble on demand-Pelbagai kegunaan Ini mod kerja secara geometri meningkatkan kecekapan percetakan dan meletakkan asas untuk pembangunan dan pewarisan tamadun manusia selama beribu-ribu tahun.

Kembali ke bidang pembelajaran mendalam, hari ini dengan populariti model pra-latihan yang besar, cara memindahkan keupayaan satu siri model besar kepada tertentu tugas hiliran telah menjadi soalan Utama.

Kaedah pemindahan pengetahuan atau penggunaan semula sebelumnya adalah serupa dengan "pencetakan blok": kita selalunya perlu melatih model lengkap baharu mengikut keperluan tugas. Kaedah-kaedah ini selalunya disertai dengan kos latihan yang besar dan sukar untuk skala kepada sejumlah besar tugas.

Jadi idea yang sangat semula jadi muncul: Bolehkah kita menganggap rangkaian saraf sebagai himpunan blok binaan dan mendapatkan rangkaian baharu? dengan memasang semula rangkaian sedia ada, dan menggunakannya untuk melaksanakan pembelajaran pemindahan?

Cara yang betul untuk bermain pembelajaran mendalam blok binaan! Universiti Nasional Singapura mengeluarkan DeRy, paradigma pembelajaran pemindahan baharu yang menukar pemindahan pengetahuan kepada percetakan jenis alih

Di NeurIPS 2022, daripada Universiti Kebangsaan Singapura Pasukan LVlab telah mencadangkan paradigma pembelajaran pemindahan baharu yang dipanggil "Pemasangan Semula Model Dalam".

Cara yang betul untuk bermain pembelajaran mendalam blok binaan! Universiti Nasional Singapura mengeluarkan DeRy, paradigma pembelajaran pemindahan baharu yang menukar pemindahan pengetahuan kepada percetakan jenis alih

Pautan kertas: https://arxiv.org/abs/2210.17409

Pautan kod: https://github.com/Adamdad/DeRy

Laman utama projek: https://adamdad.github.io/dery/

OpenReview: https://openreview.net/forum?id=gtCPWaY5bNh

Penulis dahulu Leraikan model pra-latihan sedia ada ke dalam sub-rangkaian berdasarkan persamaan fungsi, dan kemudian pasang semula sub-rangkaian untuk membina model yang cekap dan mudah digunakan untuk tugasan tertentu.

Kertas tersebut telah diterima oleh NeurIPS dengan markah 886 dan disyorkan untuk Pencalonan Anugerah Kertas.

Cara yang betul untuk bermain pembelajaran mendalam blok binaan! Universiti Nasional Singapura mengeluarkan DeRy, paradigma pembelajaran pemindahan baharu yang menukar pemindahan pengetahuan kepada percetakan jenis alih

Dalam artikel ini, penulis meneroka tugas pemindahan pengetahuan baharu yang dipanggil Deep Model Reassembly (pendek kata DeRy), digunakan untuk kegunaan semula model umum.

Memandangkan satu set model pra-latihan yang dilatih pada data yang berbeza dan seni bina heterogen, penstrukturan model mendalam mula-mula membahagikan setiap model kepada ketulan model bebas dan kemudian secara selektif untuk memasang semula kepingan submodel dalam perkakasan dan kekangan prestasi.

Cara yang betul untuk bermain pembelajaran mendalam blok binaan! Universiti Nasional Singapura mengeluarkan DeRy, paradigma pembelajaran pemindahan baharu yang menukar pemindahan pengetahuan kepada percetakan jenis alih

Kaedah ini serupa dengan merawat model rangkaian saraf dalam sebagai blok binaan: hapus blok bangunan besar sedia ada kepada blok bangunan kecil, dan kemudian bahagian dipasang mengikut keperluan. Model baharu yang dipasang bukan sahaja harus mempunyai prestasi yang lebih kukuh; proses pemasangan tidak seharusnya mengubah struktur dan parameter modul asal sebanyak mungkin untuk memastikan kecekapannya.

Memecah dan menyusun semula model yang mendalam

Kaedah dalam artikel ini boleh dibahagikan kepada dua bahagian. DeRy mula-mula menyelesaikan Masalah Penutup Set dan membahagikan semua rangkaian pra-latihan mengikut tahap fungsian, dalam langkah kedua, DeRy memformalkan pemasangan model menjadi masalah pengaturcaraan integer 0-1 untuk memastikan model yang dipasang adalah Prestasi terbaik pada tugasan tertentu.

Cara yang betul untuk bermain pembelajaran mendalam blok binaan! Universiti Nasional Singapura mengeluarkan DeRy, paradigma pembelajaran pemindahan baharu yang menukar pemindahan pengetahuan kepada percetakan jenis alih

Pemasangan Semula Model Dalam

Pertama, pengarang mentakrifkan masalah pemasangan semula model dalam: memandangkan model dalam yang terlatih, ia dipanggil perpustakaan model.

Setiap model terdiri daripada pautan lapisan, diwakili oleh . Rangkaian yang berbeza boleh mempunyai struktur dan operasi yang berbeza sepenuhnya, selagi model disambungkan lapisan demi lapisan.

Memandangkan tugasan, kami berharap dapat mencari model campuran lapisan dengan prestasi terbaik, dan jumlah pengiraan model memenuhi had tertentu:

Cara yang betul untuk bermain pembelajaran mendalam blok binaan! Universiti Nasional Singapura mengeluarkan DeRy, paradigma pembelajaran pemindahan baharu yang menukar pemindahan pengetahuan kepada percetakan jenis alih

Prestasi pada tugasan mewakili operasi lapisan model ke; Maksimumkan hasil. Pada dasarnya, tugas ini melibatkan pengoptimuman gabungan yang sangat kompleks.

Untuk memudahkan kos carian, artikel ini mula-mula memisahkan model perpustakaan model dari arah kedalaman untuk membentuk beberapa sub-rangkaian yang lebih cetek dan lebih kecil kemudian melakukan carian penyambungan di sub-; tahap rangkaian.

Pisah rangkaian mengikut tahap fungsi

Langkah pertama dalam DeRy ialah Ambil memisahkan model pembelajaran mendalam seperti blok binaan. Penulis menggunakan kaedah pemisahan rangkaian dalam untuk membahagikan model dalam kepada beberapa model kecil yang lebih cetek.

Artikel berharap submodel yang dibongkar mempunyai fungsi yang berbeza sebaik mungkin. Proses ini boleh dibandingkan dengan proses merungkai blok bangunan dan memasukkannya ke dalam kotak mainan mengikut kategori: Blok bangunan yang serupa disatukan, dan blok bangunan yang berbeza diasingkan.

Sebagai contoh, bahagikan model kepada lapisan bawah dan lapisan yang lebih tinggi, dan jangkakan bahawa lapisan bawah bertanggungjawab terutamanya untuk mengenal pasti corak tempatan seperti lengkung atau bentuk, manakala lapisan yang lebih tinggi boleh menilai keseluruhan semantik sampel.

Menggunakan ukuran persamaan ciri umum, persamaan fungsi mana-mana model boleh diukur secara kuantitatif. Cara yang betul untuk bermain pembelajaran mendalam blok binaan! Universiti Nasional Singapura mengeluarkan DeRy, paradigma pembelajaran pemindahan baharu yang menukar pemindahan pengetahuan kepada percetakan jenis alih

Idea utama ialah untuk input yang serupa, rangkaian saraf dengan fungsi yang sama boleh menghasilkan output yang serupa.

Jadi, untuk tensor input X dan X' yang sepadan dengan jumlah kedua-dua rangkaian, persamaan fungsinya ditakrifkan sebagai:

Kemudian perpustakaan model boleh dibahagikan kepada set kesetaraan fungsi melalui persamaan fungsi.

Subrangkaian dalam setiap set kesetaraan mempunyai persamaan fungsi yang tinggi, dan pembahagian setiap model memastikan kebolehpisahan perpustakaan model.

Faedah teras pembongkaran sedemikian ialah disebabkan persamaan fungsi, sub-rangkaian dalam setiap set setara boleh dianggap sebagai kira-kira komutatif, iaitu, blok rangkaian boleh Digantikan dengan subrangkaian lain daripada set kesetaraan yang sama tanpa menjejaskan ramalan rangkaian.

Masalah pemisahan di atas boleh diformalkan sebagai masalah pengoptimuman terkekang tiga peringkat:

Cara yang betul untuk bermain pembelajaran mendalam blok binaan! Universiti Nasional Singapura mengeluarkan DeRy, paradigma pembelajaran pemindahan baharu yang menukar pemindahan pengetahuan kepada percetakan jenis alih

The pengoptimuman peringkat dalaman bagi masalah ini sangat serupa dengan masalah set penutup umum atau masalah pembahagian graf. Oleh itu, penulis menggunakan algoritma heuristik Kernighan-Lin (KL) untuk mengoptimumkan lapisan dalam.

Idea umum ialah untuk dua submodel yang dimulakan secara rawak, satu lapisan operasi ditukar setiap kali Jika pertukaran boleh meningkatkan nilai fungsi penilaian, pertukaran itu dikekalkan ; jika tidak, ia ditinggalkan.

Gelung luar di sini menggunakan algoritma pengelompokan K-Means.

Untuk setiap bahagian rangkaian, setiap sub-rangkaian sentiasa diberikan kepada set fungsi dengan jarak tengah terbesar. Oleh kerana gelung dalam dan luar adalah berulang dan mempunyai jaminan penumpuan, pemisahan subrangkaian optimum mengikut tahap fungsi boleh diperolehi dengan menyelesaikan masalah di atas.

Pemasangan rangkaian berdasarkan pengoptimuman integer

Pembahagian rangkaian membahagikan setiap rangkaian kepada sub-rangkaian, setiap sub-rangkaian Kepunyaan set kesetaraan. Ini boleh digunakan sebagai ruang carian untuk mencari penyambungan rangkaian yang optimum untuk tugas hiliran.

Cara yang betul untuk bermain pembelajaran mendalam blok binaan! Universiti Nasional Singapura mengeluarkan DeRy, paradigma pembelajaran pemindahan baharu yang menukar pemindahan pengetahuan kepada percetakan jenis alih

Disebabkan kepelbagaian submodel, pemasangan rangkaian ini merupakan masalah pengoptimuman gabungan dengan ruang carian yang besar dan keadaan carian tertentu ditentukan : Setiap gabungan rangkaian mengambil blok rangkaian daripada set fungsi yang sama dan meletakkannya mengikut kedudukannya dalam rangkaian asal, rangkaian yang disintesis perlu memenuhi had pengiraan. Proses ini digambarkan sebagai pengoptimuman masalah pengoptimuman integer 0-1.

Cara yang betul untuk bermain pembelajaran mendalam blok binaan! Universiti Nasional Singapura mengeluarkan DeRy, paradigma pembelajaran pemindahan baharu yang menukar pemindahan pengetahuan kepada percetakan jenis alih

Untuk mengurangkan lagi overhed latihan mengira prestasi model gabungan setiap kali, penulis menggunakan fungsi alternatif dalam latihan NAS yang tidak memerlukan latihan, dipanggil untuk NASWOT. Daripada ini, prestasi sebenar rangkaian boleh dianggarkan hanya dengan menggunakan inferens rangkaian pada set data tertentu.

Melalui proses split-recombine yang dinyatakan di atas, model pra-latihan yang berbeza boleh disambung dan digabungkan untuk mendapatkan model baharu dan lebih kukuh.

Hasil eksperimen

Penyusunan semula model sesuai untuk pembelajaran pemindahan

Pengarang menggunakan model yang mengandungi 30 pra-latihan berbeza rangkaian Perpustakaan telah dibongkar dan dipasang semula dengan teliti, dan prestasi dinilai pada ImageNet dan 9 tugas pengelasan hiliran lain.

Dua kaedah latihan berbeza telah digunakan dalam percubaan: Penalaan Penuh, yang bermaksud bahawa semua parameter model yang disambungkan telah dilatih; - Penalaan bermakna hanya lapisan sambungan yang disambungkan dilatih.

Selain itu, lima model skala telah dipilih dan dibandingkan, dipanggil DeRy(, ,).

Cara yang betul untuk bermain pembelajaran mendalam blok binaan! Universiti Nasional Singapura mengeluarkan DeRy, paradigma pembelajaran pemindahan baharu yang menukar pemindahan pengetahuan kepada percetakan jenis alih

Seperti yang anda lihat dalam gambar di atas, pada set data ImageNet, model skala berbeza yang diperoleh oleh DeRy boleh lebih baik daripada atau sama dengan model saiz yang serupa dalam perpustakaan model.

Telah didapati bahawa walaupun hanya parameter bahagian pautan dilatih, model masih boleh mencapai peningkatan prestasi yang kukuh. Sebagai contoh, model DeRy(4,90,20) mencapai ketepatan Top1 sebanyak 78.6% dengan hanya 1.27M parameter yang dilatih.

Cara yang betul untuk bermain pembelajaran mendalam blok binaan! Universiti Nasional Singapura mengeluarkan DeRy, paradigma pembelajaran pemindahan baharu yang menukar pemindahan pengetahuan kepada percetakan jenis alih

Pada masa yang sama, 9 eksperimen pembelajaran pemindahan juga mengesahkan keberkesanan DeRy. Ia boleh dilihat bahawa tanpa pra-latihan, model DeRy boleh mengatasi model lain dalam perbandingan pelbagai saiz model dengan pra-latihan model yang dipasang semula secara berterusan, prestasi model boleh dipertingkatkan dengan ketara.

Berbanding dengan kaedah pemindahan pembelajaran lain daripada perpustakaan model seperti LEEP atau LogME, DeRy boleh melepasi had prestasi perpustakaan model itu sendiri, malah lebih baik daripada model terbaik dalam versi asal perpustakaan model.

Meneroka sifat penyusunan semula model

Pengarang juga sangat ingin tahu tentang penyusunan semula model yang dicadangkan dalam sifat artikel ini, seperti "Corak apakah model yang akan dipecahkan mengikut peraturan apa?". Penulis menyediakan eksperimen untuk analisis.

Persamaan fungsi, lokasi penyusunan semula dan prestasi penyusunan semula

Pengarang meneroka bagaimana blok rangkaian yang sama digunakan oleh lain Selepas menggantikan blok rangkaian dengan persamaan fungsi yang berbeza, Penalaan Pembekuan perbandingan prestasi 20 zaman. ​

Cara yang betul untuk bermain pembelajaran mendalam blok binaan! Universiti Nasional Singapura mengeluarkan DeRy, paradigma pembelajaran pemindahan baharu yang menukar pemindahan pengetahuan kepada percetakan jenis alih

Untuk ResNet50 yang dilatih di ImageNet, gunakan blok rangkaian peringkat ke-3 dan ke-4, Penggantian dengan blok rangkaian berbeza untuk ResNet101, ResNeXt50 dan RegNetY8G.

Dapat diperhatikan bahawa kedudukan penggantian mempunyai kesan yang besar terhadap prestasi.

Cara yang betul untuk bermain pembelajaran mendalam blok binaan! Universiti Nasional Singapura mengeluarkan DeRy, paradigma pembelajaran pemindahan baharu yang menukar pemindahan pengetahuan kepada percetakan jenis alih

Sebagai contoh, jika peringkat ketiga digantikan dengan peringkat ketiga rangkaian lain, prestasi rangkaian yang disusun semula akan menjadi kuat terutamanya. Pada masa yang sama, persamaan fungsi juga dipadankan secara positif dengan prestasi penggabungan semula.

Blok model rangkaian pada kedalaman yang sama mempunyai persamaan yang lebih besar, menghasilkan keupayaan model yang lebih kukuh selepas latihan. Ini menunjukkan kepada pergantungan dan hubungan positif antara keserupaan-penggabungan semula kedudukan-prestasi penggabungan semula.

Pemerhatian hasil belahan

Dalam gambar di bawah, penulis melukis The hasil pemisahan satu langkah. Warna mewakili persamaan antara blok rangkaian dan blok rangkaian di tengah set kesetaraan lagu.

Dapat dilihat bahawa pembahagian yang dicadangkan dalam artikel ini cenderung untuk mengelompokkan sub-rangkaian bersama-sama mengikut kedalaman dan memisahkannya. Pada masa yang sama, data persamaan fungsi CNN dan Transformer adalah kecil, tetapi persamaan fungsi antara CNN dan CNN seni bina yang berbeza biasanya lebih besar.

Cara yang betul untuk bermain pembelajaran mendalam blok binaan! Universiti Nasional Singapura mengeluarkan DeRy, paradigma pembelajaran pemindahan baharu yang menukar pemindahan pengetahuan kepada percetakan jenis alih

Menggunakan NASWOT sebagai penunjuk prestasi

Memandangkan artikel ini menggunakan NASWOT untuk ramalan pemindahan latihan sifar buat kali pertama, penulis juga menguji kebolehpercayaan penunjuk ini.

Dalam rajah di bawah, pengarang mengira markah NASWOT untuk model yang berbeza pada set data yang berbeza, dan membandingkannya dengan ketepatan pembelajaran pemindahan tambah satu.

Dapat diperhatikan bahawa markah NASWOT telah memperoleh kedudukan prestasi yang lebih tepat (korelasi Tau Kendall). Ini menunjukkan bahawa indeks latihan sifar yang digunakan dalam artikel ini boleh meramalkan prestasi model pada data hiliran dengan berkesan.

Cara yang betul untuk bermain pembelajaran mendalam blok binaan! Universiti Nasional Singapura mengeluarkan DeRy, paradigma pembelajaran pemindahan baharu yang menukar pemindahan pengetahuan kepada percetakan jenis alih

Ringkasan

Kertas kerja ini mencadangkan tugas pemindahan pengetahuan baharu yang dipanggil penstrukturan model mendalam (Deep Model Reassembly , Pendek kata DeRy). Dia membina model yang disesuaikan dengan tugas hiliran dengan memecahkan model pra-latihan heterogen sedia ada dan memasangnya semula.

Pengarang mencadangkan pelaksanaan dua peringkat mudah untuk menyelesaikan tugasan ini. Pertama, DeRy menyelesaikan masalah set penutup dan membahagikan semua rangkaian pra-latihan mengikut tahap kefungsian, dalam langkah kedua, DeRy memformalkan pemasangan model menjadi masalah pengaturcaraan integer 0-1 untuk memastikan prestasi model yang dipasang pada tugas tertentu. optimum.

Kerja ini bukan sahaja mencapai peningkatan prestasi yang kukuh, tetapi juga memetakan kemungkinan ketersambungan antara rangkaian saraf yang berbeza.

Atas ialah kandungan terperinci Cara yang betul untuk bermain pembelajaran mendalam blok binaan! Universiti Nasional Singapura mengeluarkan DeRy, paradigma pembelajaran pemindahan baharu yang menukar pemindahan pengetahuan kepada percetakan jenis alih. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
2 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Repo: Cara menghidupkan semula rakan sepasukan
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: Cara mendapatkan biji gergasi
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Model MoE sumber terbuka paling berkuasa di dunia ada di sini, dengan keupayaan bahasa Cina setanding dengan GPT-4, dan harganya hanya hampir satu peratus daripada GPT-4-Turbo Model MoE sumber terbuka paling berkuasa di dunia ada di sini, dengan keupayaan bahasa Cina setanding dengan GPT-4, dan harganya hanya hampir satu peratus daripada GPT-4-Turbo May 07, 2024 pm 04:13 PM

Bayangkan model kecerdasan buatan yang bukan sahaja mempunyai keupayaan untuk mengatasi pengkomputeran tradisional, tetapi juga mencapai prestasi yang lebih cekap pada kos yang lebih rendah. Ini bukan fiksyen sains, DeepSeek-V2[1], model MoE sumber terbuka paling berkuasa di dunia ada di sini. DeepSeek-V2 ialah gabungan model bahasa pakar (MoE) yang berkuasa dengan ciri-ciri latihan ekonomi dan inferens yang cekap. Ia terdiri daripada 236B parameter, 21B daripadanya digunakan untuk mengaktifkan setiap penanda. Berbanding dengan DeepSeek67B, DeepSeek-V2 mempunyai prestasi yang lebih kukuh, sambil menjimatkan 42.5% kos latihan, mengurangkan cache KV sebanyak 93.3% dan meningkatkan daya pemprosesan penjanaan maksimum kepada 5.76 kali. DeepSeek ialah sebuah syarikat yang meneroka kecerdasan buatan am

Di luar ORB-SLAM3! SL-SLAM: Adegan bertekstur lemah ringan, kegelisahan teruk dan lemah semuanya dikendalikan Di luar ORB-SLAM3! SL-SLAM: Adegan bertekstur lemah ringan, kegelisahan teruk dan lemah semuanya dikendalikan May 30, 2024 am 09:35 AM

Ditulis sebelum ini, hari ini kita membincangkan bagaimana teknologi pembelajaran mendalam boleh meningkatkan prestasi SLAM berasaskan penglihatan (penyetempatan dan pemetaan serentak) dalam persekitaran yang kompleks. Dengan menggabungkan kaedah pengekstrakan ciri dalam dan pemadanan kedalaman, di sini kami memperkenalkan sistem SLAM visual hibrid serba boleh yang direka untuk meningkatkan penyesuaian dalam senario yang mencabar seperti keadaan cahaya malap, pencahayaan dinamik, kawasan bertekstur lemah dan seks yang teruk. Sistem kami menyokong berbilang mod, termasuk konfigurasi monokular, stereo, monokular-inersia dan stereo-inersia lanjutan. Selain itu, ia juga menganalisis cara menggabungkan SLAM visual dengan kaedah pembelajaran mendalam untuk memberi inspirasi kepada penyelidikan lain. Melalui percubaan yang meluas pada set data awam dan data sampel sendiri, kami menunjukkan keunggulan SL-SLAM dari segi ketepatan kedudukan dan keteguhan penjejakan.

KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka Jun 01, 2024 pm 10:03 PM

Awal bulan ini, penyelidik dari MIT dan institusi lain mencadangkan alternatif yang sangat menjanjikan kepada MLP - KAN. KAN mengatasi MLP dari segi ketepatan dan kebolehtafsiran. Dan ia boleh mengatasi prestasi MLP berjalan dengan bilangan parameter yang lebih besar dengan bilangan parameter yang sangat kecil. Sebagai contoh, penulis menyatakan bahawa mereka menggunakan KAN untuk menghasilkan semula keputusan DeepMind dengan rangkaian yang lebih kecil dan tahap automasi yang lebih tinggi. Khususnya, MLP DeepMind mempunyai kira-kira 300,000 parameter, manakala KAN hanya mempunyai kira-kira 200 parameter. KAN mempunyai asas matematik yang kukuh seperti MLP berdasarkan teorem penghampiran universal, manakala KAN berdasarkan teorem perwakilan Kolmogorov-Arnold. Seperti yang ditunjukkan dalam rajah di bawah, KAN telah

Google gembira: prestasi JAX mengatasi Pytorch dan TensorFlow! Ia mungkin menjadi pilihan terpantas untuk latihan inferens GPU Google gembira: prestasi JAX mengatasi Pytorch dan TensorFlow! Ia mungkin menjadi pilihan terpantas untuk latihan inferens GPU Apr 01, 2024 pm 07:46 PM

Prestasi JAX, yang dipromosikan oleh Google, telah mengatasi Pytorch dan TensorFlow dalam ujian penanda aras baru-baru ini, menduduki tempat pertama dalam 7 penunjuk. Dan ujian tidak dilakukan pada TPU dengan prestasi JAX terbaik. Walaupun dalam kalangan pembangun, Pytorch masih lebih popular daripada Tensorflow. Tetapi pada masa hadapan, mungkin lebih banyak model besar akan dilatih dan dijalankan berdasarkan platform JAX. Model Baru-baru ini, pasukan Keras menanda aras tiga hujung belakang (TensorFlow, JAX, PyTorch) dengan pelaksanaan PyTorch asli dan Keras2 dengan TensorFlow. Pertama, mereka memilih satu set arus perdana

Hello, Atlas elektrik! Robot Boston Dynamics hidup semula, gerakan pelik 180 darjah menakutkan Musk Hello, Atlas elektrik! Robot Boston Dynamics hidup semula, gerakan pelik 180 darjah menakutkan Musk Apr 18, 2024 pm 07:58 PM

Boston Dynamics Atlas secara rasmi memasuki era robot elektrik! Semalam, Atlas hidraulik hanya "menangis" menarik diri daripada peringkat sejarah Hari ini, Boston Dynamics mengumumkan bahawa Atlas elektrik sedang berfungsi. Nampaknya dalam bidang robot humanoid komersial, Boston Dynamics berazam untuk bersaing dengan Tesla. Selepas video baharu itu dikeluarkan, ia telah pun ditonton oleh lebih sejuta orang dalam masa sepuluh jam sahaja. Orang lama pergi dan peranan baru muncul. Ini adalah keperluan sejarah. Tidak dinafikan bahawa tahun ini adalah tahun letupan robot humanoid. Netizen mengulas: Kemajuan robot telah menjadikan majlis pembukaan tahun ini kelihatan seperti manusia, dan tahap kebebasan adalah jauh lebih besar daripada manusia Tetapi adakah ini benar-benar bukan filem seram? Pada permulaan video, Atlas berbaring dengan tenang di atas tanah, seolah-olah terlentang. Apa yang berikut adalah rahang-jatuh

Apr 09, 2024 am 11:52 AM

AI memang mengubah matematik. Baru-baru ini, Tao Zhexuan, yang telah mengambil perhatian terhadap isu ini, telah memajukan keluaran terbaru "Buletin Persatuan Matematik Amerika" (Buletin Persatuan Matematik Amerika). Memfokuskan pada topik "Adakah mesin akan mengubah matematik?", ramai ahli matematik menyatakan pendapat mereka Seluruh proses itu penuh dengan percikan api, tegar dan menarik. Penulis mempunyai barisan yang kuat, termasuk pemenang Fields Medal Akshay Venkatesh, ahli matematik China Zheng Lejun, saintis komputer NYU Ernest Davis dan ramai lagi sarjana terkenal dalam industri. Dunia AI telah berubah secara mendadak Anda tahu, banyak artikel ini telah dihantar setahun yang lalu.

Robot Tesla bekerja di kilang, Musk: Tahap kebebasan tangan akan mencapai 22 tahun ini! Robot Tesla bekerja di kilang, Musk: Tahap kebebasan tangan akan mencapai 22 tahun ini! May 06, 2024 pm 04:13 PM

Video terbaru robot Tesla Optimus dikeluarkan, dan ia sudah boleh berfungsi di kilang. Pada kelajuan biasa, ia mengisih bateri (bateri 4680 Tesla) seperti ini: Pegawai itu juga mengeluarkan rupanya pada kelajuan 20x - pada "stesen kerja" kecil, memilih dan memilih dan memilih: Kali ini ia dikeluarkan Salah satu sorotan video itu ialah Optimus menyelesaikan kerja ini di kilang, sepenuhnya secara autonomi, tanpa campur tangan manusia sepanjang proses. Dan dari perspektif Optimus, ia juga boleh mengambil dan meletakkan bateri yang bengkok, memfokuskan pada pembetulan ralat automatik: Berkenaan tangan Optimus, saintis NVIDIA Jim Fan memberikan penilaian yang tinggi: Tangan Optimus adalah robot lima jari di dunia paling cerdik. Tangannya bukan sahaja boleh disentuh

FisheyeDetNet: algoritma pengesanan sasaran pertama berdasarkan kamera fisheye FisheyeDetNet: algoritma pengesanan sasaran pertama berdasarkan kamera fisheye Apr 26, 2024 am 11:37 AM

Pengesanan objek ialah masalah yang agak matang dalam sistem pemanduan autonomi, antaranya pengesanan pejalan kaki adalah salah satu algoritma terawal untuk digunakan. Penyelidikan yang sangat komprehensif telah dijalankan dalam kebanyakan kertas kerja. Walau bagaimanapun, persepsi jarak menggunakan kamera fisheye untuk pandangan sekeliling agak kurang dikaji. Disebabkan herotan jejari yang besar, perwakilan kotak sempadan standard sukar dilaksanakan dalam kamera fisheye. Untuk mengurangkan perihalan di atas, kami meneroka kotak sempadan lanjutan, elips dan reka bentuk poligon am ke dalam perwakilan kutub/sudut dan mentakrifkan metrik mIOU pembahagian contoh untuk menganalisis perwakilan ini. Model fisheyeDetNet yang dicadangkan dengan bentuk poligon mengatasi model lain dan pada masa yang sama mencapai 49.5% mAP pada set data kamera fisheye Valeo untuk pemanduan autonomi

See all articles