Jadual Kandungan
Prinsip kaedah
Boleh membezakan objek yang tidak diketahui dengan baik
Rumah Peranti teknologi AI Objek yang tidak diketahui juga boleh dikenal pasti dengan mudah dan dibahagikan, dan kesannya boleh dipindahkan

Objek yang tidak diketahui juga boleh dikenal pasti dengan mudah dan dibahagikan, dan kesannya boleh dipindahkan

Apr 12, 2023 am 11:31 AM
mengenalpasti pembahagian Migran

Ia juga boleh membahagikan objek baharu yang belum pernah dilihat sebelum ini.

Ini ialah rangka kerja pembelajaran baharu yang dibangunkan oleh DeepMind: Penemuan objek dan rangkaian perwakilan (Odin)

Objek yang tidak diketahui juga boleh dikenal pasti dengan mudah dan dibahagikan, dan kesannya boleh dipindahkan

Sebelumnya Kaedah pembelajaran penyeliaan kendiri (SSL) boleh menerangkan keseluruhan pemandangan besar dengan baik, tetapi sukar untuk membezakan objek individu.

Kini, kaedah Odin melakukannya, dan melakukannya tanpa sebarang pengawasan.

Bukan mudah untuk membezakan satu objek dalam imej. Bagaimana ia dilakukan?

Prinsip kaedah

Ia boleh membezakan pelbagai objek dengan baik dalam imej, terutamanya disebabkan oleh "edaran kendiri" kerangka pembelajaran Odin.

Odin mempelajari dua set rangkaian yang berfungsi bersama, iaitu rangkaian penemuan sasaran dan rangkaian perwakilan sasaran.

Rangkaian penemuan objek mengambil bahagian imej yang dipangkas sebagai input Bahagian yang dipangkas harus mengandungi sebahagian besar kawasan imej dan bahagian imej ini tidak dipertingkatkan dalam aspek lain.

Kemudian lakukan analisis kelompok pada peta ciri yang dijana daripada imej input, dan bahagikan setiap objek dalam imej mengikut ciri yang berbeza.

Objek yang tidak diketahui juga boleh dikenal pasti dengan mudah dan dibahagikan, dan kesannya boleh dipindahkan

Paparan input rangkaian perwakilan sasaran ialah imej bersegmen yang dijana dalam rangkaian penemuan sasaran.

Selepas paparan dimasukkan, ia dipraproses secara rawak, termasuk menyelak, mengaburkan dan penukaran warna peringkat titik.

Dengan cara ini, dua set topeng boleh diperolehi Kecuali perbezaan dalam pemangkasan, maklumat lain adalah sama dengan kandungan imej asas.

Kemudian kedua-dua topeng akan mempelajari ciri-ciri yang boleh mewakili objek dalam imej dengan lebih baik melalui kehilangan kontras.

Secara khusus, melalui pengesanan kontrastif, rangkaian dilatih untuk mengenal pasti ciri-ciri objek sasaran yang berbeza, dan terdapat juga banyak ciri "negatif" daripada objek lain yang tidak berkaitan.

Kemudian, maksimumkan persamaan objek sasaran yang sama dalam topeng yang berbeza, kurangkan persamaan antara objek sasaran yang berbeza, dan kemudian lakukan pembahagian yang lebih baik untuk membezakan objek sasaran yang berbeza.

Objek yang tidak diketahui juga boleh dikenal pasti dengan mudah dan dibahagikan, dan kesannya boleh dipindahkan

Pada masa yang sama, rangkaian penemuan sasaran akan dikemas kini dengan kerap berdasarkan parameter rangkaian perwakilan sasaran.

Matlamat utama adalah untuk memastikan sifat peringkat objek ini secara kasarnya tidak berubah merentas pandangan yang berbeza, dengan kata lain, untuk memisahkan objek dalam imej.

Jadi sejauh manakah keberkesanan rangka kerja pembelajaran Odin?

Boleh membezakan objek yang tidak diketahui dengan baik

Prestasi pembelajaran pemindahan kaedah Odin dalam segmentasi pemandangan tanpa pengetahuan awal juga sangat berkuasa.

Mula-mula, gunakan kaedah Odin untuk pralatih pada set data ImageNet, dan kemudian nilai kesannya pada set data COCO serta pembahagian semantik PASCAL dan Cityscapes.

Objek sasaran sudah diketahui, iaitu kaedah yang memperoleh pengetahuan terdahulu adalah jauh lebih baik daripada kaedah lain yang tidak memperoleh pengetahuan terdahulu semasa melakukan segmentasi adegan.

Walaupun kaedah Odin tidak memperoleh pengetahuan terdahulu, kesannya adalah lebih baik daripada DetCon dan ReLICv2 yang memperoleh pengetahuan terdahulu.

Objek yang tidak diketahui juga boleh dikenal pasti dengan mudah dan dibahagikan, dan kesannya boleh dipindahkan

Objek yang tidak diketahui juga boleh dikenal pasti dengan mudah dan dibahagikan, dan kesannya boleh dipindahkan

Selain itu, kaedah Odin boleh digunakan bukan sahaja pada model ResNet, tetapi juga pada model yang lebih kompleks, seperti Swim Transformer .

Objek yang tidak diketahui juga boleh dikenal pasti dengan mudah dan dibahagikan, dan kesannya boleh dipindahkan

Dari segi data, kelebihan pembelajaran rangka kerja Odin adalah jelas.

Bandingkan imej pembahagian yang dijana menggunakan Odin dengan imej yang diperoleh daripada rangkaian yang dimulakan secara rawak (lajur 3), rangkaian seliaan ImageNet (lajur 4).

Kedua-dua lajur 3 dan 4 gagal menggambarkan dengan jelas sempadan objek, atau kekurangan ketekalan dan lokaliti objek dunia sebenar, dan kesan imej yang dijana oleh Odin jelas lebih baik.

Objek yang tidak diketahui juga boleh dikenal pasti dengan mudah dan dibahagikan, dan kesannya boleh dipindahkan

Pautan rujukan:

[1] https://twitter.com/DeepMind/status/1554467389290561541

[2] ​https://arxiv.org/abs/2203.08777

Atas ialah kandungan terperinci Objek yang tidak diketahui juga boleh dikenal pasti dengan mudah dan dibahagikan, dan kesannya boleh dipindahkan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

MobileSAM: Model pembahagian imej berprestasi tinggi dan ringan untuk peranti mudah alih MobileSAM: Model pembahagian imej berprestasi tinggi dan ringan untuk peranti mudah alih Jan 05, 2024 pm 02:50 PM

1. Pengenalan Dengan pempopularan peranti mudah alih dan peningkatan kuasa pengkomputeran, teknologi pembahagian imej telah menjadi tumpuan penyelidikan. MobileSAM (MobileSegmentAnythingModel) ialah model pembahagian imej yang dioptimumkan untuk peranti mudah alih. Ia bertujuan untuk mengurangkan kerumitan pengiraan dan penggunaan memori sambil mengekalkan hasil pembahagian yang berkualiti tinggi, supaya berjalan dengan cekap pada peranti mudah alih dengan sumber terhad. Artikel ini akan memperkenalkan prinsip, kelebihan dan senario aplikasi MobileSAM secara terperinci. 2. Idea reka bentuk model MobileSAM Idea reka bentuk model MobileSAM terutamanya merangkumi aspek berikut: Model ringan: Untuk menyesuaikan diri dengan had sumber peranti mudah alih, model MobileSAM menggunakan model ringan.

Bagaimana untuk menggunakan teknologi segmentasi semantik imej dalam Python? Bagaimana untuk menggunakan teknologi segmentasi semantik imej dalam Python? Jun 06, 2023 am 08:03 AM

Dengan pembangunan berterusan teknologi kecerdasan buatan, teknologi segmentasi semantik imej telah menjadi hala tuju penyelidikan yang popular dalam bidang analisis imej. Dalam segmentasi semantik imej, kami membahagikan kawasan yang berbeza dalam imej dan mengelaskan setiap kawasan untuk mencapai pemahaman yang menyeluruh tentang imej. Python ialah bahasa pengaturcaraan yang terkenal dengan keupayaan analisis data dan visualisasi datanya yang hebat menjadikannya pilihan pertama dalam bidang penyelidikan teknologi kecerdasan buatan. Artikel ini akan memperkenalkan cara menggunakan teknologi segmentasi semantik imej dalam Python. 1. Pengetahuan prasyarat semakin mendalam

Bagaimana untuk melaksanakan pengecaman pertuturan dan sintesis pertuturan dalam C++? Bagaimana untuk melaksanakan pengecaman pertuturan dan sintesis pertuturan dalam C++? Aug 26, 2023 pm 02:49 PM

Bagaimana untuk melaksanakan pengecaman pertuturan dan sintesis pertuturan dalam C++? Pengecaman pertuturan dan sintesis pertuturan ialah salah satu hala tuju penyelidikan yang popular dalam bidang kecerdasan buatan hari ini, dan ia memainkan peranan penting dalam banyak senario aplikasi. Artikel ini akan memperkenalkan cara menggunakan C++ untuk melaksanakan pengecaman pertuturan dan fungsi sintesis pertuturan berdasarkan platform terbuka Baidu AI, dan menyediakan contoh kod yang berkaitan. 1. Pengecaman pertuturan Pengecaman pertuturan ialah teknologi yang menukar pertuturan manusia kepada teks Ia digunakan secara meluas dalam pembantu suara, rumah pintar, pemanduan autonomi dan bidang lain. Berikut ialah pelaksanaan pengecaman pertuturan menggunakan C++

Tutorial Python: Bagaimana untuk memisahkan dan menggabungkan fail besar menggunakan Python? Tutorial Python: Bagaimana untuk memisahkan dan menggabungkan fail besar menggunakan Python? Apr 22, 2023 am 11:43 AM

Kadang-kadang, kita perlu menghantar fail yang besar kepada orang lain, tetapi disebabkan oleh keterbatasan saluran penghantaran, seperti had saiz lampiran e-mel, atau keadaan rangkaian tidak begitu baik, kita perlu membahagikan fail besar kepada kecil. fail dan hantarkannya dalam beberapa kali Kemudian gabungkan fail kecil ini. Hari ini saya akan berkongsi bagaimana untuk memisahkan dan menggabungkan fail besar menggunakan Python. Idea dan pelaksanaan Jika ia adalah fail teks, ia boleh dibahagikan dengan bilangan baris. Sama ada ia adalah fail teks atau fail binari, ia boleh dibahagikan mengikut saiz yang ditentukan. Menggunakan fungsi membaca dan menulis fail Python, anda boleh memisahkan dan menggabungkan fail, menetapkan saiz setiap fail, dan kemudian membaca bait saiz yang ditentukan dan menulisnya ke dalam fail baharu Bahagian penerima membaca fail kecil dalam urutan dan menulis Bait ditulis pada fail mengikut urutan, jadi

Teknologi pengesanan dan pengecaman muka dilaksanakan menggunakan Java Teknologi pengesanan dan pengecaman muka dilaksanakan menggunakan Java Jun 18, 2023 am 09:08 AM

Dengan perkembangan berterusan teknologi kecerdasan buatan, teknologi pengesanan dan pengecaman muka telah menjadi semakin meluas digunakan dalam kehidupan seharian. Teknologi pengesanan dan pengecaman muka digunakan secara meluas dalam pelbagai keadaan, seperti sistem kawalan akses muka, sistem pembayaran muka, enjin carian muka, dsb. Sebagai bahasa pengaturcaraan yang digunakan secara meluas, Java juga boleh melaksanakan teknologi pengesanan dan pengecaman muka. Artikel ini akan memperkenalkan cara menggunakan Java untuk melaksanakan teknologi pengesanan dan pengecaman muka. 1. Teknologi pengesanan muka Teknologi pengesanan muka merujuk kepada teknologi yang mengesan wajah dalam imej atau video. dalam J

Golang dan FFmpeg: Cara melaksanakan sintesis dan pembahagian audio Golang dan FFmpeg: Cara melaksanakan sintesis dan pembahagian audio Sep 27, 2023 pm 10:52 PM

Golang dan FFmpeg: Cara melaksanakan sintesis dan pembahagian audio, contoh kod khusus diperlukan Ringkasan: Artikel ini akan memperkenalkan cara menggunakan perpustakaan Golang dan FFmpeg untuk melaksanakan sintesis dan pembahagian audio. Kami akan menggunakan beberapa contoh kod khusus untuk membantu pembaca memahami dengan lebih baik. Pengenalan: Dengan perkembangan berterusan teknologi pemprosesan audio, sintesis dan pembahagian audio telah menjadi keperluan fungsian biasa dalam kehidupan dan kerja harian. Sebagai bahasa pengaturcaraan yang pantas, cekap dan mudah untuk ditulis dan diselenggara, Golang, ditambah dengan FFmpeg

Petua untuk mengurangkan saiz fail rakaman skrin win10 Petua untuk mengurangkan saiz fail rakaman skrin win10 Jan 04, 2024 pm 12:05 PM

Ramai rakan perlu merakam skrin untuk kerja pejabat atau memindahkan fail, tetapi kadangkala masalah fail yang terlalu besar menyebabkan banyak masalah berikut adalah penyelesaian kepada masalah fail yang terlalu besar, mari kita lihat. Apa yang perlu dilakukan jika fail rakaman skrin win10 terlalu besar: 1. Muat turun perisian Format Factory untuk memampatkan fail. Alamat muat turun >> 2. Masukkan halaman utama dan klik pilihan "Video-MP4". 3. Klik "Tambah Fail" pada halaman format penukaran dan pilih fail MP4 untuk dimampatkan. 4. Klik "Konfigurasi Output" pada halaman untuk memampatkan fail mengikut kualiti output. 5. Pilih "Kualiti dan Saiz Rendah" daripada senarai konfigurasi juntai bawah dan klik "OK". 6. Klik "OK" untuk melengkapkan import fail video. 7. Klik "Mula" untuk memulakan penukaran. 8. Selepas selesai, anda boleh

Sebuah artikel bercakap tentang sistem pengecaman tanda trafik dalam pemanduan autonomi Sebuah artikel bercakap tentang sistem pengecaman tanda trafik dalam pemanduan autonomi Apr 12, 2023 pm 12:34 PM

Apakah sistem pengecaman tanda lalu lintas? Sistem pengecaman tanda lalu lintas bagi sistem keselamatan kereta, yang terjemahan bahasa Inggerisnya ialah: Pengecaman Tanda Lalu Lintas, atau singkatannya TSR, menggunakan kamera menghadap ke hadapan digabungkan dengan mod untuk mengecam tanda lalu lintas biasa (had laju, tempat letak kereta, pusingan U, dll.). Ciri ini memberi amaran kepada pemandu tentang papan tanda lalu lintas di hadapan supaya mereka boleh mematuhinya. Fungsi TSR mempertingkatkan keselamatan dengan mengurangkan kemungkinan pemandu tidak akan mematuhi undang-undang jalan raya seperti papan tanda berhenti dan mengelak belok kiri haram atau pelanggaran lalu lintas lain yang tidak disengajakan. Sistem ini memerlukan platform perisian yang fleksibel untuk meningkatkan algoritma pengesanan dan menyesuaikan diri dengan tanda lalu lintas di kawasan yang berbeza. Prinsip pengecaman tanda lalu lintas Pengecaman tanda lalu lintas juga dipanggil TS

See all articles