


Gambar boleh memulihkan video! Kertas AAAAI 2023 mencadangkan algoritma baharu untuk pengimejan mampatan syot kilat
Artikel ini dicetak semula dengan kebenaran AI New Media Qubit (ID akaun awam: QbitAI Sila hubungi sumber untuk mencetak semula).
Dengan pembangunan algoritma optik, kami kini boleh "menangkap" isyarat dimensi tinggi menggunakan penderia dimensi rendah.
Sebagai contoh, berikut ialah "foto" yang kami ambil dengan penderia 2D, yang kelihatan penuh dengan data bising:
Namun, melalui data yang terkandung dalam "foto" ini kita boleh memulihkan video yang dinamik!
kedengaran menakjubkan, tetapi melalui kaedah yang dipanggil Pengimejan Mampat Syot Kilat (Pengimejan Mampat Syot Kilat, SCI ) kaedah memang boleh dicapai.
Kaedah ini boleh mengambil sampel data berdimensi tinggi sebagai ukuran dua dimensi, dengan itu mencapai pemerolehan isyarat visual berdimensi tinggi yang cekap.
Ambil kamera sebagai contoh Walaupun ia adalah penderia 2D, jika anda mencari cara untuk menambah peranti ukuran peranti micromirror digital di belakang lensa kamera (Peranti Micromirror Digital. , DMD, ini Ia adalah peranti yang boleh mengawal sumber cahaya dengan tepat) , terdapat cara untuk menggunakan kamera biasa untuk melakukan pengukuran pengurangan dimensi pada data berdimensi tinggi, mendapatkan data 2D mudah, dan kemudian memulihkan dimensi tinggi Isyarat visual 3D.
Sebagai contoh, kadar bingkai kamera biasa adalah sangat rendah, dan ia hanya boleh mengambil berpuluh-puluh foto sesaat (dengan andaian ia boleh mengambil 30 foto).
Apabila kita ingin merakam objek bergerak berkelajuan tinggi, selagi kita menambah peranti micromirror digital ini pada kamera biasa, ia akan memampatkan isyarat video sepanjang dimensi masa . Setiap kali kita mengambil gambar Satu foto boleh memulihkan beberapa atau bahkan berpuluh-puluh bingkai foto (iaitu, memulihkan video) .
Andaikan bahawa kadar mampatan pratetap untuk peranti micromirror digital ialah 10. Kemudian, mengambil satu foto sekarang boleh memulihkan 10 foto (atau video yang mengandungi 10 bingkai foto) ), dan kadar bingkai kamera juga telah meningkat sebanyak 10 kali ganda, menjadi dapat mengambil 300 foto dalam satu saat.
Kini persoalan timbul, bagaimana untuk memulihkan isyarat dimensi tinggi asal secekap mungkin daripada data pengukuran dimensi rendah yang dimampatkan yang bising ini?
Dengan pembangunan pembelajaran mendalam, pelbagai algoritma pembinaan semula telah dicadangkan, bagaimanapun, ketepatan dan kestabilan isyarat yang dibina semula bagi algoritma ini masih belum cukup baik.
Untuk tujuan ini, penyelidik dari Universiti Hong Kong, Akademi Sains Cina dan Universiti West Lake mencadangkan kaedah Model Keseimbangan Dalam(DEQ) untuk pengimejan mampatan syot kilat video , telah disertakan dalam AAAI 2023:
Kaedah ini bukan sahaja meningkatkan ketepatan dan kestabilan pembinaan semula, tetapi juga mengoptimumkan lagi jejak memori— —
Algoritma hanya memerlukan ingatan tahap malar semasa latihan dan ujian, iaitu: apabila menggunakan pembelajaran mendalam, ruang memori yang digunakantidak berubah mengikut kedalaman rangkaian (Apabila menggunakan kaedah pengoptimuman tradisional, ruang memori yang digunakan tidak berubah mengikut bilangan lelaran) .
Mari kita lihat.
Apakah kesukaran dalam pengimejan mampatan syot kilat?
Memanfaatkan reka bentuk perkakasan optik baru dan algoritma pengimejan, Sistem Pengimejan Mampat Syot Kilat (Pengimejan Mampat Syot Kilat, SCI) boleh melaksanakan data berdimensi tinggi sebagai ukuran dua dimensi dalam satu syot kilat pensampelan pengukuran untuk mencapai pemerolehan isyarat visual berdimensi tinggi yang cekap.
Seperti yang ditunjukkan dalam Rajah 1, sistem SCI boleh dibahagikan kepada dua bahagian, pengekodan perkakasan dan penyahkodan perisian:
△ Rajah 1. Sistem pengimejan mampatan syot kilat menggunakan sensor berdimensi rendah untuk menangkap data berdimensi tinggi dalam ukuran syot kilat
Mengambil rakaman video sebagai contoh, melalui pengekodan perkakasan, sistem SCI mengambil sampel data video dan memampatkannya dalam dimensi masa selepas itu, Algoritma digunakan untuk membina semula data video berdimensi tinggi yang asal.
Pertimbangkan sistem SCI video di sini, seperti yang ditunjukkan dalam Video 1. Bahagian atas video menunjukkan ukuran mampatan yang diperoleh oleh bahagian perkakasan sistem SCI, dan bahagian bawah video menunjukkan hasil video dipulihkan menggunakan algoritma yang dicadangkan dalam kertas .
Jelas sekali, keseluruhan proses pengimejan perlu menyelesaikan masalah songsang: Cara memulihkan video daripada ukuran mampatan yang bising.
Walaupun terdapat banyak kaedah pembinaan semula yang boleh menyelesaikan masalah songsang pengimejan SCI, kaedah ini masing-masing mempunyai kelemahannya sendiri, seperti yang ditunjukkan dalam Rajah 2:
△Rajah 2. Kaedah sedia ada dan isu utama pembinaan semula SCI
Antaranya, algoritma pengoptimuman tradisional (a) prestasi terhad.
Dengan pembangunan pembelajaran mendalam, rangkaian mendalam hujung ke hujung (b) dan kaedah terungkap (c) walaupun mereka boleh meningkatkan prestasi, mereka pasti peningkatan kedalaman rangkaian berlapis mengalami keperluan memori yang semakin meningkat dan memerlukan reka bentuk model yang teliti.
Plug and Play(PnP)Framework(d)Sambil menikmati kelebihan regularization dipacu data dan pengoptimuman berulang yang fleksibel, algoritma ini mestilah tetapan Parameter diperlukan untuk memastikan keputusan yang tepat, malah beberapa strategi yang kompleks perlu diguna pakai untuk mendapatkan prestasi yang memuaskan.
Berbanding dengan kaedah lain, kertas kerja mencadangkan algoritma baharu DE-RNN dan DE-GAP untuk memastikan ketepatan dan kestabilan hasil pembinaan semula Prestasi hasil pembinaan semula boleh menumpu kepada A tahap yang lebih tinggi, seperti yang ditunjukkan dalam Rajah 3:
△ Rajah 3. Perbandingan hasil pembinaan semula antara DE-GAP dan kaedah lain
Secara umumnya, dalam lepas Keputusan pembinaan semula kaedah seperti RNN dan PnP adalah tidak stabil, malah prestasinya semakin merosot dalam lelaran jangka panjang.
Walau bagaimanapun, hasil pembinaan semula DE-GAP boleh mengekalkan peningkatan prestasi apabila bilangan lelaran meningkat, dan akhirnya menumpu kepada hasil yang stabil.
Bagaimana ini dilakukan?
Memperkenalkan model termaju untuk meningkatkan prestasi
Untuk menyelesaikan masalah kaedah sebelumnya dan mencapai pembinaan semula SCI yang lebih maju, kertas kerja ini mencadangkan idea baharu buat kali pertama -
Gunakan model DEQ untuk menyelesaikan masalah songsang pembinaan semula SCI video.
Model DEQ pertama kali dicadangkan pada 2019 dan digunakan terutamanya dalam tugas pemprosesan bahasa jujukan panjang berskala besar dalam pemprosesan bahasa semula jadi.
Seperti yang ditunjukkan dalam Rajah 4, model DEQ boleh menyelesaikan secara langsung untuk titik tetap dalam proses perambatan ke hadapan dan perambatan belakang melalui kaedah mencari akar seperti kaedah lelaran Newton, dengan itu hanya menggunakan memori tahap malar dengan Berkesan melaksanakan rangkaian tak terhingga dalam:
△ Rajah 4. Kaedah titik tetap untuk menyelesaikan model DEQ (kiri) dan penggunaan memori tahap malar ( kanan) )
(Rajah 4 adalah daripada kertas: S. Bai et al, "Model keseimbangan dalam", NeurIPS 2019.)
Secara khusus, kertas ini ialah kali pertama Model DEQ digunakan pada dua rangka kerja pembinaan semula SCI video sedia ada: RNN dan PnP.
Kesannya juga sangat baik adalah setara dengan merealisasikan rangkaian dalam yang tidak terhingga hanya menggunakan memori peringkat malar bersamaan dengan merealisasikan langkah pengoptimuman berulang yang tidak terhingga, dan secara langsung dalam lelaran proses pengoptimuman Selesaikan untuk titik tetap.
Seperti yang ditunjukkan dalam Rajah 5, kertas itu mereka bentuk fungsi lelaran digabungkan dengan model DEQ untuk RNN dan PnP masing-masing, di mana x ialah hasil pembinaan semula, y ialah ukuran mampatan, dan Φ ialah matriks ukuran:
△ Rajah 5. Fungsi lelaran RNN dan PnP digabungkan dengan model DEQ masing-masing
(Sila lihat butiran proses terbitan khusus dan kertas perambatan ke hadapan dan ke belakang)
Apakah keputusan eksperimen?
Kertas ini menjalankan eksperimen ke atas enam set data SCI klasik dan data sebenar Berbanding dengan kaedah sebelumnya, hasil pembinaan semula keseluruhan adalah lebih baik.
Seperti yang ditunjukkan dalam Jadual 1, secara purata, kaedah ini mencapai kira-kira 0.1dB peningkatan dalam PSNR dan kira-kira 0.04 peningkatan dalam SSIM. Penambahbaikan dalam SSIM menunjukkan bahawa kaedah ini boleh membina semula imej dengan struktur yang agak halus:
△ Jadual 1. PSNR algoritma berbeza pada enam set data klasik untuk pembinaan semula SCI video (dB) dan SSIM
Rajah 6 ialah perbandingan hasil pembinaan semula algoritma yang berbeza pada set data klasik, dan pembentangan beberapa butiran adalah lebih lancar dan jelas:
△Rajah 6
Rajah 7 ialah perbandingan hasil pembinaan semula algoritma yang berbeza pada data sebenar, dan kesannya lebih baik berbanding:
△Rajah 7
Lebih banyak hasil eksperimen boleh didapati dalam kertas.
Pada masa ini, kod kertas itu adalah sumber terbuka, dan rakan-rakan yang berminat boleh menggunakannya~
(Video penjelasan penulis juga dilampirkan di penghujung artikel, yang menerangkannya dalam istilah mudah)
Alamat kertas:
https://www .php.cn/link/b8002139cdde66b87638f7f91d169d96
Alamat kod:
https: //www.php.cn/link/fa95123aa5f89781ed4e89a55eb2edcc
Video penjelasan kertas oleh pengarang:
Bahasa Inggeris: https://www.bilibili.com/video/BV1X54y1g7D9/
Bahasa Cina: https://www.bilibili.com/video/BV1V54y137QK/
Plastik Kantonis: https://www.bilibili.com/video/BV1224y1G7ee/
Atas ialah kandungan terperinci Gambar boleh memulihkan video! Kertas AAAAI 2023 mencadangkan algoritma baharu untuk pengimejan mampatan syot kilat. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Dengan peningkatan platform video pendek, Douyin telah menjadi bahagian yang sangat diperlukan dalam kehidupan seharian setiap orang. Di TikTok, kita boleh melihat video menarik dari seluruh dunia. Sesetengah orang suka menyiarkan video orang lain, yang menimbulkan persoalan: Adakah Douyin melanggar apabila menyiarkan video orang lain? Artikel ini akan membincangkan isu ini dan memberitahu anda cara mengedit video tanpa pelanggaran dan cara mengelakkan isu pelanggaran. 1. Adakah ia melanggar penyiaran video orang lain oleh Douyin? Menurut peruntukan Undang-undang Hak Cipta negara saya, penggunaan tanpa kebenaran karya pemilik hak cipta tanpa kebenaran pemilik hak cipta adalah satu pelanggaran. Oleh itu, menyiarkan video orang lain di Douyin tanpa kebenaran pengarang asal atau pemilik hak cipta adalah satu pelanggaran. 2. Bagaimana untuk mengedit video tanpa pelanggaran? 1. Penggunaan domain awam atau kandungan berlesen: Awam

Bagaimana untuk membuang tera air daripada video dalam Wink? Terdapat alat untuk membuang tera air daripada video dalam winkAPP, tetapi kebanyakan rakan tidak tahu bagaimana untuk membuang tera air daripada video dalam Wink dibawa oleh editor Teks tutorial, pengguna yang berminat datang dan lihat! Cara membuang tera air video dalam Wink 1. Buka APP wink dahulu dan pilih fungsi [Remove Watermark] di kawasan halaman utama 2. Kemudian pilih video yang ingin anda keluarkan watermark dalam album 3. Kemudian pilih video dan klik sudut kanan atas selepas mengedit video [√];4 Akhir sekali, klik [Pencetakan satu klik] seperti yang ditunjukkan dalam rajah di bawah dan kemudian klik [Proses].

Douyin, platform video pendek kebangsaan, bukan sahaja membolehkan kami menikmati pelbagai video pendek yang menarik dan novel pada masa lapang kami, tetapi juga memberi kami pentas untuk menunjukkan diri kami dan merealisasikan nilai kami. Jadi, bagaimana untuk membuat wang dengan menyiarkan video di Douyin? Artikel ini akan menjawab soalan ini secara terperinci dan membantu anda menjana lebih banyak wang di TikTok. 1. Bagaimana untuk membuat wang daripada menyiarkan video di Douyin? Selepas menyiarkan video dan mendapat jumlah tontonan tertentu pada Douyin, anda akan berpeluang untuk mengambil bahagian dalam pelan perkongsian pengiklanan. Kaedah pendapatan ini adalah salah satu yang paling biasa kepada pengguna Douyin dan juga merupakan sumber pendapatan utama bagi banyak pencipta. Douyin memutuskan sama ada untuk menyediakan peluang perkongsian pengiklanan berdasarkan pelbagai faktor seperti berat akaun, kandungan video dan maklum balas khalayak. Platform TikTok membolehkan penonton menyokong pencipta kegemaran mereka dengan menghantar hadiah,

Pada peranti iOS, apl Kamera membolehkan anda merakam video gerak perlahan, atau 240 bingkai sesaat jika anda mempunyai iPhone terkini. Keupayaan ini membolehkan anda menangkap aksi berkelajuan tinggi dengan terperinci yang kaya. Tetapi kadangkala, anda mungkin mahu memainkan video gerak perlahan pada kelajuan biasa supaya anda boleh menghargai butiran dan tindakan dalam video dengan lebih baik. Dalam artikel ini, kami akan menerangkan semua kaedah untuk mengalih keluar gerakan perlahan daripada video sedia ada pada iPhone. Cara Mengalih Keluar Gerak Perlahan daripada Video pada iPhone [2 Kaedah] Anda boleh menggunakan Apl Foto atau Apl iMovie untuk mengalih keluar gerakan perlahan daripada video pada peranti anda. Kaedah 1: Buka pada iPhone menggunakan aplikasi Photos

1. Mula-mula buka Weibo pada telefon mudah alih anda dan klik [Saya] di sudut kanan bawah (seperti yang ditunjukkan dalam gambar). 2. Kemudian klik [Gear] di penjuru kanan sebelah atas untuk membuka tetapan (seperti yang ditunjukkan dalam gambar). 3. Kemudian cari dan buka [Tetapan Umum] (seperti yang ditunjukkan dalam gambar). 4. Kemudian masukkan pilihan [Video Follow] (seperti yang ditunjukkan dalam gambar). 5. Kemudian buka tetapan [Video Upload Resolution] (seperti yang ditunjukkan dalam gambar). 6. Akhir sekali, pilih [Kualiti Imej Asal] untuk mengelakkan pemampatan (seperti yang ditunjukkan dalam gambar).

Bagaimana untuk menukar video yang dimuat turun oleh pelayar UC menjadi video tempatan? Ramai pengguna telefon mudah alih suka menggunakan Pelayar UC Mereka bukan sahaja boleh melayari web, tetapi juga menonton pelbagai video dan program TV dalam talian, dan memuat turun video kegemaran mereka ke telefon bimbit mereka. Sebenarnya, kami boleh menukar video yang dimuat turun kepada video tempatan, tetapi ramai orang tidak tahu bagaimana untuk melakukannya. Oleh itu, editor secara khas membawakan anda kaedah untuk menukar video yang dicache oleh pelayar UC kepada video tempatan saya harap ia dapat membantu anda. Kaedah untuk menukar video cache pelayar uc kepada video tempatan 1. Buka pelayar uc dan klik pilihan "Menu". 2. Klik "Muat Turun/Video". 3. Klik "Video Cache". 4. Tekan lama mana-mana video, apabila pilihan muncul, klik "Buka Direktori". 5. Semak yang anda ingin muat turun

Dengan kemunculan platform video pendek, Xiaohongshu telah menjadi platform untuk ramai orang berkongsi kehidupan mereka, meluahkan perasaan mereka dan mendapatkan trafik. Pada platform ini, menerbitkan karya video ialah cara interaksi yang sangat popular. Jadi, bagaimana untuk menerbitkan karya video Xiaohongshu? 1. Bagaimana untuk menerbitkan karya video Xiaohongshu? Mula-mula, pastikan anda mempunyai kandungan video yang sedia untuk dikongsi. Anda boleh menggunakan telefon bimbit anda atau peralatan kamera lain untuk merakam, tetapi anda perlu memberi perhatian kepada kualiti imej dan kejelasan bunyi. 2. Edit video: Untuk menjadikan kerja lebih menarik, anda boleh mengedit video. Anda boleh menggunakan perisian penyuntingan video profesional, seperti Douyin, Kuaishou, dsb., untuk menambah penapis, muzik, sari kata dan elemen lain. 3. Pilih kulit muka: Kulit adalah kunci untuk menarik pengguna untuk mengklik.

Saya mendapati bahawa pakej termampat yang dimuat turun dari laman web muat turun tertentu akan lebih besar daripada pakej termampat asal selepas penyahmampatan Perbezaannya ialah berpuluh-puluh Kb dan berpuluh-puluh Mb jika fail kecil, jika terdapat banyak fail, kos penyimpanan akan meningkat dengan banyak. Saya telah membuat beberapa kajian mengenainya dan boleh belajar daripadanya jika perlu. Tahap mampatan: 9-mampatan melampau Saiz kamus: 256 atau 384, semakin dimampatkan kamus, semakin perlahan perbezaan kadar mampatan lebih besar sebelum 256MB dan tiada perbezaan dalam kadar mampatan selepas 384MB: maksimum 273 Parameter: f=BCJ2, uji dan tambah kadar mampatan parameter akan lebih tinggi
