Jadual Kandungan
Model penjanaan imej penderiaan jauh global
△Rangka kerja keseluruhan MetaEarth
Profil Pasukan
Rumah Peranti teknologi AI Meletakkan seluruh bumi ke dalam rangkaian saraf, pasukan Universiti Beihang melancarkan model penjanaan imej penderiaan jauh global

Meletakkan seluruh bumi ke dalam rangkaian saraf, pasukan Universiti Beihang melancarkan model penjanaan imej penderiaan jauh global

Jun 09, 2024 pm 09:56 PM
imej Model menjana

Pasukan penyelidik Universiti Beihang menggunakan model resapan untuk "meniru" Bumi?

Di mana-mana lokasi di seluruh dunia, model ini boleh menjana imej penderiaan jauh berbilang resolusi, mencipta "adegan selari" yang kaya dan pelbagai.

Dan ciri geografi yang kompleks seperti rupa bumi, iklim, tumbuh-tumbuhan, dsb. semuanya diambil kira.

Meletakkan seluruh bumi ke dalam rangkaian saraf, pasukan Universiti Beihang melancarkan model penjanaan imej penderiaan jauh global

Diinspirasikan oleh Google Earth, pasukan penyelidik Beihang "memuatkan" imej penderiaan jauh satelit seluruh Bumi ke dalam rangkaian saraf dalam dari perspektif atas.

Berdasarkan rangkaian sedemikian, pasukan itu membina MetaEarth, model penjanaan visual atas ke bawah global.

MetaEarth mempunyai 600 juta parameter dan boleh menjana imej penderiaan jauh dengan berbilang resolusi, tanpa sempadan dan meliputi mana-mana lokasi geografi di seluruh dunia.

Meletakkan seluruh bumi ke dalam rangkaian saraf, pasukan Universiti Beihang melancarkan model penjanaan imej penderiaan jauh global

Model penjanaan imej penderiaan jauh global

Berbanding dengan penyelidikan terdahulu, membina model penjanaan visual asas seluruh dunia adalah lebih mencabar, dan banyak kesukaran telah diatasi dalam proses itu.

Kapasiti model merupakan satu cabaran kerana Bumi mempunyai pelbagai ciri geografi seperti bandar, hutan, padang pasir, lautan, glasier dan padang salji, yang perlu difahami dan diwakili oleh model.

Malah jenis ciri buatan manusia yang sama akan menunjukkan perbezaan yang besar di bawah latitud, iklim dan persekitaran budaya yang berbeza, yang meletakkan permintaan yang tinggi terhadap kapasiti model yang dihasilkan.

MetaEarth telah berjaya menyelesaikan kesukaran ini dan mencapai resolusi tinggi dan penjanaan pemandangan berskala besar di lokasi dan bentuk muka bumi yang berbeza.

Meletakkan seluruh bumi ke dalam rangkaian saraf, pasukan Universiti Beihang melancarkan model penjanaan imej penderiaan jauh global

Selain itu, menjana imej penderiaan jauh dengan resolusi boleh dikawal juga merupakan satu cabaran.

Oleh kerana dalam proses pengimejan imej atas, paparan ciri ciri tanah sangat dipengaruhi oleh resolusi Terdapat perbezaan yang jelas di bawah resolusi imej yang berbeza Sukar untuk menjana dengan tepat pada resolusi yang ditetapkan (meter/piksel). Kebolehan.

Apabila MetaEarth menjana imej resolusi berbeza, ia boleh mempersembahkan ciri permukaan dengan tepat dan munasabah, dan korelasi antara resolusi berbeza juga dipetakan dengan tepat.

Meletakkan seluruh bumi ke dalam rangkaian saraf, pasukan Universiti Beihang melancarkan model penjanaan imej penderiaan jauh global

Akhir sekali, terdapat cabaran penjanaan imej tanpa had - tidak seperti imej semula jadi harian, imej penderiaan jauh mempunyai ciri-ciri lebar ultra lebar, dan panjang sisi mungkin mencecah puluhan ribu piksel. Ia sukar untuk sebelumnya kaedah untuk menghasilkan imej yang berterusan dan tidak terhad dalam sebarang saiz.

Tetapi pemandangan tanpa sempadan berterusan yang dihasilkan oleh MetaEarth mengelakkan kecacatan ini, dan anda dapat melihat bahawa imej bergerak dengan sangat lancar semasa "lensa" diterjemahkan.

Meletakkan seluruh bumi ke dalam rangkaian saraf, pasukan Universiti Beihang melancarkan model penjanaan imej penderiaan jauh global

Selain itu, MetaEarth mempunyai prestasi generalisasi yang kukuh dan boleh menjana imej berbilang resolusi dalam lata dengan pemandangan yang tidak diketahui sebagai input bersyarat.

Sebagai contoh, dengan memasukkan "Pandora Planet" yang dijana oleh GPT4-V sebagai syarat awal ke dalam model, MetaEarth masih mampu menjana imej dengan taburan objek tanah yang munasabah dan butiran yang realistik.

Meletakkan seluruh bumi ke dalam rangkaian saraf, pasukan Universiti Beihang melancarkan model penjanaan imej penderiaan jauh global

Hasil pengesahan pada misi hiliran menunjukkan bahawa MetaEarth, sebagai enjin data serba baharu, dijangka menyediakan persekitaran maya dan sokongan data latihan untuk pelbagai misi hiliran dalam bidang pemerhatian bumi.

Semasa percubaan, pengarang memilih tugas asas pengelasan imej penderiaan jauh untuk pengesahan Keputusan menunjukkan bahawa dengan bantuan imej berkualiti tinggi yang dihasilkan oleh MetaEarth, ketepatan pengelasan tugas hiliran telah dipertingkatkan dengan ketara.

Meletakkan seluruh bumi ke dalam rangkaian saraf, pasukan Universiti Beihang melancarkan model penjanaan imej penderiaan jauh global

Pengarang percaya bahawa MetaEarth dijangka menyediakan persekitaran maya yang realistik untuk platform sistem udara tanpa pemandu seperti satelit, dan digunakan secara meluas dalam perancangan bandar, pemantauan alam sekitar, pengurusan bencana, pengoptimuman pertanian dan bidang lain

Selain berfungsi sebagai enjin data Selain itu, MetaEarth juga mempunyai potensi besar dalam membina model dunia generatif, menyediakan kemungkinan baharu untuk penyelidikan masa hadapan. .

Jadi, bagaimana MetaEarth mencapainya?

600 juta model resapan parameter "mereplikasi" bumi

MetaEarth dibina berdasarkan model resapan kemungkinan dan mempunyai skala parameter lebih daripada 600 juta.

Untuk menyokong latihan model, pasukan itu mengumpulkan set data imej penderiaan jauh yang besar, yang mengandungi imej berbilang resolusi spatial dan maklumat geografinya (latitud, longitud dan resolusi) meliputi kebanyakan wilayah di seluruh dunia.

Dalam kajian ini, penulis mencadangkan rangka kerja penjanaan lata diri berpandukan resolusi.

Meletakkan seluruh bumi ke dalam rangkaian saraf, pasukan Universiti Beihang melancarkan model penjanaan imej penderiaan jauh global

△Rangka kerja keseluruhan MetaEarth

Di bawah rangka kerja ini, hanya satu model boleh digunakan untuk mencapai penjanaan imej berbilang resolusi untuk lokasi geografi tertentu, dan mencipta "imej selari" yang kaya dan pelbagai pada setiap peringkat resolusi.

Secara khusus, ini ialah rangkaian penyahnosingan berstruktur codec yang menggabungkan pengekodan imej bersyarat resolusi rendah dan resolusi spatial dengan pembenaman langkah masa bagi proses denosing untuk meramalkan hingar pada setiap langkah masa, Laksanakan penjanaan imej.

Untuk menjana imej tanpa sempadan dalam sebarang saiz, penulis juga mereka bentuk kaedah penjanaan tetingkap gelongsor yang cekap memori dan strategi pensampelan hingar.

Strategi ini membahagikan imej yang dijana kepada blok imej bertindih sebagai syarat, dan menggunakan strategi pensampelan hingar khusus untuk menjana kandungan yang serupa dalam kawasan kongsi blok imej bersebelahan, dengan itu mengelakkan jurang penyambungan.

Selain itu, strategi pensampelan hingar ini juga membolehkan model menggunakan kurang sumber memori video apabila menjana imej tanpa had dalam sebarang saiz.

Profil Pasukan

Penulis kajian ini adalah daripada "Makmal Pembelajaran, Penglihatan dan Penderiaan Jauh, Makmal LEVIR"(Makmal Pembelajaran, Penglihatan dan Penderiaan Jauh, Makmal LEVIR) Makmal ini diketuai oleh Profesor Shi Zhenwei, Ulama Muda Terbilang Negara.

Profesor Zou Zhengxia, bekas pelajar kedoktoran Profesor Shi Zhenwei, seorang felo pasca doktoral di Universiti Michigan, dan ahli makmal semasa, ialah pengarang artikel ini.

Alamat kertas: https://www.php.cn/link/31bb2feb402ac789507479daf9713b00
Laman utama projek:https://www db76 92267fca4f4169c9ba2

Atas ialah kandungan terperinci Meletakkan seluruh bumi ke dalam rangkaian saraf, pasukan Universiti Beihang melancarkan model penjanaan imej penderiaan jauh global. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
2 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Repo: Cara menghidupkan semula rakan sepasukan
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: Cara mendapatkan biji gergasi
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Model MoE sumber terbuka paling berkuasa di dunia ada di sini, dengan keupayaan bahasa Cina setanding dengan GPT-4, dan harganya hanya hampir satu peratus daripada GPT-4-Turbo Model MoE sumber terbuka paling berkuasa di dunia ada di sini, dengan keupayaan bahasa Cina setanding dengan GPT-4, dan harganya hanya hampir satu peratus daripada GPT-4-Turbo May 07, 2024 pm 04:13 PM

Model MoE sumber terbuka paling berkuasa di dunia ada di sini, dengan keupayaan bahasa Cina setanding dengan GPT-4, dan harganya hanya hampir satu peratus daripada GPT-4-Turbo

KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka Jun 01, 2024 pm 10:03 PM

KAN, yang menggantikan MLP, telah diperluaskan kepada konvolusi oleh projek sumber terbuka

Hello, Atlas elektrik! Robot Boston Dynamics hidup semula, gerakan pelik 180 darjah menakutkan Musk Hello, Atlas elektrik! Robot Boston Dynamics hidup semula, gerakan pelik 180 darjah menakutkan Musk Apr 18, 2024 pm 07:58 PM

Hello, Atlas elektrik! Robot Boston Dynamics hidup semula, gerakan pelik 180 darjah menakutkan Musk

Google gembira: prestasi JAX mengatasi Pytorch dan TensorFlow! Ia mungkin menjadi pilihan terpantas untuk latihan inferens GPU Google gembira: prestasi JAX mengatasi Pytorch dan TensorFlow! Ia mungkin menjadi pilihan terpantas untuk latihan inferens GPU Apr 01, 2024 pm 07:46 PM

Google gembira: prestasi JAX mengatasi Pytorch dan TensorFlow! Ia mungkin menjadi pilihan terpantas untuk latihan inferens GPU

Apr 09, 2024 am 11:52 AM

Robot Tesla bekerja di kilang, Musk: Tahap kebebasan tangan akan mencapai 22 tahun ini! Robot Tesla bekerja di kilang, Musk: Tahap kebebasan tangan akan mencapai 22 tahun ini! May 06, 2024 pm 04:13 PM

Robot Tesla bekerja di kilang, Musk: Tahap kebebasan tangan akan mencapai 22 tahun ini!

FisheyeDetNet: algoritma pengesanan sasaran pertama berdasarkan kamera fisheye FisheyeDetNet: algoritma pengesanan sasaran pertama berdasarkan kamera fisheye Apr 26, 2024 am 11:37 AM

FisheyeDetNet: algoritma pengesanan sasaran pertama berdasarkan kamera fisheye

DualBEV: mengatasi BEVFormer dan BEVDet4D dengan ketara, buka buku! DualBEV: mengatasi BEVFormer dan BEVDet4D dengan ketara, buka buku! Mar 21, 2024 pm 05:21 PM

DualBEV: mengatasi BEVFormer dan BEVDet4D dengan ketara, buka buku!

See all articles