


Adakah ia dijangka menggantikan Deepfake? Mendedahkan betapa hebatnya teknologi NeRF yang paling popular tahun ini
Apa, anda belum tahu NeRF lagi?
Sebagai teknologi AI terhangat dalam bidang penglihatan komputer tahun ini, NeRF digunakan secara meluas dan mempunyai masa depan yang cerah.
Orang-orang di tapak B telah meletakkan teknologi ini dalam cara baharu.
Untuk menarik idea baharu
Jadi, apakah sebenarnya NeRF itu?
NeRF (Neural Radiance Fields) ialah konsep yang pertama kali dicadangkan dalam kertas kerja terbaik pada persidangan ECCV 2020 Ia mendorong ekspresi tersirat ke tahap baharu, hanya menggunakan imej pose 2D sebagai penyeliaan , yang boleh mewakili tiga-kompleks. adegan dimensi.
Satu batu membangkitkan seribu gelombang Sejak itu, NeRF telah berkembang pesat dan digunakan pada banyak arah teknikal, seperti "sintesis sudut pandang baharu, pembinaan semula tiga dimensi", dsb.
NeRF menggunakan imej berbilang sudut input jarang dengan pose untuk melatih bagi mendapatkan model medan sinaran saraf Menurut model ini, foto yang jelas dari mana-mana sudut tontonan boleh dipaparkan, seperti yang ditunjukkan dalam rajah di bawah. Ia juga boleh diringkaskan secara ringkas sebagai menggunakan MLP untuk mempelajari adegan tiga dimensi secara tersirat.
Netizen secara semula jadi akan membandingkan NeRF dengan Deepfake yang sama popular.
Artikel terbaru yang diterbitkan oleh MetaPhysics mengambil kira sejarah evolusi, cabaran dan kelebihan NeRF, dan meramalkan bahawa NeRF akhirnya akan menggantikan Deepfake.
Kebanyakan topik yang menarik perhatian tentang teknologi deepfake merujuk kepada dua pakej perisian sumber terbuka yang telah menjadi popular sejak deepfakes memasuki kesedaran awam pada 2017: DeepFaceLab (DFL) dan FaceSwap.
Walaupun kedua-dua pakej mempunyai pangkalan pengguna yang luas dan komuniti pembangun yang aktif, kedua-dua projek tidak menyimpang dengan ketara daripada kod GitHub.
Sudah tentu, pembangun DFL dan FaceSwap tidak melahu: kini boleh melatih model deepfake menggunakan imej input yang lebih besar, walaupun ini memerlukan GPU yang lebih mahal.
Tetapi sebenarnya, dalam tempoh tiga tahun lalu, peningkatan kualiti imej deepfake yang dipromosikan oleh media adalah terutamanya disebabkan oleh pengguna akhir.
Mereka telah mengumpul pengalaman penjimatan masa dan jarang berlaku dalam pengumpulan data, cara terbaik untuk melatih model (kadangkala satu percubaan boleh mengambil masa berminggu-minggu) dan mempelajari cara memanfaatkan dan melanjutkan kod asal 2017 Had paling luar .
Sesetengah dalam komuniti penyelidikan VFX dan ML cuba menembusi "had keras" pakej deepfake yang popular dengan memanjangkan seni bina supaya model pembelajaran mesin boleh dilatih pada imej sehingga 1024×1024.
Pikselnya adalah dua kali ganda julat sebenar semasa DeepFaceLab atau FaceSwap, lebih hampir kepada resolusi yang berguna dalam pengeluaran filem dan televisyen.
Mari kita belajar tentang NeRF bersama-sama~
Pembukaan
NeRF (Neural Radiance Fields), yang muncul pada tahun 2020, ialah sejenis kaedah saraf untuk membina semula objek dan persekitaran dengan menyambung foto dari pelbagai sudut pandangan dalam rangkaian.
Ia mencapai hasil terbaik untuk mensintesis paparan pemandangan yang kompleks dengan mengoptimumkan fungsi adegan isipadu berterusan yang mendasari menggunakan set pandangan input yang jarang.
Algoritma juga menggunakan rangkaian dalam yang disambungkan sepenuhnya untuk mewakili pemandangan, inputnya ialah koordinat 5D berterusan tunggal (kedudukan spatial (x, y, z) dan arah tontonan (θ, φ)), dan output ialah Ketumpatan isipadu pada lokasi spatial dan kecerahan amplitud pelepasan yang berkaitan.
Sintesiskan paparan dengan menanyakan koordinat 5D di sepanjang sinar kamera dan tayangkan warna dan ketumpatan output ke dalam imej menggunakan teknik pemaparan volum klasik.
Proses pelaksanaan:
Pertama, adegan berterusan diwakili sebagai fungsi bernilai vektor 5D, yang inputnya ialah kedudukan 3D dan arah tontonan 2D, sepadan dengan Keluaran ialah warna pelepasan c dan ketumpatan isipadu σ.
Dalam amalan, vektor unit Cartesian 3D d digunakan untuk mewakili arah. Perwakilan pemandangan 5D berterusan ini dianggarkan dengan rangkaian MLP dan pemberatnya dioptimumkan.
Tambahan pula, perwakilan digalakkan untuk konsisten merentas berbilang paparan dengan mengehadkan rangkaian untuk meramalkan ketumpatan volum σ sebagai fungsi kedudukan x, sementara juga membenarkan warna RGB c diramalkan sebagai fungsi kedudukan dan arah tontonan .
Untuk mencapai matlamat ini, MLP mula-mula memproses input koordinat 3D x dengan 8 lapisan bersambung sepenuhnya (menggunakan pengaktifan ReLU dan 256 saluran setiap lapisan), dan mengeluarkan vektor ciri σ dan 256 dimensi.
Vektor ciri ini kemudiannya digabungkan dengan arah tontonan sinar kamera dan dihantar ke lapisan tambahan bersambung penuh yang mengeluarkan warna RGB bergantung pada paparan.
Selain itu, NeRF juga memperkenalkan dua penambahbaikan untuk mencapai perwakilan adegan kompleks resolusi tinggi. Yang pertama ialah pengekodan kedudukan untuk membantu MLP mewakili fungsi frekuensi tinggi, dan yang kedua ialah proses pensampelan berstrata untuk membolehkannya menyampel perwakilan frekuensi tinggi dengan cekap.
Seperti yang kita sedia maklum, pengekodan kedudukan dalam seni bina Transformer boleh memberikan kedudukan diskret penanda dalam jujukan sebagai input bagi keseluruhan seni bina. NeRF menggunakan pengekodan kedudukan untuk memetakan koordinat input berterusan ke ruang dimensi yang lebih tinggi, menjadikannya lebih mudah bagi MLP untuk menganggarkan fungsi frekuensi yang lebih tinggi.
Seperti yang dapat diperhatikan daripada rajah, mengalih keluar pengekodan kedudukan akan mengurangkan keupayaan model untuk mewakili geometri dan tekstur frekuensi tinggi, akhirnya membawa kepada penampilan yang terlalu licin.
Memandangkan strategi pemaparan menilai secara padat rangkaian medan sinaran saraf pada titik pertanyaan N di sepanjang setiap sinar kamera adalah sangat tidak cekap, akhirnya NeRF menggunakan perwakilan hierarki, dengan membahagikan kesan yang dijangkakan daripada pemaparan akhir Peruntukkan sampel untuk dipertingkatkan. kecekapan rendering.
Ringkasnya, NeRF tidak lagi menggunakan hanya satu rangkaian untuk mewakili pemandangan, tetapi mengoptimumkan dua rangkaian pada masa yang sama, rangkaian "berbutir kasar" dan rangkaian "berbutir halus".
Masa depan adalah menjanjikan
NeRF menyelesaikan kekurangan masa lalu, iaitu, menggunakan MLP untuk mewakili objek dan pemandangan sebagai fungsi berterusan. Berbanding dengan kaedah sebelumnya, NeRF boleh menghasilkan kesan pemaparan yang lebih baik.
Walau bagaimanapun, NeRF juga menghadapi banyak kesesakan teknikal Contohnya, pemecut NeRF akan mengorbankan fungsi lain yang agak berguna (seperti fleksibiliti) untuk mencapai kependaman rendah, persekitaran yang lebih interaktif dan kurang masa latihan.
Jadi, walaupun NeRF merupakan satu kejayaan penting, ia masih mengambil masa tertentu untuk mencapai hasil yang sempurna.
Teknologi bertambah baik dan masa depan masih menjanjikan!
Atas ialah kandungan terperinci Adakah ia dijangka menggantikan Deepfake? Mendedahkan betapa hebatnya teknologi NeRF yang paling popular tahun ini. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Hello semua, saya Casson. Ramai rakan pengaturcara ingin mengambil bahagian dalam pembangunan produk AI mereka sendiri. Kita boleh membahagikan bentuk produk kepada empat kuadran berdasarkan "darjah automasi proses" dan "darjah aplikasi AI". Antaranya: tahap automasi proses mengukur "berapa banyak proses perkhidmatan produk memerlukan campur tangan manual" dan tahap aplikasi AI mengukur "perkadaran aplikasi AI dalam produk" Pertama, hadkan keupayaan AI untuk memproses sesuatu Aplikasi gambar AI, dan pengguna melewatinya melalui aplikasi Proses perkhidmatan lengkap boleh diselesaikan dengan berinteraksi dengan UI, menghasilkan tahap automasi yang tinggi. Pada masa yang sama, "pemprosesan imej AI" sangat bergantung pada keupayaan AI, jadi aplikasi AI adalah tinggi. Kuadran kedua ialah bidang pembangunan aplikasi konvensional, seperti membangunkan aplikasi pengurusan pengetahuan, aplikasi pengurusan masa, dan automasi proses tinggi.

Jika kecerdasan buatan dibandingkan dengan revolusi perindustrian keempat, maka model besar adalah rizab makanan revolusi perindustrian keempat. Pada peringkat aplikasi, ia membolehkan industri melihat semula visi Persidangan Dartmouth di Amerika Syarikat pada tahun 1956 dan secara rasmi memulakan proses membentuk semula dunia. Mengikut takrifan pengeluar utama, perkakas rumah AI ialah perkakas rumah dengan interkoneksi, interaksi manusia-komputer dan keupayaan membuat keputusan aktif boleh dianggap sebagai bentuk peralatan rumah pintar yang tertinggi. Walau bagaimanapun, bolehkah model pintar seluruh rumah berkuasa AI yang kini berada di pasaran menjadi protagonis industri pada masa hadapan? Adakah corak persaingan baharu akan muncul dalam industri perkakas rumah? Artikel ini akan menganalisisnya dari tiga aspek. Mengapa risikan seluruh rumah berbunyi lebih kuat daripada titisan hujan? Sumber: Statista, Zhongan.com, Perunding iResearch, Teknologi Luotu, Pusat Maklumat Industri Kunci Negara

Pada tahun 2023, kecerdasan buatan generatif (Kandungan Dijana Kecerdasan Buatan, singkatannya AIGC) telah menjadi topik paling hangat dalam bidang teknologi Tidak dinafikan bahawa untuk industri pembuatan, bagaimana mereka harus mendapat manfaat daripada teknologi AI generatif yang sedang berkembang? Apakah jenis inspirasi yang boleh diperoleh oleh majoriti perusahaan kecil dan sederhana yang melaksanakan transformasi digital daripada ini? Baru-baru ini, Amazon Cloud Technology telah bekerjasama dengan wakil dari industri pembuatan untuk membincangkan arah aliran pembangunan semasa industri pembuatan China, cabaran dan peluang yang dihadapi oleh transformasi digital pembuatan tradisional, dan pembentukan semula pembuatan yang inovatif dengan kecerdasan buatan generatif -perbincangan mendalam tentang status aplikasi semasa AI generatif dalam industri pembuatan

Blokbuster seni AI China memindahkan teater ke mercu tanda klasik Lijiang Time News Baru-baru ini, IMAX telah mencipta blokbuster seni AI pertama China Dengan bantuan teknologi AI, teater IMAX telah "didarat" di Tembok Besar, Dunhuang, Sungai Guilin Lijiang dan. Zhangye Danxia Terdapat banyak mercu tanda domestik klasik di kawasan itu. Blokbuster seni AI ini telah dicipta oleh IMAX dengan kerjasama artis digital @kefan404 dan NEO Digital Ia terdiri daripada empat gambar ikonik skrin besar IMAX yang boleh disebarkan pada "kanvas" semula jadi berwarna-warni Zhangye Danxia atau ia mungkin membawa beribu-ribu tahun. sejarah. Dunhuang, sebuah bandar dengan warisan budaya yang kaya, berdiri bersebelahan, menyatu dengan landskap Sungai Li Guilin, atau menghadap ke Tembok Besar yang megah di antara pergunungan akan menjadi kenyataan. Sejak 2008 di Tokyo, Jepun

Sejak tahun ini, Zhou Hongyi, pengasas Kumpulan 360, tidak dapat dipisahkan daripada satu topik dalam semua ucapan awamnya, dan itu ialah model besar kecerdasan buatan. Dia pernah menggelar dirinya sebagai "penginjil GPT" dan penuh pujian atas kejayaan yang dicapai oleh ChatGPT, dan dia yakin dengan teguh tentang lelaran teknologi AI yang terhasil. Sebagai seorang usahawan bintang yang pandai meluahkan perasaan, ucapan Zhou Hongyi selalunya penuh dengan kata-kata jenaka, jadi "khutbah"nya juga telah mencipta banyak topik hangat dan sememangnya menambahkan api kepada model AI yang besar. Tetapi bagi Zhou Hongyi, menjadi pemimpin pendapat tidak mencukupi Dunia luar lebih mengambil berat tentang bagaimana 360, syarikat yang dikendalikannya, bertindak balas terhadap gelombang baharu AI ini. Malah, dalam tempoh 360, Zhou Hongyi telah pun memulakan perubahan untuk semua pekerja pada bulan April, dia mengeluarkan surat dalaman meminta setiap pekerja dan setiap pekerja 360

Pengarah Urusan Huawei Yu Chengdong menyiarkan jemputan ke persidangan HDC di Weibo hari ini, menunjukkan bahawa Hongmeng mungkin mempunyai keupayaan model besar AI. Menurut kandungan Weibo susulannya, teks jemputan itu dihasilkan oleh pembantu suara pintar Xiaoyi. Yu Chengdong berkata bahawa Hongmeng World tidak lama lagi akan membawa pengalaman baharu yang lebih bijak dan bertimbang rasa Menurut maklumat yang terdedah sebelum ini, Hongmeng 4 dijangka mencapai kemajuan yang ketara dalam keupayaan AI tahun ini, seterusnya menyatukan AI sebagai ciri teras sistem Hongmeng.

Dari era pusat panggilan manual, ia telah mengalami aplikasi reka bentuk proses IVR, sistem perkhidmatan pelanggan dalam talian, dll., dan telah berkembang kepada perkhidmatan pelanggan kecerdasan buatan (AI) hari ini. Sebagai tingkap penting untuk memberi perkhidmatan kepada pelanggan, industri perkhidmatan pelanggan sentiasa berada di barisan hadapan, sentiasa menggunakan teknologi baharu untuk membangunkan produktiviti baharu, dan bergerak ke arah kecekapan tinggi, kualiti tinggi, perkhidmatan tinggi dan pelanggan yang diperibadikan sepanjang cuaca. perkhidmatan. Dengan peningkatan bilangan pelanggan dan peningkatan pesat dalam kos perkhidmatan buruh, bagaimana menggunakan kecerdasan buatan, data besar dan teknologi maklumat generasi baharu yang lain untuk mempromosikan pusat perkhidmatan pelanggan dalam pelbagai industri daripada intensif buruh kepada pintar, halus dan halus? Transformasi dan peningkatan teknologi telah menjadi isu penting yang dihadapi oleh banyak industri. Mendapat manfaat daripada kemajuan berterusan teknologi kecerdasan buatan dan perkembangan pesat aplikasi berasaskan senario,

Dalam dunia yang penuh dengan teknologi masa depan, kecerdasan buatan telah menjadi pembantu yang sangat diperlukan dalam kehidupan manusia. Walau bagaimanapun, kecerdasan buatan bukan sahaja untuk memudahkan kehidupan kita, ia juga mengubah struktur dan operasi masyarakat manusia dengan cara yang tenang. Salah satu implikasi positif yang paling penting ialah kesaksamaan maklumat menghapuskan jurang digital supaya semua orang dapat sama-sama menikmati kemudahan yang dibawa oleh teknologi Dalam era digital semasa, pemformatan telah menjadi kuasa penting dalam menggalakkan pembangunan sosial. Namun begitu, kita juga menghadapi masalah sebenar iaitu wujud jurang digital yang menghalang sesetengah orang daripada menikmati kemudahan yang dibawa oleh teknologi. Oleh itu, hak sama rata dalam pemformatan adalah amat penting Ia boleh menghapuskan jurang digital, membolehkan semua orang berkongsi hasil pembangunan saintifik dan teknologi secara sama rata, dan mencapai kemajuan sosial secara keseluruhan.
