Jadual Kandungan
Eksperimen dan keputusan
Rumah Peranti teknologi AI Memanjat di sepanjang kabel rangkaian telah menjadi kenyataan Audio2Photoreal boleh menjana ekspresi dan pergerakan yang realistik melalui dialog.

Memanjat di sepanjang kabel rangkaian telah menjadi kenyataan Audio2Photoreal boleh menjana ekspresi dan pergerakan yang realistik melalui dialog.

Jan 12, 2024 am 09:03 AM
ai maya

Apabila anda dan rakan anda berbual merentasi skrin mudah alih yang sejuk, anda perlu meneka nada orang lain. Apabila dia bercakap, ekspresi dan juga tindakannya boleh muncul dalam fikiran anda. Jelas sekali adalah lebih baik jika anda boleh membuat panggilan video, tetapi dalam situasi sebenar anda tidak boleh membuat panggilan video pada bila-bila masa.

Jika anda bersembang dengan rakan jauh, ia bukan melalui teks skrin sejuk atau avatar yang tiada ekspresi, tetapi orang maya digital yang realistik, dinamik dan ekspresif. Orang maya ini bukan sahaja dapat menghasilkan semula senyuman, mata, dan juga pergerakan badan yang halus rakan anda dengan sempurna. Adakah anda akan berasa lebih baik dan hangat? Ia benar-benar merangkumi ayat "Saya akan merangkak di sepanjang kabel rangkaian untuk mencari anda."

Ini bukan fantasi fiksyen sains, tetapi teknologi yang boleh direalisasikan dalam realiti.

Ekspresi muka dan pergerakan badan mengandungi sejumlah besar maklumat, yang akan sangat mempengaruhi maksud kandungan. Sebagai contoh, bercakap sambil melihat pihak lain sepanjang masa dan bercakap tanpa bertentang mata akan memberikan orang perasaan yang sama sekali berbeza, yang juga akan menjejaskan pemahaman pihak lain tentang kandungan komunikasi. Kami mempunyai keupayaan yang sangat berminat untuk mengesan ekspresi dan pergerakan halus ini semasa komunikasi dan menggunakannya untuk membangunkan pemahaman tahap tinggi tentang niat, tahap keselesaan atau pemahaman rakan perbualan. Oleh itu, membangunkan avatar perbualan yang sangat realistik yang menangkap kehalusan ini adalah penting untuk interaksi.

Untuk tujuan ini, penyelidik dari Meta dan University of California telah mencadangkan kaedah untuk menjana manusia maya yang realistik berdasarkan audio pertuturan perbualan antara dua orang. Ia boleh mensintesis pelbagai gerak isyarat frekuensi tinggi dan pergerakan muka ekspresif yang disegerakkan rapat dengan pertuturan. Untuk badan dan tangan, mereka mengeksploitasi kelebihan pendekatan berasaskan VQ autoregresif dan model penyebaran. Untuk wajah, mereka menggunakan model resapan yang dikondisikan pada audio. Pergerakan muka, badan dan tangan yang diramalkan kemudiannya dijadikan manusia maya yang realistik. Kami menunjukkan bahawa menambahkan syarat gerak isyarat berpandu pada model resapan boleh menjana gerak isyarat perbualan yang lebih pelbagai dan munasabah berbanding karya sebelumnya. . ng/ projects/audio2photoreal/

Memanjat di sepanjang kabel rangkaian telah menjadi kenyataan Audio2Photoreal boleh menjana ekspresi dan pergerakan yang realistik melalui dialog.

Para penyelidik berkata mereka adalah pasukan pertama yang mengkaji cara menjana pergerakan muka, badan dan tangan yang realistik untuk perbualan interpersonal. Berbanding dengan kajian terdahulu, para penyelidik mensintesis tindakan yang lebih realistik dan pelbagai berdasarkan kaedah VQ dan penyebaran.

  • Gambaran Keseluruhan KaedahPenyelidik mengekstrak kod ekspresi terpendam daripada data berbilang pandangan yang direkodkan untuk mewakili wajah, dan menggunakan sudut sendi dalam rangka kinematik untuk mewakili postur badan. Seperti yang ditunjukkan dalam Rajah 3, sistem ini terdiri daripada dua model generatif, yang menjana kod ekspresi dan urutan postur badan apabila memasukkan audio perbualan dua orang. Kod ekspresi dan urutan pose badan kemudiannya boleh dipaparkan dalam bingkai demi bingkai menggunakan Neural Avatar Renderer, yang boleh menjana avatar bertekstur sepenuhnya dengan muka, badan dan tangan daripada paparan kamera yang diberikan.
  • Perlu diingatkan bahawa dinamik badan dan muka sangat berbeza. Pertama, wajah berkorelasi kuat dengan audio input, terutamanya pergerakan bibir, manakala badan berkorelasi lemah dengan pertuturan. Ini menghasilkan kepelbagaian gerak isyarat badan yang lebih kompleks dalam input pertuturan yang diberikan. Kedua, memandangkan muka dan badan diwakili dalam dua ruang yang berbeza, mereka masing-masing mengikut dinamik temporal yang berbeza. Oleh itu, para penyelidik menggunakan dua model gerakan bebas untuk mensimulasikan muka dan badan. Dengan cara ini, model muka boleh "memberi tumpuan" pada butiran muka yang konsisten dengan pertuturan, manakala model badan boleh memberi lebih tumpuan kepada penjanaan pergerakan badan yang pelbagai tetapi munasabah.

Model gerakan muka ialah model resapan yang dikondisikan pada audio input dan bucu bibir yang dijana oleh regressor bibir yang telah terlatih (Rajah 4a). Bagi model pergerakan anggota badan, penyelidik mendapati bahawa pergerakan yang dihasilkan oleh model penyebaran tulen yang hanya dikondisikan pada audio tidak mempunyai kepelbagaian dan tidak cukup diselaraskan dalam urutan masa. Walau bagaimanapun, kualiti bertambah baik apabila penyelidik menggunakan postur bimbingan yang berbeza. Oleh itu, mereka membahagikan model gerakan badan kepada dua bahagian: pertama, perapi audio autoregresif meramalkan pose panduan kasar pada 1 fp (Rajah 4b), dan kemudian model resapan menggunakan pose panduan kasar ini untuk mengisi butiran halus dan tinggi. pergerakan frekuensi (Rajah 4c). Lihat artikel asal untuk mendapatkan butiran lanjut tentang tetapan kaedah.

Memanjat di sepanjang kabel rangkaian telah menjadi kenyataan Audio2Photoreal boleh menjana ekspresi dan pergerakan yang realistik melalui dialog.

Eksperimen dan keputusan

Para penyelidik menilai secara kuantitatif keupayaan Audio2Photoreal untuk menjana tindakan dialog yang realistik dengan berkesan berdasarkan data sebenar. Penilaian persepsi juga dilakukan untuk mengesahkan keputusan kuantitatif dan mengukur kesesuaian Audio2Photoreal dalam menghasilkan gerak isyarat dalam konteks perbualan tertentu. Keputusan eksperimen menunjukkan bahawa penilai lebih sensitif terhadap gerak isyarat halus apabila gerak isyarat tersebut dipersembahkan pada avatar yang realistik dan bukannya mesh 3D.

Para penyelidik membandingkan hasil yang dihasilkan kaedah ini dengan tiga kaedah asas: KNN, SHOW, dan LDA berdasarkan urutan gerakan rawak dalam set latihan. Eksperimen ablasi telah dijalankan untuk menguji keberkesanan setiap komponen Audio2Photoreal tanpa audio atau gerak isyarat berpandu, tanpa gerak isyarat berpandu tetapi berdasarkan audio, dan tanpa audio tetapi berdasarkan gerak isyarat berpandu.

Keputusan kuantitatif

Jadual 1 menunjukkan bahawa berbanding dengan kajian terdahulu, kaedah kami mempunyai skor FD terendah apabila menjana gerakan dengan kepelbagaian tertinggi. Walaupun rawak mempunyai kepelbagaian yang baik yang sepadan dengan GT, segmen rawak tidak sepadan dengan dinamik perbualan yang sepadan, menghasilkan FD_g yang tinggi.

Memanjat di sepanjang kabel rangkaian telah menjadi kenyataan Audio2Photoreal boleh menjana ekspresi dan pergerakan yang realistik melalui dialog.

Rajah 5 menunjukkan kepelbagaian pose bimbingan yang dihasilkan oleh kaedah kami. Pensampelan P transformer berasaskan VQ membolehkan penjanaan gerak isyarat yang sangat berbeza dengan input audio yang sama.

Memanjat di sepanjang kabel rangkaian telah menjadi kenyataan Audio2Photoreal boleh menjana ekspresi dan pergerakan yang realistik melalui dialog.

Seperti yang ditunjukkan dalam Rajah 6, model resapan akan belajar untuk menjana tindakan dinamik, di mana tindakan akan lebih sepadan dengan audio perbualan.

Memanjat di sepanjang kabel rangkaian telah menjadi kenyataan Audio2Photoreal boleh menjana ekspresi dan pergerakan yang realistik melalui dialog.

Rajah 7 menunjukkan bahawa gerakan yang dihasilkan oleh LDA tidak mempunyai daya hidup dan kurang pergerakan. Sebaliknya, perubahan gerakan yang disintesis oleh kaedah ini lebih konsisten dengan keadaan sebenar.

Memanjat di sepanjang kabel rangkaian telah menjadi kenyataan Audio2Photoreal boleh menjana ekspresi dan pergerakan yang realistik melalui dialog.

Selain itu, pengkaji turut menganalisis ketepatan kaedah ini dalam menghasilkan pergerakan bibir. Seperti yang ditunjukkan oleh statistik dalam Jadual 2, Audio2Photoreal mengatasi dengan ketara kaedah garis dasar SHOW, serta prestasi selepas mengalih keluar regressor bibir terlatih dalam eksperimen ablasi. Reka bentuk ini meningkatkan penyegerakan bentuk mulut semasa bercakap, dengan berkesan mengelakkan pergerakan rawak membuka dan menutup mulut apabila tidak bercakap, membolehkan model mencapai pembinaan semula pergerakan bibir yang lebih baik, dan pada masa yang sama mengurangkan bucu jejaring muka ( Grid L2) ralat.

Memanjat di sepanjang kabel rangkaian telah menjadi kenyataan Audio2Photoreal boleh menjana ekspresi dan pergerakan yang realistik melalui dialog.

Penilaian kualitatif

Memandangkan keselarasan gerak isyarat dalam perbualan sukar untuk diukur, penyelidik menggunakan kaedah kualitatif untuk penilaian. Mereka menjalankan dua set ujian A/B di MTurk. Secara khusus, mereka meminta penilai untuk menonton hasil yang dijana bagi kaedah kami dan kaedah garis dasar atau pasangan video kaedah kami dan adegan sebenar, dan meminta mereka menilai video yang mana usul itu kelihatan lebih munasabah.

Seperti yang ditunjukkan dalam Rajah 8, kaedah ini jauh lebih baik daripada kaedah garis dasar sebelumnya LDA, dan kira-kira 70% daripada penilai memilih Audio2Photoreal dari segi grid dan realisme.

Seperti yang ditunjukkan dalam carta teratas Rajah 8, berbanding dengan LDA, penilaian penilai kaedah ini berubah daripada "sangat suka" kepada "sangat suka". Berbanding dengan keadaan sebenar, penilaian yang sama dibentangkan. Namun, penilai lebih mengutamakan perkara sebenar berbanding Audio2Photoreal dalam hal realisme.

Memanjat di sepanjang kabel rangkaian telah menjadi kenyataan Audio2Photoreal boleh menjana ekspresi dan pergerakan yang realistik melalui dialog.

Untuk butiran lanjut teknikal, sila baca kertas asal.

Atas ialah kandungan terperinci Memanjat di sepanjang kabel rangkaian telah menjadi kenyataan Audio2Photoreal boleh menjana ekspresi dan pergerakan yang realistik melalui dialog.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Arahan sembang dan cara menggunakannya
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Cara Melaksanakan Penyortiran Fail oleh Debian Readdir Cara Melaksanakan Penyortiran Fail oleh Debian Readdir Apr 13, 2025 am 09:06 AM

Dalam sistem Debian, fungsi Readdir digunakan untuk membaca kandungan direktori, tetapi urutan yang dikembalikannya tidak ditentukan sebelumnya. Untuk menyusun fail dalam direktori, anda perlu membaca semua fail terlebih dahulu, dan kemudian menyusunnya menggunakan fungsi QSORT. Kod berikut menunjukkan cara menyusun fail direktori menggunakan ReadDir dan QSORT dalam sistem Debian:#termasuk#termasuk#termasuk#termasuk // fungsi perbandingan adat, yang digunakan untuk qSortintCompare (Constvoid*A, Constvoid*b) {Returnstrcmp (*(*(*(*(*(*(*(*(*(*(*(*(*(*(*(*(*(

Cara Menetapkan Tahap Log Debian Apache Cara Menetapkan Tahap Log Debian Apache Apr 13, 2025 am 08:33 AM

Artikel ini menerangkan cara menyesuaikan tahap pembalakan pelayan Apacheweb dalam sistem Debian. Dengan mengubah suai fail konfigurasi, anda boleh mengawal tahap maklumat log yang direkodkan oleh Apache. Kaedah 1: Ubah suai fail konfigurasi utama untuk mencari fail konfigurasi: Fail konfigurasi apache2.x biasanya terletak di direktori/etc/apache2/direktori. Nama fail mungkin apache2.conf atau httpd.conf, bergantung pada kaedah pemasangan anda. Edit Fail Konfigurasi: Buka Fail Konfigurasi dengan Kebenaran Root Menggunakan Editor Teks (seperti Nano): Sudonano/ETC/APACHE2/APACHE2.CONF

Cara Mengoptimumkan Prestasi Debian Readdir Cara Mengoptimumkan Prestasi Debian Readdir Apr 13, 2025 am 08:48 AM

Dalam sistem Debian, panggilan sistem Readdir digunakan untuk membaca kandungan direktori. Jika prestasinya tidak baik, cuba strategi pengoptimuman berikut: Memudahkan bilangan fail direktori: Split direktori besar ke dalam pelbagai direktori kecil sebanyak mungkin, mengurangkan bilangan item yang diproses setiap panggilan readdir. Dayakan Caching Kandungan Direktori: Bina mekanisme cache, kemas kini cache secara teratur atau apabila kandungan direktori berubah, dan mengurangkan panggilan kerap ke Readdir. Cafh memori (seperti memcached atau redis) atau cache tempatan (seperti fail atau pangkalan data) boleh dipertimbangkan. Mengamalkan struktur data yang cekap: Sekiranya anda melaksanakan traversal direktori sendiri, pilih struktur data yang lebih cekap (seperti jadual hash dan bukannya carian linear) untuk menyimpan dan mengakses maklumat direktori

Petua Konfigurasi Firewall Pelayan Mel Debian Petua Konfigurasi Firewall Pelayan Mel Debian Apr 13, 2025 am 11:42 AM

Mengkonfigurasi firewall pelayan Mail Debian adalah langkah penting dalam memastikan keselamatan pelayan. Berikut adalah beberapa kaedah konfigurasi firewall yang biasa digunakan, termasuk penggunaan iptables dan firewalld. Gunakan iptables untuk mengkonfigurasi firewall untuk memasang iptables (jika belum dipasang): sudoapt-getupdateudoapt-getinstalliplesview peraturan iptables semasa: konfigurasi sudoiptable-l

Kaedah pemasangan sijil SSL Server Server Debian Kaedah pemasangan sijil SSL Server Server Debian Apr 13, 2025 am 11:39 AM

Langkah -langkah untuk memasang sijil SSL pada pelayan mel Debian adalah seperti berikut: 1. Pasang OpenSSL Toolkit terlebih dahulu, pastikan bahawa OpenSSL Toolkit telah dipasang pada sistem anda. Jika tidak dipasang, anda boleh menggunakan arahan berikut untuk memasang: sudoapt-getupdateudoapt-getinstallopenssl2. Menjana permintaan kunci dan sijil peribadi seterusnya, gunakan OpenSSL untuk menjana kunci peribadi RSA 2048-bit dan permintaan sijil (CSR): Membuka

Bagaimana Debian Readdir Bersepadu Dengan Alat Lain Bagaimana Debian Readdir Bersepadu Dengan Alat Lain Apr 13, 2025 am 09:42 AM

Fungsi Readdir dalam sistem Debian adalah panggilan sistem yang digunakan untuk membaca kandungan direktori dan sering digunakan dalam pengaturcaraan C. Artikel ini akan menerangkan cara mengintegrasikan Readdir dengan alat lain untuk meningkatkan fungsinya. Kaedah 1: Menggabungkan Program Bahasa C dan Pipeline Pertama, tulis program C untuk memanggil fungsi Readdir dan output hasilnya:#termasuk#termasuk#includeintMain (intargc, char*argv []) {dir*dir; structdirent*entry; if (argc! = 2) {

Bagaimana Debian OpenSSL Menghalang Serangan Man-dalam-Middle Bagaimana Debian OpenSSL Menghalang Serangan Man-dalam-Middle Apr 13, 2025 am 10:30 AM

Dalam sistem Debian, OpenSSL adalah perpustakaan penting untuk pengurusan penyulitan, penyahsulitan dan sijil. Untuk mengelakkan serangan lelaki-dalam-pertengahan (MITM), langkah-langkah berikut boleh diambil: Gunakan HTTPS: Pastikan semua permintaan rangkaian menggunakan protokol HTTPS dan bukannya HTTP. HTTPS menggunakan TLS (Protokol Keselamatan Lapisan Pengangkutan) untuk menyulitkan data komunikasi untuk memastikan data tidak dicuri atau diganggu semasa penghantaran. Sahkan Sijil Pelayan: Sahkan secara manual Sijil Pelayan pada klien untuk memastikan ia boleh dipercayai. Pelayan boleh disahkan secara manual melalui kaedah perwakilan urlSession

Cara Belajar Debian Syslog Cara Belajar Debian Syslog Apr 13, 2025 am 11:51 AM

Panduan ini akan membimbing anda untuk belajar cara menggunakan syslog dalam sistem Debian. SYSLOG adalah perkhidmatan utama dalam sistem Linux untuk sistem pembalakan dan mesej log aplikasi. Ia membantu pentadbir memantau dan menganalisis aktiviti sistem untuk mengenal pasti dan menyelesaikan masalah dengan cepat. 1. Pengetahuan asas syslog Fungsi teras syslog termasuk: mengumpul dan menguruskan mesej log secara terpusat; menyokong pelbagai format output log dan lokasi sasaran (seperti fail atau rangkaian); Menyediakan fungsi tontonan log dan penapisan masa nyata. 2. Pasang dan konfigurasikan syslog (menggunakan rsyslog) Sistem Debian menggunakan rsyslog secara lalai. Anda boleh memasangnya dengan arahan berikut: sudoaptupdatesud

See all articles