Jadual Kandungan
Penyelewengan Tersirat Sihir
Struktur model
Hasil eksperimen
Rumah Peranti teknologi AI DeepFake tidak pernah begitu nyata! Seberapa kuat 'herotan tersirat' terbaru Nvidia?

DeepFake tidak pernah begitu nyata! Seberapa kuat 'herotan tersirat' terbaru Nvidia?

Apr 11, 2023 pm 07:31 PM
teknologi deepfake

Dalam beberapa tahun kebelakangan ini, teknologi penjanaan dalam bidang penglihatan komputer telah menjadi semakin berkuasa, dan teknologi "pemalsuan" yang sepadan telah menjadi semakin matang Daripada perubahan wajah DeepFake kepada simulasi tindakan , sukar untuk membezakan yang sebenar daripada yang palsu.

Baru-baru ini, NVIDIA telah membuat satu lagi langkah besar, dan menerbitkan rangka kerja Implicit Warping (Implicit Warping) di persidangan NeurIPS 2022, menggunakan Satu set imej sumber dan mendorong gerakan video untuk membuat animasi sasaran.

DeepFake tidak pernah begitu nyata! Seberapa kuat herotan tersirat terbaru Nvidia?

Pautan kertas: https://arxiv.org/pdf/2210.01794.pdf

Dari sudut kesan, imej yang dihasilkan lebih realistik Apabila watak bergerak dalam video, latar belakang tidak akan berubah.

Masukkan imej berbilang sumber biasanya memberikan maklumat penampilan yang berbeza, mengurangkan ruang "fantasi" penjana , sebagai contoh, yang berikut dua digunakan sebagai input model.

Boleh didapati bahawa berbanding model lain, herotan tersirat tidak menghasilkan "herotan ruang" yang serupa dengan kesan kecantikan.

Disebabkan kesesakan orang, imej berbilang sumber juga boleh memberikan latar belakang yang lebih lengkap.

DeepFake tidak pernah begitu nyata! Seberapa kuat herotan tersirat terbaru Nvidia?

Seperti yang anda boleh lihat dari video di bawah, jika hanya ada satu gambar di sebelah kiri, ialah gambar di belakang latar belakang " BD" atau " ED" sukar diteka , yang akan menyebabkan herotan latar belakang dan dua gambar akan menghasilkan imej yang lebih stabil.

Apabila membandingkan model lain, hanya satu imej sumber adalah lebih baik.

DeepFake tidak pernah begitu nyata! Seberapa kuat herotan tersirat terbaru Nvidia?

Penyelewengan Tersirat Sihir

Tiruan video dalam akademik boleh dikesan kembali ke 2005, dan banyak projek mempunyai pembiakan muka masa nyata Penghantaran ekspresi, Face2Face, Obama sintetik, Recycle-GAN, ReenactGAN, medan sinaran saraf dinamik, dsb. mempelbagaikan teknologi terhad pada masa itu, seperti rangkaian adversarial generatif (GAN), medan sinaran saraf (NeRF) dan pengekod auto.

Bukan semua kaedah cuba menjana video daripada satu bingkai imej. Terdapat juga beberapa kajian yang melakukan pengiraan yang rumit pada setiap bingkai dalam video. Ambil laluan tiruan.

Walau bagaimanapun, memandangkan model DeepFake memperoleh maklumat yang kurang, kaedah ini memerlukan latihan untuk setiap klip video, dan prestasinya berkurangan berbanding kaedah sumber terbuka DeepFaceLab atau FaceSwap This Both boleh mengenakan identiti pada sebarang bilangan klip video.

Model FOMM yang dikeluarkan pada 2019 membenarkan watak bergerak bersama video, memberikan tugas meniru video sekali lagi.

Penyelidik lain kemudiannya cuba mendapatkan berbilang pose dan ekspresi daripada imej muka tunggal atau perwakilan badan penuh walau bagaimanapun, pendekatan ini secara amnya hanya berfungsi untuk subjek yang agak tanpa ekspresi dan tidak bergerak, seperti a "kepala bercakap" yang agak pegun kerana tiada "perubahan mendadak dalam tingkah laku" dalam ekspresi muka atau gerak isyarat yang perlu ditafsirkan oleh rangkaian.

DeepFake tidak pernah begitu nyata! Seberapa kuat herotan tersirat terbaru Nvidia?

Walaupun beberapa teknologi dan kaedah ini mendapat perhatian umum sebelum teknologi palsu mendalam dan kaedah sintesis imej penyebaran berpotensi menjadi popular, skop penggunaannya adalah terhad. , serba boleh dipersoalkan.

Penyelewengan tersirat yang difokuskan oleh NVIDIA kali ini adalah untuk mendapatkan maklumat antara berbilang bingkai atau bahkan antara dua bingkai, dan bukannya mendapatkan semua pose yang diperlukan daripada satu bingkai Maklumat, persediaan ini adalah' t hadir dalam model bersaing lain, atau dikendalikan dengan sangat buruk.

DeepFake tidak pernah begitu nyata! Seberapa kuat herotan tersirat terbaru Nvidia?

Sebagai contoh, aliran kerja Disney ialah animator kanan melukis bingkai utama dan bingkai utama, dan animator junior lain bertanggungjawab untuk melukis bingkai perantaraan.

Melalui ujian pada versi terdahulu, penyelidik NVIDIA mendapati bahawa kualiti hasil kaedah sebelumnya merosot dengan "keyframe" tambahan, dan kaedah baharu itu tidak konsisten dengan logik pengeluaran animasi secara konsisten , prestasi bertambah baik secara linear apabila bilangan bingkai utama bertambah.

Jika terdapat beberapa perubahan mendadak di tengah-tengah klip, seperti peristiwa atau ungkapan yang tidak ditunjukkan dalam bingkai mula atau bingkai akhir, herotan tersirat boleh ditambah di bingkai Satu titik tengah ini, maklumat tambahan akan diberikan kembali kepada mekanisme perhatian keseluruhan klip.

DeepFake tidak pernah begitu nyata! Seberapa kuat herotan tersirat terbaru Nvidia?

Struktur model

Kaedah sebelumnya seperti FOMM, Monkey-Net dan face-vid2vid dsb. gunakan herotan yang jelas untuk melukis Masa siri, Maklumat yang diekstrak daripada muka dan kawalan sumber, pergerakan mesti disesuaikan dan konsisten dengan siri kali ini.

Di bawah reka bentuk model ini, pemetaan akhir perkara utama agak ketat.

Sebaliknya, ledingan tersirat menggunakan lapisan perhatian merentas mod dengan kurang strap but pratakrif disertakan dalam aliran kerjanya dan boleh menyesuaikan diri dengan input daripada berbilang rangka kerja.

Aliran kerja juga tidak memerlukan herotan berdasarkan setiap kekunci, sistem boleh memilih ciri yang paling sesuai daripada satu siri imej.

DeepFake tidak pernah begitu nyata! Seberapa kuat herotan tersirat terbaru Nvidia?

Ledingan tersirat juga menggunakan semula beberapa komponen ramalan titik penting dalam rangka kerja FOMM dan akhirnya menggunakan U-net mudah untuk memperoleh perwakilan titik utama Drive ruang untuk pengekodan. U-net yang berasingan digunakan untuk mengekod imej sumber bersama-sama dengan perwakilan spatial terbitan Kedua-dua rangkaian boleh beroperasi pada resolusi antara 64px (256px keluaran kuasa dua) hingga 384x384px.

DeepFake tidak pernah begitu nyata! Seberapa kuat herotan tersirat terbaru Nvidia?

Oleh kerana mekanisme ini tidak boleh mengambil kira secara automatik semua kemungkinan perubahan dalam pose dan pergerakan dalam mana-mana video tertentu, bingkai utama tambahan diperlukan , boleh ditambah buat sementara waktu. Tanpa keupayaan campur tangan ini, kunci yang tidak cukup serupa dengan titik gerakan sasaran akan dikemas kini secara automatik, mengakibatkan penurunan dalam kualiti output.

Penjelasan penyelidik untuk perkara ini ialah walaupun ia adalah kunci yang paling serupa dengan pertanyaan dalam set bingkai utama tertentu, ia mungkin tidak mencukupi untuk menghasilkan output yang baik.

Contohnya, katakan imej sumber mempunyai muka dengan bibir tertutup, dan imej pemandu mempunyai muka dengan bibir terbuka dan gigi terdedah. Dalam kes ini, tiada kunci (dan nilai) yang sesuai dalam imej sumber untuk memacu kawasan mulut imej.

Kaedah ini mengatasi masalah ini dengan mempelajari pasangan nilai kunci bebas imej tambahan, yang boleh mengatasi kekurangan maklumat dalam imej sumber.

Walaupun pelaksanaan semasa agak pantas, sekitar 10 FPS pada imej 512x512px, para penyelidik percaya bahawa dalam versi akan datang, saluran paip boleh melalui lapisan perhatian I-D terfaktor Atau Spatial Lapisan Pengurangan Perhatian (SRA) (iaitu Pyramid Vision Transformer) untuk dioptimumkan.

DeepFake tidak pernah begitu nyata! Seberapa kuat herotan tersirat terbaru Nvidia?

Oleh kerana pelesenan tersirat menggunakan perhatian global dan bukannya perhatian tempatan, ia boleh meramalkan faktor yang tidak dapat diramalkan oleh model terdahulu.

Hasil eksperimen

Para penyelidik menguji sistem pada set data VoxCeleb2, set data TED Talk yang lebih mencabar dan set data TalkingHead-1KH, membandingkan Baseline antara 256x256px dan resolusi penuh 512x512px, menggunakan metrik termasuk FID, LPIPS berasaskan AlexNet dan Nisbah Isyarat-ke-Bunyi Puncak (pSNR).

Rangka kerja perbandingan yang digunakan untuk ujian termasuk FOMM dan face-vid2vid, serta AA-PCA, yang juga merupakan inovasi utama herotan tersirat kerana kaedah sebelumnya mempunyai sedikit atau tiada keupayaan untuk menggunakan berbilang bingkai utama, penyelidikan kakitangan juga mereka bentuk kaedah ujian yang serupa.

DeepFake tidak pernah begitu nyata! Seberapa kuat herotan tersirat terbaru Nvidia?

Ledingan tersirat mengatasi prestasi kaedah yang berbeza pada kebanyakan metrik.

Dalam ujian pembinaan semula bingkai kunci berbilang, di mana penyelidik menggunakan jujukan sehingga 180 bingkai dan bingkai jurang terpilih, herotan tersirat memenangi keseluruhan kali ini.

DeepFake tidak pernah begitu nyata! Seberapa kuat herotan tersirat terbaru Nvidia?

Apabila bilangan imej sumber meningkat, kaedah ini boleh mencapai hasil pembinaan semula yang lebih baik, dan markah semua penunjuk bertambah baik.

Dan apabila bilangan imej sumber meningkat, kesan pembinaan semula kerja terdahulu menjadi lebih teruk, bertentangan dengan jangkaan.

DeepFake tidak pernah begitu nyata! Seberapa kuat herotan tersirat terbaru Nvidia?

Selepas menjalankan penyelidikan kualitatif oleh kakitangan AMT, ia juga dipercayai bahawa hasil penjanaan ubah bentuk tersirat adalah lebih kuat daripada kaedah lain.

DeepFake tidak pernah begitu nyata! Seberapa kuat herotan tersirat terbaru Nvidia?

Memiliki akses kepada rangka kerja ini, pengguna akan dapat mencipta simulasi video yang lebih koheren, lebih panjang dan video palsu dalam badan penuh, sambil Mampu mempamerkan julat pergerakan yang jauh lebih besar daripada mana-mana bingkai yang sistem telah diuji.

Tetapi penyelidikan terhadap sintesis imej yang lebih realistik juga membawa kebimbangan, kerana teknik ini boleh digunakan dengan mudah untuk pemalsuan, dan terdapat penafian standard dalam kertas itu.

Jika kaedah kami digunakan untuk mencipta produk DeepFake, ia mungkin mempunyai akibat negatif. Sintesis pertuturan berniat jahat mencipta imej palsu orang dengan memindahkan dan menghantar maklumat palsu merentas identiti, yang membawa kepada kecurian identiti atau penyebaran berita palsu. Tetapi dalam tetapan terkawal, teknologi yang sama juga boleh digunakan untuk tujuan hiburan.

Makalah ini juga menunjukkan potensi sistem ini untuk pembinaan semula video saraf, seperti Project Starline Google Dalam rangka kerja ini, kerja pembinaan semula tertumpu terutamanya pada pelanggan, memanfaatkan input yang jarang daripada. orang di hujung yang lain.

Penyelesaian ini menarik lebih banyak minat daripada komuniti penyelidikan, dan sesetengah syarikat berhasrat untuk melaksanakan panggilan persidangan lebar jalur rendah dengan menghantar data gerakan tulen atau bingkai kunci yang jarang dijarakkan akan Ditafsirkan dan dimasukkan ke dalam video HD penuh apabila mencapai pelanggan sasaran.

Atas ialah kandungan terperinci DeepFake tidak pernah begitu nyata! Seberapa kuat 'herotan tersirat' terbaru Nvidia?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Adakah anda benar-benar menguasai penukaran sistem koordinat? Isu berbilang sensor yang tidak dapat dipisahkan daripada pemanduan autonomi Adakah anda benar-benar menguasai penukaran sistem koordinat? Isu berbilang sensor yang tidak dapat dipisahkan daripada pemanduan autonomi Oct 12, 2023 am 11:21 AM

Artikel perintis dan utama pertama terutamanya memperkenalkan beberapa sistem koordinat yang biasa digunakan dalam teknologi pemanduan autonomi, dan cara melengkapkan korelasi dan penukaran antara mereka, dan akhirnya membina model persekitaran bersatu. Fokus di sini adalah untuk memahami penukaran daripada kenderaan kepada badan tegar kamera (parameter luaran), penukaran kamera kepada imej (parameter dalaman) dan penukaran unit imej kepada piksel. Penukaran daripada 3D kepada 2D akan mempunyai herotan, terjemahan, dsb. Perkara utama: Sistem koordinat kenderaan dan sistem koordinat badan kamera perlu ditulis semula: sistem koordinat satah dan sistem koordinat piksel Kesukaran: herotan imej mesti dipertimbangkan Kedua-dua penyahherotan dan penambahan herotan diberi pampasan pada satah imej. 2. Pengenalan Terdapat empat sistem penglihatan secara keseluruhannya: sistem koordinat satah piksel (u, v), sistem koordinat imej (x, y), sistem koordinat kamera () dan sistem koordinat dunia (). Terdapat hubungan antara setiap sistem koordinat,

Kertas Stable Diffusion 3 akhirnya telah dikeluarkan, dan butiran seni bina didedahkan Adakah ia akan membantu untuk menghasilkan semula Sora? Kertas Stable Diffusion 3 akhirnya telah dikeluarkan, dan butiran seni bina didedahkan Adakah ia akan membantu untuk menghasilkan semula Sora? Mar 06, 2024 pm 05:34 PM

Kertas StableDiffusion3 akhirnya di sini! Model ini dikeluarkan dua minggu lalu dan menggunakan seni bina DiT (DiffusionTransformer) yang sama seperti Sora. Ia menimbulkan kekecohan apabila ia dikeluarkan. Berbanding dengan versi sebelumnya, kualiti imej yang dijana oleh StableDiffusion3 telah dipertingkatkan dengan ketara Ia kini menyokong gesaan berbilang tema, dan kesan penulisan teks juga telah dipertingkatkan, dan aksara bercelaru tidak lagi muncul. StabilityAI menegaskan bahawa StableDiffusion3 ialah satu siri model dengan saiz parameter antara 800M hingga 8B. Julat parameter ini bermakna model boleh dijalankan terus pada banyak peranti mudah alih, dengan ketara mengurangkan penggunaan AI

Artikel ini sudah cukup untuk anda membaca tentang pemanduan autonomi dan ramalan trajektori! Artikel ini sudah cukup untuk anda membaca tentang pemanduan autonomi dan ramalan trajektori! Feb 28, 2024 pm 07:20 PM

Ramalan trajektori memainkan peranan penting dalam pemanduan autonomi Ramalan trajektori pemanduan autonomi merujuk kepada meramalkan trajektori pemanduan masa hadapan kenderaan dengan menganalisis pelbagai data semasa proses pemanduan kenderaan. Sebagai modul teras pemanduan autonomi, kualiti ramalan trajektori adalah penting untuk kawalan perancangan hiliran. Tugas ramalan trajektori mempunyai timbunan teknologi yang kaya dan memerlukan kebiasaan dengan persepsi dinamik/statik pemanduan autonomi, peta ketepatan tinggi, garisan lorong, kemahiran seni bina rangkaian saraf (CNN&GNN&Transformer), dll. Sangat sukar untuk bermula! Ramai peminat berharap untuk memulakan ramalan trajektori secepat mungkin dan mengelakkan perangkap Hari ini saya akan mengambil kira beberapa masalah biasa dan kaedah pembelajaran pengenalan untuk ramalan trajektori! Pengetahuan berkaitan pengenalan 1. Adakah kertas pratonton teratur? A: Tengok survey dulu, hlm

DualBEV: mengatasi BEVFormer dan BEVDet4D dengan ketara, buka buku! DualBEV: mengatasi BEVFormer dan BEVDet4D dengan ketara, buka buku! Mar 21, 2024 pm 05:21 PM

Kertas kerja ini meneroka masalah mengesan objek dengan tepat dari sudut pandangan yang berbeza (seperti perspektif dan pandangan mata burung) dalam pemanduan autonomi, terutamanya cara mengubah ciri dari perspektif (PV) kepada ruang pandangan mata burung (BEV) dengan berkesan dilaksanakan melalui modul Transformasi Visual (VT). Kaedah sedia ada secara amnya dibahagikan kepada dua strategi: penukaran 2D kepada 3D dan 3D kepada 2D. Kaedah 2D-ke-3D meningkatkan ciri 2D yang padat dengan meramalkan kebarangkalian kedalaman, tetapi ketidakpastian yang wujud dalam ramalan kedalaman, terutamanya di kawasan yang jauh, mungkin menimbulkan ketidaktepatan. Manakala kaedah 3D ke 2D biasanya menggunakan pertanyaan 3D untuk mencuba ciri 2D dan mempelajari berat perhatian bagi kesesuaian antara ciri 3D dan 2D melalui Transformer, yang meningkatkan masa pengiraan dan penggunaan.

Model dunia penjanaan video adegan pemanduan berbilang paparan autonomi | Model dunia penjanaan video adegan pemanduan berbilang paparan autonomi | Oct 23, 2023 am 11:13 AM

Beberapa pemikiran peribadi pengarang Dalam bidang pemanduan autonomi, dengan pembangunan sub-tugas/penyelesaian hujung-ke-hujung berasaskan BEV, data latihan berbilang paparan berkualiti tinggi dan pembinaan adegan simulasi yang sepadan telah menjadi semakin penting. Sebagai tindak balas kepada titik kesakitan tugas semasa, "kualiti tinggi" boleh dipecahkan kepada tiga aspek: senario ekor panjang dalam dimensi berbeza: seperti kenderaan jarak dekat dalam data halangan dan sudut arah tepat semasa pemotongan kereta, dan data garis lorong. . Ini selalunya bergantung pada sejumlah besar pengumpulan data dan strategi perlombongan data yang kompleks, yang memerlukan kos yang tinggi. Nilai sebenar 3D - imej sangat konsisten: Pemerolehan data BEV semasa sering dipengaruhi oleh ralat dalam pemasangan/penentukuran sensor, peta berketepatan tinggi dan algoritma pembinaan semula itu sendiri. ini membawa saya kepada

GSLAM |. Seni bina dan penanda aras umum SLAM GSLAM |. Seni bina dan penanda aras umum SLAM Oct 20, 2023 am 11:37 AM

Tiba-tiba menemui kertas 19 tahun GSLAM: Rangka Kerja SLAM Umum dan kod sumber terbuka Penanda Aras: https://github.com/zdzhaoyong/GSLAM Pergi terus ke teks penuh dan rasai kualiti karya ini~1 Teknologi SLAM Abstrak telah mencapai banyak kejayaan baru-baru ini dan menarik ramai yang menarik perhatian syarikat berteknologi tinggi. Walau bagaimanapun, cara untuk antara muka dengan algoritma sedia ada atau yang baru muncul untuk melaksanakan penandaarasan dengan cekap pada kelajuan, kekukuhan dan mudah alih masih menjadi persoalan. Dalam kertas kerja ini, satu platform SLAM baharu yang dipanggil GSLAM dicadangkan, yang bukan sahaja menyediakan keupayaan penilaian tetapi juga menyediakan penyelidik dengan cara yang berguna untuk membangunkan sistem SLAM mereka sendiri dengan pantas.

'Minecraft' bertukar menjadi bandar AI, dan penduduk NPC memainkan peranan seperti orang sebenar 'Minecraft' bertukar menjadi bandar AI, dan penduduk NPC memainkan peranan seperti orang sebenar Jan 02, 2024 pm 06:25 PM

Sila ambil perhatian bahawa lelaki persegi ini berkerut dahi, memikirkan identiti "tetamu tidak diundang" di hadapannya. Ternyata dia berada dalam situasi berbahaya, dan apabila dia menyedari perkara ini, dia segera memulakan pencarian mental untuk mencari strategi untuk menyelesaikan masalah itu. Akhirnya, dia memutuskan untuk melarikan diri dari tempat kejadian dan kemudian mendapatkan bantuan secepat mungkin dan mengambil tindakan segera. Pada masa yang sama, orang di seberang sana memikirkan perkara yang sama seperti dia... Terdapat adegan sedemikian dalam "Minecraft" di mana semua watak dikawal oleh kecerdasan buatan. Setiap daripada mereka mempunyai latar identiti yang unik Contohnya, gadis yang disebutkan sebelum ini adalah seorang kurier berusia 17 tahun tetapi bijak dan berani. Mereka mempunyai daya ingatan dan pemikiran serta hidup seperti manusia di bandar kecil yang terletak di Minecraft ini. Apa yang mendorong mereka adalah sesuatu yang baru,

Semakan! Gabungan model mendalam (LLM/model asas/pembelajaran bersekutu/penalaan halus, dsb.) Semakan! Gabungan model mendalam (LLM/model asas/pembelajaran bersekutu/penalaan halus, dsb.) Apr 18, 2024 pm 09:43 PM

Pada 23 September, kertas kerja "DeepModelFusion:ASurvey" diterbitkan oleh Universiti Teknologi Pertahanan Nasional, JD.com dan Institut Teknologi Beijing. Gabungan/penggabungan model dalam ialah teknologi baru muncul yang menggabungkan parameter atau ramalan berbilang model pembelajaran mendalam ke dalam satu model. Ia menggabungkan keupayaan model yang berbeza untuk mengimbangi bias dan ralat model individu untuk prestasi yang lebih baik. Gabungan model mendalam pada model pembelajaran mendalam berskala besar (seperti LLM dan model asas) menghadapi beberapa cabaran, termasuk kos pengiraan yang tinggi, ruang parameter berdimensi tinggi, gangguan antara model heterogen yang berbeza, dsb. Artikel ini membahagikan kaedah gabungan model dalam sedia ada kepada empat kategori: (1) "Sambungan corak", yang menghubungkan penyelesaian dalam ruang berat melalui laluan pengurangan kerugian untuk mendapatkan gabungan model awal yang lebih baik.

See all articles