蜘蛛人妖嬈起舞,下一代 ControlNet 來了!賈佳亞團隊推出,即插即用,還能控制影片生成
只用不到 10% 的訓練參數,就能達到像 ControlNet 一樣的可控生成!
而且 SDXL、SD1.5 等 Stable Diffusion 家族的常見模型都能適配,還是即插即用。
同時還能搭配 SVD 控制影片生成,動作細節控制得精準到手指。
在這些影像和影片的背後,就是港中文賈佳亞團隊推出的開源影像 / 影片產生引導工具-ControlNeXt。
從這個名字當中就能看出,研發團隊給它的定位,就是下一代的 ControlNet。
像大神何愷明與謝賽寧的經典大作 ResNeXt(ResNet 的一種擴展),起名字也是用的這個路數。
有網友認為這個名字是實至名歸,確實是下一代的產品,將 ControlNet 提高了一個檔次。
還有人直言 ControlNeXt 是規則改變者,讓可控生成的效率提升了一大截,期待看到人們用它創作的作品。
蜘蛛人跳起美女舞蹈
ControlNeXt 支援多款 SD 系模型,而且即插即用。
其中包含了影像產生模型 SD1.5、SDXL、SD3(支援 Super Resolution),還有視訊產生模型 SVD。
話不多說,直接看效果。
可以看到,在 SDXL 中加入邊緣(Canny)引導,繪製出的二次元少女和控制線條幾乎完美貼合。
即使控制輪廓又多又細碎,模型依然可以繪製出符合要求的圖片。
且無需額外訓練就可與其他 LoRA 權重無縫整合。
例如在 SD1.5 中,可以把姿勢(Pose)控制條件與各種 LoRA 搭配使用,形成風格迥異乃至跨越次元,但動作相同的角色。
另外,ControlNeXt 也支援遮罩(mask)和景深(depth)的控制模式。
在 SD3 當中也支援 Super Resolution(超級解析度),可產生超高清晰度的影像。
影片生成當中,ControlNeXt 可以實現對人物動作的控制。
例如讓蜘蛛人也跳起 TikTok 中的美女舞蹈,就連手指的動作也模仿得相當精準。
甚至讓一把椅子也長出手跳同樣的舞蹈,雖然是抽象了一些,但單看動作復刻得還算不錯。
而且相比於原始的 ControlNet,ControlNeXt 所需的訓練參數更少,收斂速度也更快。
例如在 SD1.5 和 SDXL 中,ControlNet 所需的可學習參數分別是 3.61 億和 12.51 億,但 ControlNeXt 分別只需要 3 千萬和 1.08 億,不到 ControlNet 的 10%。
Semasa proses latihan, ControlNeXt hampir kepada penumpuan pada sekitar 400 langkah, tetapi ControlNet memerlukan sepuluh kali atau bahkan berpuluh-puluh kali bilangan langkah.
Kelajuan penjanaan juga lebih pantas daripada ControlNet Secara purata, ControlNet adalah bersamaan dengan model asas, yang membawa kelewatan 41.9%, tetapi ControlNeXt hanya mempunyai 10.4%.
Jadi, bagaimanakah ControlNeXt dilaksanakan, dan apakah penambahbaikan yang telah dibuat pada ControlNet?
Modul kawalan bersyarat yang lebih ringan
Pertama, gunakan gambar untuk memahami keseluruhan aliran kerja ControlNeXt.
Kunci kepada pemberatan ringan ialah ControlNeXt mengalih keluar cawangan kawalan besar dalam ControlNet dan sebaliknya memperkenalkan modul lilitan ringan yang terdiri daripada sebilangan kecil blok ResNet.
Modul ini bertanggungjawab untuk mengekstrak representasi ciri keadaan kawalan (seperti topeng segmentasi semantik, titik awal utama, dll.).
Jumlah parameter latihan biasanya kurang daripada 10% daripada model pra-latihan dalam ControlNet, tetapi ia masih boleh mempelajari maklumat kawalan bersyarat input dengan baik Reka bentuk ini mengurangkan overhed pengiraan dan penggunaan memori.
Secara khusus, ia membuat sampel pada selang masa yang sama daripada lapisan rangkaian berbeza model pra-latihan untuk membentuk subset parameter yang digunakan untuk latihan, manakala parameter yang selebihnya dibekukan.
Selain itu, semasa mereka bentuk seni bina ControlNeXt, pasukan penyelidik juga mengekalkan ketekalan struktur model dengan seni bina asal, sekali gus mencapai plug-and-play.
Sama ada ControlNet atau ControlNeXt, suntikan maklumat kawalan bersyarat adalah pautan penting.
Semasa proses ini, pasukan penyelidik ControlNeXt menjalankan penyelidikan mendalam tentang dua isu utama - pemilihan lokasi suntikan dan reka bentuk kaedah suntikan.
Pasukan penyelidik memerhatikan bahawa dalam kebanyakan tugas penjanaan terkawal, bentuk maklumat bersyarat untuk membimbing penjanaan adalah agak mudah dan sangat berkorelasi dengan ciri dalam proses denoising.
Jadi pasukan percaya bahawa tidak perlu menyuntik maklumat kawalan ke dalam setiap lapisan rangkaian denoising, jadi mereka memilih untuk mengagregatkan ciri bersyarat dan ciri denoising hanya di lapisan tengah rangkaian.
Kaedah pengagregatan juga semudah mungkin - selepas menjajarkan pengedaran dua set ciri menggunakan penormalan silang, tambahkannya secara terus.
Ini bukan sahaja memastikan isyarat kawalan mempengaruhi proses denoising, tetapi juga mengelakkan pengenalan parameter pembelajaran tambahan dan ketidakstabilan oleh operasi yang kompleks seperti mekanisme perhatian.
Penormalan silang juga merupakan satu lagi teknologi teras ControlNeXt, menggantikan strategi permulaan progresif yang biasa digunakan sebelum ini seperti sifar-konvolusi.
Kaedah tradisional mengurangkan masalah keruntuhan dengan secara beransur-ansur melepaskan pengaruh modul baru dari awal, tetapi hasilnya selalunya adalah penumpuan yang perlahan.
Penormalan silang secara langsung menggunakan min μ dan varians σ bagi rangkaian tulang belakang yang menafikan ciri untuk menormalkan output ciri oleh modul kawalan, supaya pengedaran data kedua-duanya adalah sejajar yang mungkin.
(Nota: ialah pemalar kecil yang ditambah untuk kestabilan berangka, γ ialah parameter penskalaan.)
Ciri kawalan yang dinormalkan kemudiannya dilaraskan dalam amplitud dan garis dasar melalui skala dan parameter mengimbangi, dan kemudian digabungkan dengan Penambahan Ciri denoising bukan sahaja mengelakkan sensitiviti pemulaan parameter, tetapi juga membenarkan keadaan kawalan berkuat kuasa pada peringkat awal latihan untuk mempercepatkan proses penumpuan.
Selain itu, ControlNeXt juga menggunakan modul kawalan untuk mempelajari pemetaan maklumat keadaan kepada ciri ruang terpendam, menjadikannya lebih abstrak dan semantik, dan lebih kondusif untuk generalisasi kepada keadaan kawalan yang tidak kelihatan.
Laman utama projek:
https://pbihao.github.io/projects/controlnext/index.html
Alamat kertas:
https://arxiv.org/abs/2408.06070
Hub:
//github.com/dvlab-research/ControlNeXt以上是蜘蛛人妖嬈起舞,下一代 ControlNet 來了!賈佳亞團隊推出,即插即用,還能控制影片生成的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

你是不是厭倦了在度假時收到微軟團隊的訊息和電話?現在不再是這樣了;團隊現在允許使用者安排外出狀態。這樣做會讓你的隊友知道你不在或度假。如何在團隊中設定計劃的外出狀態在MicrosoftTeams中設定計劃外出狀態有兩種方法:從您的個人資料圖片來自團隊設定現在,讓我們來詳細看看這些。透過個人資料圖片在團隊中安排外出狀態點擊頂部的個人資料圖片,然後點擊設定狀態訊息。點擊底部的計劃外出時間,將打開外出選項卡。在這裡,打開旁邊的切換開關,打開自動回复,輸入外出訊息,並啟用僅在一段時間內發送回复。接下來,
![團隊會議未顯示在Outlook[修復]](https://img.php.cn/upload/article/000/465/014/170831343613934.jpg?x-oss-process=image/resize,m_fill,h_207,w_330)
團隊會議加載項是否未顯示在MicrosoftOutlook中?一些MSOutlook用戶報告說,團隊外接程式不工作或從功能區中消失。現在,這個問題可能有多種原因。讓我們找出這些原因。為什麼Outlook中沒有顯示團隊的存在?如果在Outlook中找不到新團隊會議選項,可能是因為該選項在Outlook設定中被停用了。除此之外,問題可能源自於使用過時的Outlook應用程式或Microsoft.Teams.AddinLoader.dll檔案損壞。已有幾位使用團隊外接程式的Outlook用戶回報了這個問

利用PHP控制攝影機:從連接到拍攝的全過程解析攝影機的應用越來越廣泛,例如視訊通話、監視系統等。而在Web應用中,我們常常需要透過PHP來控制和操作攝影機。本文將介紹如何利用PHP來實現從相機連接到拍攝的整個過程。確認攝影機的連接狀態在開始操作攝影機之前,我們首先需要確認攝影機的連接狀態。 PHP提供了擴充庫video來實現對相機的操作。我們可以透過以下程式碼

產生隨機數據在數據科學領域非常重要。從建構神經網路預測、股市數據等來看,通常都會將日期當作參數之一。我們可能需要在兩個日期之間產生隨機數以進行統計分析。本文將展示如何產生兩個給定日期之間的k個隨機日期使用隨機和日期時間模組日期時間是Python內建的處理時間的庫。另一方面,隨機模組有助於產生隨機數。因此,我們可以結合隨機和日期時間模組來產生兩個日期之間的隨機日期。語法random.randint(start,end,k)這裡的random指的是Python隨機函式庫。 randint方法採用三個重要的

你想知道如何在微軟團隊中設定重複的提醒,以保持對你的責任的掌控嗎?這就是為什麼我們創建了這個帖子來引導你完成這個過程。就像Outlook中的任務提醒一樣,團隊應用程式中的提醒可以讓你收到即將到來的活動、重要會議或最後期限的定期提示,以確保任何事情都不會漏掉。因此,無論您是專業人士努力提高工作效率,還是學生忙於多項承諾,本教程都將幫助您在微軟團隊中設定提醒,保持日常日程的緊密安排。如何在微軟團隊中設定重複提醒? MicrosoftTeams沒有類似Outlook的內建提醒功能來幫助您記住任務、會議或電
![如何停用媒體音量控制彈出視窗[永久]](https://img.php.cn/upload/article/000/000/164/168493981948502.png?x-oss-process=image/resize,m_fill,h_207,w_330)
當您使用對應的快捷鍵微調音量等級時,螢幕上會出現一個媒體音量控制彈出視窗。這可能很煩人,因此請繼續閱讀以找出永久停用媒體音量控制彈出視窗的不同方法。如何停用媒體音量控制彈出視窗? 1.在Google瀏覽器中按一下工作列上的Windows圖標,在頂部的搜尋欄中鍵入chrome,然後選擇相關搜尋結果以啟動Google瀏覽器。在網址列中鍵入或複製貼上以下內容,然後按鍵。 Enterchrome://flags在頂部的搜尋框中鍵入媒體金鑰,然後在硬體媒體金鑰處理下拉清單中選擇停用。現在退出谷歌瀏覽器應用程式並重新啟動它。 Google

如何使用PHP產生可刷新的圖片驗證碼隨著網路的發展,為了防止惡意攻擊和機器自動操作現象,許多網站都使用了驗證碼來進行使用者驗證。其中一個常見的驗證碼類型就是圖片驗證碼,透過產生一張包含隨機字元的圖片,要求使用者輸入正確的字元才能進行後續操作。本文將介紹如何使用PHP產生可刷新的圖片驗證碼,並提供具體的程式碼範例。步驟一:建立驗證碼圖片首先,我們需要建立一個用於生

數據視覺化對於高效的資訊理解和展示至關重要。在眾多可用的圖表類型中,華夫餅圖以方形瓦片在網格狀結構中顯示資料的新穎方式。強大的Python模組PyWaffle方便了華夫餅圖的開發,類似於許多計算和數據分析方法。在本文中,我們將看看如何使用複雜的Python模組PyWaffle創建華夫餅圖。讓我們安裝PyWafle並看看如何使用它來視覺化分類資料。在您的cmd中執行以下命令來安裝該庫,然後將其導入到您的程式碼中pipinstallpywaffleExample1的中文翻譯為:範例1在這個例子中,我們
