曾爆火的 InstantID又有了新玩法:風格化圖像生成,已開源
InstantID 原班團隊推出了風格遷移的新方法 InstantStyle。
風格化影像產生通常被稱為風格遷移,其目標是產生與參考影像風格一致且與原始影像內容一致的影像。這種技術是基於diffusion的方法(如LoRA)進行大量的同風格資料訓練,無法遷移到新的風格。或基於inversion的操作(如StyleAlign),透過將風格影像還原為latent noise,將其前向傳播得到的K、V用於替換生成中的風格影像。這種方法往往由於inversion的操作,生成風格退化。
最近,InstantID 原班團隊推出了風格遷移的新方法 InstantStyle。與人臉 ID 不同,它是一個通用的圖像風格注入框架,採用兩種簡單但非常有效的技術,可以實現風格和內容與參考圖像的有效分離。這種方法提供了一種簡單但非常有效的技術,可以實現風格和內容與參考圖像的有效分離,從而實現風格和內容的有效融合。
論文:InstantStyle: Free Lunch towards Style-Preserving in Text-to-Image Generation
#論文網址:https://huggingface.co/papers/2404.02733
計畫首頁:https://instantstyle.github.io/
#程式碼連結:https://github.com/InstantStyle/InstantStyle
#Demo 網址:https://huggingface.co/spaces/InstantX/InstantStyle
作為一種自動化介紹動機,(1)首先風格是欠定的,沒有清晰的標準來定義,它囊括眾多元素,例如色彩、氣圍、材質、佈局等等,即使是人工評價,也很難有統一的結論;(2)先前基於inversion 的方法會產生明顯的風格退化,這對部分風格是無法接受的,例如紋理;(3)圖像風格的注入,最關鍵的問題是如何平衡風格注入的強度以及參考圖像的內容洩露。
對此,作者團隊進行了一系列實驗分析,他們發現,IP-Adapter 的問題被其它許多方法都明顯誇大了,作者僅透過手動調整圖像特徵注入的權重,就解決了大部分論文中宣稱的內容外洩問題。儘管如此,在某些情況下,IP-Adapter 仍然較難找到一個合適的閾值來平衡。由於目前Adapter-based 的方法普遍使用CLIP 提取圖像特徵,作者透過圖像檢索的例子確認,在CLIP 特徵空間中,圖像和文字的特徵是可以相加減的,答案顯而易見,為什麼不在註入網路之前,顯式地減去可能會洩漏的內容訊息,從而對影像特徵進行內容和風格解耦呢?
最後,受到 B-LoRA 方法的啟發,作者細緻分析了 IP-Adapter 在每一層注入的效果,驚奇地發現存在兩個獨立的層分別響應風格和空間佈局的信息。為此,作者引出了提出的方法。
方法介紹
基於上述的觀察與實驗,作者提出了InstantStyle 方法,如圖所示,該方法核心包含兩個模組:
(1)特徵相減:利用CLIP 空閒的特性,明確地進行特徵相減,去除影像特徵中內容的信息,減少參考圖片內容對生成圖片的影響。其中相較於風格的欠定,內容資訊往往容易透過文字簡單描述,所以可以利用 CLIP 的文字編碼器來提取內容特徵,用於解耦。
(2)僅風格層注入:僅在特定風格層完成特徵注入,隱式地實現風格和內容的解耦。作者在 UNet 的 mid block 附近,發現了分別控制風格和空間佈局的兩個特定層,並發現在某些風格中,空間佈局可能也屬於風格的一種。
整體而言,InstantStyle 的想法相當簡單易懂,僅透過幾行程式碼,就緩解了風格遷移中最困擾的內容洩漏問題。
實驗結果
作者在文中展示了兩種策略的生成結果,這兩種策略不限於特定模型,可以分開獨立使用,都實現了優異的效果。
特徵相減的結果:
僅風格層注入:
#與目前領先方法的比較:
基於原圖的風格化:
#社群玩法
InstantStyle已經提供了豐富的程式碼實現,開發者可以直接透過GitHub 找到,包括文生圖、圖生圖以及Inpainting。最近也被影片生成專案 AnyV2V 作為推薦的風格化工具。對於社群用戶,InstantStyle 也原生就支援了 ComfyUI(該結點作者也是 InstantStyle 的共同作者),用戶可以透過更新 IP-Adapter 結點即可快速嘗試。
作為 InstantID 作者,又怎麼少得了和 InstantID 的聯名呢,相比於 InstantID 中僅透過文字來控制生成風格,InstantStyle 無疑可以讓風格更加多樣化。作者團隊會在 GitHub 星標到達 1000 後,官方支援人臉的風格化功能。
作者也官方支援了 Huggingface Demo,可以在線上試玩。
以上是曾爆火的 InstantID又有了新玩法:風格化圖像生成,已開源的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

要通過 Git 下載項目到本地,請按以下步驟操作:安裝 Git。導航到項目目錄。使用以下命令克隆遠程存儲庫:git clone https://github.com/username/repository-name.git

更新 git 代碼的步驟:檢出代碼:git clone https://github.com/username/repo.git獲取最新更改:git fetch合併更改:git merge origin/master推送更改(可選):git push origin master

Git Commit 是一種命令,將文件變更記錄到 Git 存儲庫中,以保存項目當前狀態的快照。使用方法如下:添加變更到暫存區域編寫簡潔且信息豐富的提交消息保存並退出提交消息以完成提交可選:為提交添加簽名使用 git log 查看提交內容

Git 代碼合併過程:拉取最新更改以避免衝突。切換到要合併的分支。發起合併,指定要合併的分支。解決合併衝突(如有)。暫存和提交合併,提供提交消息。

在開發一個電商網站時,我遇到了一個棘手的問題:如何在大量商品數據中實現高效的搜索功能?傳統的數據庫搜索效率低下,用戶體驗不佳。經過一番研究,我發現了Typesense這個搜索引擎,並通過其官方PHP客戶端typesense/typesense-php解決了這個問題,大大提升了搜索性能。

解決 Git 下載速度慢時可採取以下步驟:檢查網絡連接,嘗試切換連接方式。優化 Git 配置:增加 POST 緩衝區大小(git config --global http.postBuffer 524288000)、降低低速限制(git config --global http.lowSpeedLimit 1000)。使用 Git 代理(如 git-proxy 或 git-lfs-proxy)。嘗試使用不同的 Git 客戶端(如 Sourcetree 或 Github Desktop)。檢查防火

要刪除 Git 倉庫,請執行以下步驟:確認要刪除的倉庫。本地刪除倉庫:使用 rm -rf 命令刪除其文件夾。遠程刪除倉庫:導航到倉庫設置,找到“刪除倉庫”選項,確認操作。

如何更新本地 Git 代碼?用 git fetch 從遠程倉庫拉取最新更改。用 git merge origin/<遠程分支名稱> 將遠程變更合併到本地分支。解決因合併產生的衝突。用 git commit -m "Merge branch <遠程分支名稱>" 提交合併更改,應用更新。
