首頁 科技週邊 人工智慧 ControlNet大更新:僅靠提示字就能精準P圖,保持畫風不變,網友:效果堪比客製化大模型

ControlNet大更新:僅靠提示字就能精準P圖,保持畫風不變,網友:效果堪比客製化大模型

May 18, 2023 am 10:19 AM
圖片 模型

Stable Diffusion外掛程式、「AI繪畫細節控制大師」ControlNet迎接重磅更新:

只需使用文字提示詞,就能在保持圖像主體特徵的前提下,任意修改影像細節。

例如給美女從頭髮到衣服都換身造型,表情更親和一點:

ControlNet大更新:僅靠提示字就能精準P圖,保持畫風不變,網友:效果堪比客製化大模型

##抑或是讓模特兒從甜美鄰家女孩切換到高冷禦姐

,身體和頭部的

朝向

ControlNet大更新:僅靠提示字就能精準P圖,保持畫風不變,網友:效果堪比客製化大模型背景

都換個花樣兒:

#--不管細節怎麼修改,原圖的「靈魂」都還在。 ControlNet大更新:僅靠提示字就能精準P圖,保持畫風不變,網友:效果堪比客製化大模型

除了這種風格,動畫類型的它也能駕馭得恰到好處:

#來自推特的AI設計部落客@sundyme就說:

效果比想像得好!

只需要一張參考圖就能完成以上轉變,部分圖片幾乎可以達到

客製化大模型的效果了。

咳咳,各位AI繪畫圈的朋友們,打起精神來,又有好玩的了。

(ps. 第一三張效果圖來自部落客@Olivio Sarikas,第二張來自推特部落客@sundyme)

ControlNet上新:保留原圖畫風的修圖功能

以上更新內容,其實指的是一個叫做“reference-only”的預處理器。

它不需要任何控制模型,直接使用參考圖片就能引導擴散。

作者介紹,這個功能其實類似「inpaint」功能,但不會讓圖片崩壞。

(Inpaint是Stable Diffusion web UI中的一個局部重繪功能,可以將不滿意、也就是被手工遮罩的地方進行重新繪製。)

一些資深玩家可能都知道一個trick,就是用inpaint來進行影像擴散。

例如你有一張512x512的狗的圖像,然後想用同一隻狗生成另一張512x512的圖像。

這時你就可以將512x512的狗圖像和512x512的空白圖像連接到一張1024x512的圖像中,然後使用inpaint功能,mask掉空白的512x512部分,漫射出具有相似外觀的狗的形象。

在這個過程中,由於影像只是簡單粗暴的進行拼接,加上還會出現失真現象,所以效果一般都不盡如人意。

有了「reference-only」就不一樣了:

它可以將SD

(即「Stable Diffusion」)

的注意力層直接連結到任何獨立的影像,方便SD直接讀取這些影像作為參考。

也就是說,現在你想要在保持原圖風格的前提下進行修改,使用提示字直接在原圖上就能操作。 ControlNet大更新:僅靠提示字就能精準P圖,保持畫風不變,網友:效果堪比客製化大模型

如官方範例圖將一隻靜立的小狗改成奔跑動作:

#你只需要將你的ControlNet升級到

1.1.153版本

以上,然後選擇“reference-only”作為預處理器,上傳狗的圖片,輸入提示詞“a dog running on grassland, best quality……”,SD就只會用你的這張圖當參考來修改了。

網友:ControlNet迄今最好的一個功能

「reference-only」功能一出,有不少網友就上手體驗了。

有人稱這是ControlNet迄今為止最棒的一個功能:ControlNet大更新:僅靠提示字就能精準P圖,保持畫風不變,網友:效果堪比客製化大模型

傳一張帶有人物姿勢的動漫圖片,再寫一句看起來跟原圖完全無關的提示。突然之間,你想要的效果就在原圖的基礎上跑出來了。真的很強,甚至說是達到了改變遊戲規則的程度。

############還有人稱:###

是时候把以前丢弃的废图都捡回来重新修复一下了。

ControlNet大更新:僅靠提示字就能精準P圖,保持畫風不變,網友:效果堪比客製化大模型

当然,认为它也不是那么完美也有(比如开头第一张效果图里美女的耳环不对,二张图里头发也都是残缺的),但网友还是表示“总归方向是对了”。

ControlNet大更新:僅靠提示字就能精準P圖,保持畫風不變,網友:效果堪比客製化大模型

以下是三位推特博主尝试的效果,主要都是动漫风,一起欣赏一下:

ControlNet大更新:僅靠提示字就能精準P圖,保持畫風不變,網友:效果堪比客製化大模型

来自@新宮ラリのAIイラストニュ

ControlNet大更新:僅靠提示字就能精準P圖,保持畫風不變,網友:效果堪比客製化大模型

来自@br_d,左一为原图

ControlNet大更新:僅靠提示字就能精準P圖,保持畫風不變,網友:效果堪比客製化大模型

来自@br_d,上一为原图

ControlNet大更新:僅靠提示字就能精準P圖,保持畫風不變,網友:效果堪比客製化大模型

来自@uoyuki667,左一为原图

有没有戳中你的心巴?

以上是ControlNet大更新:僅靠提示字就能精準P圖,保持畫風不變,網友:效果堪比客製化大模型的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1664
14
CakePHP 教程
1423
52
Laravel 教程
1317
25
PHP教程
1268
29
C# 教程
1246
24
全球最強開源 MoE 模型來了,中文能力比肩 GPT-4,價格僅 GPT-4-Turbo 的近百分之一 全球最強開源 MoE 模型來了,中文能力比肩 GPT-4,價格僅 GPT-4-Turbo 的近百分之一 May 07, 2024 pm 04:13 PM

想像一下,一個人工智慧模型,不僅擁有超越傳統運算的能力,還能以更低的成本實現更有效率的效能。這不是科幻,DeepSeek-V2[1],全球最強開源MoE模型來了。 DeepSeek-V2是一個強大的專家混合(MoE)語言模型,具有訓練經濟、推理高效的特點。它由236B個參數組成,其中21B個參數用於啟動每個標記。與DeepSeek67B相比,DeepSeek-V2效能更強,同時節省了42.5%的訓練成本,減少了93.3%的KV緩存,最大生成吞吐量提高到5.76倍。 DeepSeek是一家探索通用人工智

AI顛覆數學研究!菲爾茲獎得主、華裔數學家領銜11篇頂刊論文|陶哲軒轉贊 AI顛覆數學研究!菲爾茲獎得主、華裔數學家領銜11篇頂刊論文|陶哲軒轉贊 Apr 09, 2024 am 11:52 AM

AI,的確正在改變數學。最近,一直十分關注這個議題的陶哲軒,轉發了最近一期的《美國數學學會通報》(BulletinoftheAmericanMathematicalSociety)。圍繞著「機器會改變數學嗎?」這個話題,許多數學家發表了自己的觀點,全程火花四射,內容硬核,精彩紛呈。作者陣容強大,包括菲爾茲獎得主AkshayVenkatesh、華裔數學家鄭樂雋、紐大電腦科學家ErnestDavis等多位業界知名學者。 AI的世界已經發生了天翻地覆的變化,要知道,其中許多文章是在一年前提交的,而在這一

Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇 Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇 Apr 01, 2024 pm 07:46 PM

谷歌力推的JAX在最近的基準測試中表現已經超過Pytorch和TensorFlow,7項指標排名第一。而且測試並不是JAX性能表現最好的TPU上完成的。雖然現在在開發者中,Pytorch依然比Tensorflow更受歡迎。但未來,也許有更多的大型模型會基於JAX平台進行訓練和運行。模型最近,Keras團隊為三個後端(TensorFlow、JAX、PyTorch)與原生PyTorch實作以及搭配TensorFlow的Keras2進行了基準測試。首先,他們為生成式和非生成式人工智慧任務選擇了一組主流

你好,電動Atlas!波士頓動力機器人復活,180度詭異動作嚇到馬斯克 你好,電動Atlas!波士頓動力機器人復活,180度詭異動作嚇到馬斯克 Apr 18, 2024 pm 07:58 PM

波士頓動力Atlas,正式進入電動機器人時代!昨天,液壓Atlas剛「含淚」退出歷史舞台,今天波士頓動力就宣布:電動Atlas上崗。看來,在商用人形機器人領域,波士頓動力是下定決心要跟特斯拉硬剛一把了。新影片放出後,短短十幾小時內,就已經有一百多萬觀看。舊人離去,新角色登場,這是歷史的必然。毫無疑問,今年是人形機器人的爆發年。網友銳評:機器人的進步,讓今年看起來像人類的開幕式動作、自由度遠超人類,但這真不是恐怖片?影片一開始,Atlas平靜地躺在地上,看起來應該是仰面朝天。接下來,讓人驚掉下巴

替代MLP的KAN,被開源專案擴展到卷積了 替代MLP的KAN,被開源專案擴展到卷積了 Jun 01, 2024 pm 10:03 PM

本月初,來自MIT等機構的研究者提出了一種非常有潛力的MLP替代方法—KAN。 KAN在準確性和可解釋性方面表現優於MLP。而且它能以非常少的參數量勝過以更大參數量運行的MLP。例如,作者表示,他們用KAN以更小的網路和更高的自動化程度重現了DeepMind的結果。具體來說,DeepMind的MLP有大約300,000個參數,而KAN只有約200個參數。 KAN與MLP一樣具有強大的數學基礎,MLP基於通用逼近定理,而KAN基於Kolmogorov-Arnold表示定理。如下圖所示,KAN在邊上具

特斯拉機器人進廠打工,馬斯克:手的自由度今年將達到22個! 特斯拉機器人進廠打工,馬斯克:手的自由度今年將達到22個! May 06, 2024 pm 04:13 PM

特斯拉機器人Optimus最新影片出爐,已經可以在工廠裡打工了。正常速度下,它分揀電池(特斯拉的4680電池)是這樣的:官方還放出了20倍速下的樣子——在小小的「工位」上,揀啊揀啊揀:這次放出的影片亮點之一在於Optimus在廠子裡完成這項工作,是完全自主的,全程沒有人為的干預。而且在Optimus的視角之下,它還可以把放歪了的電池重新撿起來放置,主打一個自動糾錯:對於Optimus的手,英偉達科學家JimFan給出了高度的評價:Optimus的手是全球五指機器人裡最靈巧的之一。它的手不僅有觸覺

牛津大學最新! Mickey:3D中的2D影像匹配SOTA! (CVPR\'24) 牛津大學最新! Mickey:3D中的2D影像匹配SOTA! (CVPR\'24) Apr 23, 2024 pm 01:20 PM

寫在前面項目連結:https://nianticlabs.github.io/mickey/給定兩張圖片,可以透過建立圖片之間的對應關係來估計它們之間的相機姿態。通常,這些對應關係是二維到二維的,而我們估計的姿態在尺度上是不確定的。一些應用,例如隨時隨地實現即時增強現實,需要尺度度量的姿態估計,因此它們依賴外部的深度估計器來恢復尺度。本文提出了MicKey,這是一個關鍵點匹配流程,能夠夠預測三維相機空間中的度量對應關係。透過學習跨影像的三維座標匹配,我們能夠在沒有深度測試的情況下推斷度量相對

FisheyeDetNet:首個以魚眼相機為基礎的目標偵測演算法 FisheyeDetNet:首個以魚眼相機為基礎的目標偵測演算法 Apr 26, 2024 am 11:37 AM

目標偵測在自動駕駛系統當中是一個比較成熟的問題,其中行人偵測是最早得以部署演算法之一。在多數論文當中已經進行了非常全面的研究。然而,利用魚眼相機進行環視的距離感知相對來說研究較少。由於徑向畸變大,標準的邊界框表示在魚眼相機當中很難實施。為了緩解上述描述,我們探索了擴展邊界框、橢圓、通用多邊形設計為極座標/角度表示,並定義一個實例分割mIOU度量來分析這些表示。所提出的具有多邊形形狀的模型fisheyeDetNet優於其他模型,並同時在用於自動駕駛的Valeo魚眼相機資料集上實現了49.5%的mAP

See all articles