目錄
1、前言
2、GAN(生成對抗網路)的瓶頸
3、Diffusion Model(擴散模型)的突破
4、Stable Diffusion
5、AI繪畫玩法及能力介紹
6、目前主要應用程式介紹
首頁 科技週邊 人工智慧 今年很火紅的AI繪畫怎麼玩

今年很火紅的AI繪畫怎麼玩

Apr 17, 2023 am 11:25 AM
ai 繪畫

1、前言

2022年絕對可以說是AIGC元年,從google搜尋的趨勢來看,在2022年AI繪畫及AI生成藝術的搜尋量激增。

今年很火紅的AI繪畫怎麼玩

AI繪畫在這一年的爆發一個很重要的原因就是Stable Diffusion 的開源,這也離不開這幾年Diffusion Model擴散模型在這幾年裡的快速發展,結合了OPENAI 已經發展得成熟的文字語言模型GPT-3,從文字到圖片的生成過程變得更加容易。

2、GAN(生成對抗網路)的瓶頸

從14年誕生,到18年的StyleGAN,GAN在圖片生成領域獲得了長足的發展。就好像自然界的掠食者與被掠食者相互競爭共同演化一樣,GAN的原理簡單來說就是使用兩個神經網路:一個作為生成器、一個作為判別器,生成器產生不同的影像讓判別器去判斷結果是否合格,二者互相對抗以此訓練模式。

今年很火紅的AI繪畫怎麼玩

GAN(生成對抗網路)經過不斷發展其有了不錯的效果,但有些始終難以克服的問題:生成結果多樣性缺乏、模式坍縮(生成器在找到最佳模式後就不再進步了)、訓練難度高。這些困難導致 AI 生成藝術一直難以做出實用的產品。

3、Diffusion Model(擴散模型)的突破

在GAN 多年的瓶頸期後,科學家想出了非常神奇的Diffusion Model(擴散模型)的辦法去訓練模型:把原圖用馬爾科夫鏈將雜訊不斷地添加到其中,最終成為一個隨機噪聲圖像,然後讓訓練神經網路把此過程逆轉過來,從隨機噪聲圖像逐漸還原成原圖,這樣神經網路就有了可以說是從無到有生成圖片的能力。而文字產生圖片就是把描述文字處理後當做雜訊不斷加入原圖中,這樣就可以讓神經網路從文字產生圖片。

今年很火紅的AI繪畫怎麼玩

Diffusion Model(擴散模型)讓訓練模型變得更加簡單,只需大量的圖片就行了,其生成影像的品質也能達到很高的水平,並且生成結果能有很大的多樣性,這也是新一代AI 能有難以讓人相信的「想像力」的原因。

當然技術也是一直在突破的,英偉達在1月底推出的StyleGAN的升級版StyleGAN-T就有了十分驚豔的進步,在同等算力下相比於Stable Diffusion生成一張圖片需要3秒,StyleGAN-T僅需0.1秒。而且在低解析度影像StyleGAN-T要比Diffusion Model好,但在高解析度影像的生成上,還是Diffusion Model的天下。由於StyleGAN-T並沒有像Stable Diffusion那樣獲得廣泛的應用,本文還是以介紹Stable DIffusion為主。

4、Stable Diffusion

在今年早年,AI作畫圈經歷了Disco Diffusion、DALL-E2、Midjouney 群雄混戰的時代,直到Stable Diffusion 開源後,才進入一段時間的塵埃落定,作為最強的AI 作畫模型,Stable Diffusion 引起了AI 社區的狂歡,基本上每天都有新的模型、新的開源庫誕生。尤其是在Auto1111的WebUI版本推出後,無論是部署在雲端還是本地,使用Stable Diffusion都變成一個非常簡單的事情,並且隨著社區的不斷開發,很多優秀的項目,比如Dreambooth、deforum都作為Stable Diffusion WEBUI版的一個插件加入進來,讓像是微調模型、生成動畫等功能都能一站式完成。

今年很火紅的AI繪畫怎麼玩

5、AI繪畫玩法及能力介紹

以下介紹目前使用Stable Diffusion 可以有哪些玩法以及能力

#text2img目前效果最好的二次元動漫畫風的模型, 由 NAI 基於danbooru 站的公開圖片作為數據集訓練,但由於danbooru 本身存在版權問題,NovelAI一直比較受爭議,並且此模型是商用服務洩漏流出,使用需謹慎。 ##img2img

#Stable Diffusion 能力簡介(以下圖片使用SD1.5模型輸出)


簡介

輸入

#text2img

透過文字描述產生圖片,可透過文字描述指定藝術家風格、藝術類型。這裡以藝術家 Greg Rutkowski 的風格舉例。


a beautiful girl with a flowered shirt posing for a picture with her chin resting on her right hand, by Greg Rutkowski



今年很火紅的AI繪畫怎麼玩







#img2img


透過圖片以及文字描述產生圖片


a beautiful girl with a flowered shirt posing for a picture with her chin resting on her right hand, by Greg Rutkowski今年很火紅的AI繪畫怎麼玩









今年很火紅的AI繪畫怎麼玩









######inpainting############在img2img的基礎上,透過設定遮罩,只繪製遮罩內的區域,一般用於修改關鍵字微調畫面。 ############a beautiful girl with a flowered shirt gently smiling posing for a picture with her chin resting on her right hand, by Greg Rutkowski####################### ####### ###########################

今年很火紅的AI繪畫怎麼玩









今年很火紅的AI繪畫怎麼玩





#使用DreamBooth 基於SD 模型訓練微調的大模型,訓練後使用此模型可使用上述的text2img img2img 等能力

NovelAI


a beautiful girl with a flowered shirt posing for a picture with her chin resting on her right hand




今年很火紅的AI繪畫怎麼玩





#NovelAI

使用NovelAI 的模型進行img2img。目前在各個社區很火的意間AI作畫,也是使用的這個能力。但意間在免責聲明中提到他們的動漫模型是自己收集的資料集訓練的。

*右邊範例的文字描述是根據圖片內容根據AI反推得出的,畫師風格隨機


a beautiful girl with a flowered shirt posing for a picture with her chin resting on her right hand


今年很火紅的AI繪畫怎麼玩






#AI繪畫




今年很火紅的AI繪畫怎麼玩





#################################### ###基於使用者照片訓練的主體模型###

基於使用者提供的幾張照片訓練一個針對主體的模型,用這個模型可以根據描述產生任意包含該主體的圖片。

此組圖使用同事的20張照片基於Stable Diffusion 1.5模型訓練2000步驟模型,配合幾個風格化的prompt輸出。

prompt範例(圖1):

portrait of alicepoizon, highly detailed vfx portrait, unreal engine, greg rutkowski, loish, rhads, caspar david friedrich, makotootoin, and lois van 素kuvshinov, rossdraws, elegent, tom bagshaw, alphonse mucha, global illumination, detailed and intricate environment

*alicepoizon是訓練此模型時為這個人物的命名





今年很火紅的AI繪畫怎麼玩









今年很火紅的AI繪畫怎麼玩









今年很火紅的AI繪畫怎麼玩






基於同類型風格訓練的風格模型


使用相同風格的一組圖片訓練一個微調後的大模型,可以透過這個大模型產生生成風格統一的圖片。


此組圖使用了得物數字收藏ME.X訓練微調出的風格模型產生。

a beautiful girl with a flowered shirt

今年很火紅的AI繪畫怎麼玩









今年很火紅的AI繪畫怎麼玩

#Lionel Messi









今年很火紅的AI繪畫怎麼玩


Leonardo DiCaprio


############# ############################################################斯嘉麗約翰遜############ ##







今年很火紅的AI繪畫怎麼玩




#

6、目前主要應用程式介紹

範例


簡介

#美圖、抖音、6pen、意間等公司提供的AI繪畫服務

提供更便利的AI繪畫體驗,可以使用眾多風格各異的客製化大模型。





今年很火紅的AI繪畫怎麼玩







midjouney 與DallE 2


#兩個商業化的AI 作畫服務。 midjouney有自己特色的模型,產品化程度高;DallE 2則是提供了付費的API服務,有著較高品質的生成效果。



今年很火紅的AI繪畫怎麼玩








Lensa、漫遊鏡等提供個人模型訓練服務


提供了前面的Dreambooth Stable Diffusion的服務,大概18-25元一次,上傳15-20張用戶照片,產生客製化的20張左右的藝術照片。


今年很火紅的AI繪畫怎麼玩






##################################### #######################AI 開源社群Huggingface###

#https://www.php.cn/link/81d7118d88d5570189ace943bd14f142

#目前主流的AI 開源社區,類似github,有大量使用者本身finetuned (微調)的基於Stable Diffusion 模型,可以下載並部署到自己的伺服器或本地電腦。

例如右側的pix2pix模型是一個結合了GPT3的Stable Diffusion模型,可以透過自然語言描述來完成前文提到的inpainting功能。





今年很火紅的AI繪畫怎麼玩





    7、自己搭一個Stable Diffusion WEBUI服務
  • 7.1 雲端版本
  • 這裡使用AutoDL提供的雲端算力來搭建,也可以使用其他平台例如Google Colab或百度飛槳等。

今年很火紅的AI繪畫怎麼玩先在AutoDL上註冊帳號並且租一台 A5000/RTX3090 顯示卡的雲端主機。 https://www.autodl.com/market/list

    以此主機建立鏡像,鏡像可在 www.codewithgpu.com 上選擇已打包好的演算法鏡像。這裡以 https://www.codewithgpu.com/i/AUTOMATIC1111/stable-diffusion-webui/Stable-Diffusion-for-NovelAI 這個鏡像為例,選擇後再建立。

今年很火紅的AI繪畫怎麼玩

建立後開機並啟動JupterLab,

    執行下面指令啟動服務即可。如果遇到系統磁碟空間不足的情況,也可以將stable-diffusion-webui/資料夾移入資料碟 autodl-tmp再啟動。如果遇到啟動失敗,可以根據你機器的位置配置學術資源加速。
  • cd stable-diffusion-webui/
    rm -rf outputs && ln -s /root/autodl-tmp outputs
    python launch.py --disable-safe-unpickle --port=6006 --deepdanbooru
    登入後複製
    6.2 本地版本
    登入後複製
  • 如果你有一個顯示卡還不錯的電腦,那可以部署在本地,這裡介紹下Windows版本的建造:
  • 首先需要安裝Python 3.10.6,並且將環境變數新增至Path
  • 安裝git
Clone Stable Diffusion WEBUI 的工程程式碼到本機

將模型檔案置於models/Stable-Diffusion目錄下,相關模型可去https://www.php.cn/link/81d7118d88d5570189ace943bd14f142 下載

執行webui-user.bat,透過本機電腦ip及7860連接埠存取服務。

    8、總結
  • 本文介紹了AI繪畫的一些相關的信息,有興趣的朋友也可以自己把服務部署起來,自己試著學習用DreamBooth或者最新的Lora微調一下大模型。相信在2023年,隨著 AIGC 熱度的不斷提高,我們的工作和生活都會因為 AI 帶來巨大的改變。前段時間 ChatGPT的推出為我們帶來了巨大的震撼,就好像剛進入網路時期搜尋資訊的能力一樣,今後學會使用 AI 來輔助我們的工作也將是一個非常重要的能力。

9、參考資料

  • 從起因到爭議,在AI 生成藝術元年聊聊AI 

   https://sspai.com/ post/76277

  • 神經網路學習筆記6-生成式AI繪畫背後的GAN與Diffusion初解

https://blog.csdn.net/ qq_45848817/article/details/127808815

  • How diffusion models work: the math from scratch    

  …https://thetheais .com/#

##GAN 結構概觀              
  •     https://developers.google.com/machine-learning/gan/gan_structure

##The absolute bener a magical introduction to AI art

  •    https://www.entrogames.com/2022/08/absolute-beginners-guide-to-midjourney-       magical-introduction-to-ai-art/# 
## The viral AI avatar app Lensa undressed me—without my consent

       https://www.technologyreview.com/2022/12/12/1064751/the-viral -ai-avatar-app-         lensa-undressed-me-without-my-consent/
instruct-pix2pix 

    https://www.php.cn/ link/81d7118d88d5570189ace943bd14f142timbrooks/instruct-pix2pix

######

以上是今年很火紅的AI繪畫怎麼玩的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
威爾R.E.P.O.有交叉遊戲嗎?
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

centos關機命令行 centos關機命令行 Apr 14, 2025 pm 09:12 PM

CentOS 關機命令為 shutdown,語法為 shutdown [選項] 時間 [信息]。選項包括:-h 立即停止系統;-P 關機後關電源;-r 重新啟動;-t 等待時間。時間可指定為立即 (now)、分鐘數 ( minutes) 或特定時間 (hh:mm)。可添加信息在系統消息中顯示。

如何檢查CentOS HDFS配置 如何檢查CentOS HDFS配置 Apr 14, 2025 pm 07:21 PM

檢查CentOS系統中HDFS配置的完整指南本文將指導您如何有效地檢查CentOS系統上HDFS的配置和運行狀態。以下步驟將幫助您全面了解HDFS的設置和運行情況。驗證Hadoop環境變量:首先,確認Hadoop環境變量已正確設置。在終端執行以下命令,驗證Hadoop是否已正確安裝並配置:hadoopversion檢查HDFS配置文件:HDFS的核心配置文件位於/etc/hadoop/conf/目錄下,其中core-site.xml和hdfs-site.xml至關重要。使用

CentOS上GitLab的備份方法有哪些 CentOS上GitLab的備份方法有哪些 Apr 14, 2025 pm 05:33 PM

CentOS系統下GitLab的備份與恢復策略為了保障數據安全和可恢復性,CentOS上的GitLab提供了多種備份方法。本文將詳細介紹幾種常見的備份方法、配置參數以及恢復流程,幫助您建立完善的GitLab備份與恢復策略。一、手動備份利用gitlab-rakegitlab:backup:create命令即可執行手動備份。此命令會備份GitLab倉庫、數據庫、用戶、用戶組、密鑰和權限等關鍵信息。默認備份文件存儲於/var/opt/gitlab/backups目錄,您可通過修改/etc/gitlab

CentOS上PyTorch的GPU支持情況如何 CentOS上PyTorch的GPU支持情況如何 Apr 14, 2025 pm 06:48 PM

在CentOS系統上啟用PyTorchGPU加速,需要安裝CUDA、cuDNN以及PyTorch的GPU版本。以下步驟將引導您完成這一過程:CUDA和cuDNN安裝確定CUDA版本兼容性:使用nvidia-smi命令查看您的NVIDIA顯卡支持的CUDA版本。例如,您的MX450顯卡可能支持CUDA11.1或更高版本。下載並安裝CUDAToolkit:訪問NVIDIACUDAToolkit官網,根據您顯卡支持的最高CUDA版本下載並安裝相應的版本。安裝cuDNN庫:前

docker原理詳解 docker原理詳解 Apr 14, 2025 pm 11:57 PM

Docker利用Linux內核特性,提供高效、隔離的應用運行環境。其工作原理如下:1. 鏡像作為只讀模板,包含運行應用所需的一切;2. 聯合文件系統(UnionFS)層疊多個文件系統,只存儲差異部分,節省空間並加快速度;3. 守護進程管理鏡像和容器,客戶端用於交互;4. Namespaces和cgroups實現容器隔離和資源限制;5. 多種網絡模式支持容器互聯。理解這些核心概念,才能更好地利用Docker。

centos安裝mysql centos安裝mysql Apr 14, 2025 pm 08:09 PM

在 CentOS 上安裝 MySQL 涉及以下步驟:添加合適的 MySQL yum 源。執行 yum install mysql-server 命令以安裝 MySQL 服務器。使用 mysql_secure_installation 命令進行安全設置,例如設置 root 用戶密碼。根據需要自定義 MySQL 配置文件。調整 MySQL 參數和優化數據庫以提升性能。

CentOS下GitLab的日誌如何查看 CentOS下GitLab的日誌如何查看 Apr 14, 2025 pm 06:18 PM

CentOS系統下查看GitLab日誌的完整指南本文將指導您如何查看CentOS系統中GitLab的各種日誌,包括主要日誌、異常日誌以及其他相關日誌。請注意,日誌文件路徑可能因GitLab版本和安裝方式而異,若以下路徑不存在,請檢查GitLab安裝目錄及配置文件。一、查看GitLab主要日誌使用以下命令查看GitLabRails應用程序的主要日誌文件:命令:sudocat/var/log/gitlab/gitlab-rails/production.log此命令會顯示produc

CentOS上PyTorch的分佈式訓練如何操作 CentOS上PyTorch的分佈式訓練如何操作 Apr 14, 2025 pm 06:36 PM

在CentOS系統上進行PyTorch分佈式訓練,需要按照以下步驟操作:PyTorch安裝:前提是CentOS系統已安裝Python和pip。根據您的CUDA版本,從PyTorch官網獲取合適的安裝命令。對於僅需CPU的訓練,可以使用以下命令:pipinstalltorchtorchvisiontorchaudio如需GPU支持,請確保已安裝對應版本的CUDA和cuDNN,並使用相應的PyTorch版本進行安裝。分佈式環境配置:分佈式訓練通常需要多台機器或單機多GPU。所

See all articles