網路上有數十種免費且開源的人工智慧文字到圖像產生器,專門用於特定類型的圖像。因此,我們篩選了一堆,找到了您現在可以嘗試的最佳開源人工智慧文字到圖像生成器。
Craiyon 是最容易存取的開源 AI 映像產生器之一。它基於 DALL-E Mini,雖然您可以克隆 Github 儲存庫並將模型本地安裝在電腦上,但 Craiyon 似乎已經放棄了這種方法,轉而採用其網站。
官方 Github 儲存庫自 2022 年 6 月以來一直沒有更新,但最新模型仍然可以在 Craiyon 官方網站上免費獲得。也沒有 Android 或 iOS 應用程式。
在功能方面,您將看到 AI 影像產生器所期望的所有常用選項。輸入提示並取得影像後,您可以使用高檔功能來取得更高解析度的副本。有三種風格可供選擇:藝術、照片和繪畫。如果您希望模型來決定,您也可以選擇“無”選項。
此外,「專家模式」允許您包含否定詞,告訴模型避免特定項目。還有一個提示預測功能,它使用 ChatGPT 來幫助使用者編寫盡可能最好、最詳細的提示。最後,人工智慧驅動的刪除背景功能可以幫助您節省從影像中裁剪背景的時間和精力。
這就是 Craiyon 所做的一切。它不是最複雜的人工智慧圖像生成模型,但如果您不想要詳細或真實的東西,它作為基本模型效果很好。
此模型可以免費使用,但免費用戶在一分鐘內一次只能使用九張免費圖片。您可以訂閱他們的支持者或專業等級(價格分別為每月 5 美元和 20 美元,按年計費),以獲得無廣告或浮水印、更快的生成速度以及將生成的圖像保密的選項。自訂訂閱層還允許自訂模型、整合、專用支援和專用伺服器。
Stable Diffusion 可能是最受歡迎的開源文字到圖像生成模型之一。它還為其他模型提供動力,包括下面提到的三個圖像生成器。它於 2022 年發布,此後已有多次實現。
我不會向您介紹該模型如何運作的過多技術細節(您可以查看他們的官方Github 儲存庫),但該模型即使對於完全的初學者來說也很容易安裝並且運作良好只要您擁有至少 4GB 記憶體的專用 GPU。您也可以在線訪問 Stable Diffusion,如果您想在 Mac 上運行 Stable Diffusion,我們可以為您提供幫助。
有幾個檢查點(考慮它們的版本)可用來穩定擴散。雖然我們測試了 1.5 版,但 2.1 版也在積極開發中,並且更加精確。
運行模型也相當容易。我們使用 AUTOMATIC1111 Stable Diffusion Web 使用者介面對其進行了測試,所有控制和參數都運作良好。由於模型訓練所使用的 LAION-5B 資料庫,它也完全符合 NSFW 標準(請注意,儘管它並不完美)。雖然生成時間本身會根據您的硬體而有所不同,但即使有基本的提示,您也可以期望您的圖像是詳細且真實的。
DreamShaper 是一種基於穩定擴散的影像生成模型。它的目的是作為 MidJourney 的開源替代品,並專注於生成圖像中的真實感,儘管它可以通過一些調整來處理動漫和繪畫風格。
此模型比穩定擴散功能更強大,允許使用者對最終輸出有更大的自由度,從閃電改進到更寬鬆的 NSFW 限制。運行模型也很容易,可以在線下載預訓練版本以供本地訪問,並且可以通過許多網站(包括 Sinkin.ai、RandomSeed 和 Mage.space)(需要基本訂閱)來運行模型GPU 加速。
您現在可能已經猜到,與穩定擴散相比,DreamShaper 產生的影像往往看起來更真實。即使您在兩個模型上運行相同的提示,DreamShaper 模型也可能會更加真實、詳細且光線更好。
對於肖像畫或角色尤其如此,我發現與相同的提示相比,穩定擴散缺乏一些。如果您的圖像變得過於真實,可以使用以下四種方法來識別人工智慧生成的圖像。
您也不需要龐大的 PC 來運行該模型。我的 GTX 1650Ti 配備 4GB VRAM 完美運行該型號。生成時間有點長,但似乎不影響實際輸出。也就是說,您可能需要具有更多 VRAM 的 GPU 才能運行基於穩定擴散 XL 車型的 DreamShaper XL。
Invoke AI是另一個基於Stable Diffusion的AI影像產生模型,有基於Stable Diffusion XL的XL版本。它還擁有自己的網路和命令列使用者介面,這意味著您不必使用穩定擴散網路使用者介面之類的東西。
此模型的重點是讓使用者透過客製化的工作流程根據其智慧財產權創建視覺效果。 InvokeAI 是用於訓練自訂模型和處理智慧財產權的最佳開源 AI 影像生成模型之一。
其官方 Github 儲存庫列出了兩種安裝方法:透過 InvokeAI 的安裝程式安裝或使用 PyPI(如果您熟悉終端和 Python 並且需要對隨模型安裝的套件進行更多控制)。
然而,額外的控制確實帶來了一些限制,最明顯的是更嚴格的硬體要求。 InvokeAI 建議使用至少具有 4GB 記憶體的專用 GPU,建議使用 6 到 8GB 來運行 XL 變體。 VRAM 要求適用於 AMD 和 Nvidia GPU。您還需要至少 12GB 的 RAM 和 12GB 的可用磁碟空間用於模型、其依賴項和 Python。
雖然文件不推薦 Nvidia 的 GTX 10 系列和 16 系列 GPU,因為它們缺乏視訊內存,但提供的安裝程式確實運行得很好。雖然您的情況可能會有所不同,但如果您使用的是低階 GPU,則需要等待更長的時間才能看到提示轉換為影像。最後,如果您使用的是 Windows,則只能使用 Nvidia GPU,因為目前不支援 AMD GPU。
對於圖像生成部分,模型更傾向於藝術風格而不是照片寫實主義。當然,您可以在資料集上訓練模型,並讓它產生更接近您想要的圖像,即使這涉及逼真的圖像,特別是如果您在產品設計、建築或零售空間工作。然而,需要記住的一件重要事情是,InvokeAI 主要是一個圖像生成引擎,這意味著您可能必須使用自己的模型才能獲得最佳結果(可以透過Web 介面中提供的模型管理器輕鬆找到)作為預設值模型與穩定擴散本身非常相似。
Openjourney 是一個免費的開源 AI 圖片生成模型,同樣基於穩定擴散。如果您想知道為什麼該模型被稱為 Openjourney,那是因為它是在 Midjourney 圖像上進行訓練的,並且可以在生成的圖像中模仿其風格。
Openjourney 背後的公司 PromptHero 可讓您與其他模型一起測試模型,包括穩定擴散(版本 1.5 和 2)、DreamShaper 和 Realistic Vision。註冊時,您將獲得25 個免費積分(每生成一張圖像就獲得一個積分),之後您必須訂閱他們的Pro 訂閱套餐,每月費用為9 美元,每月可以使用300 個積分以及其他獨家功能。
但是,如果您想在本地免費運行它,您可以從 HuggingFace 下載模型檔案並使用 Stable Diffusion Web UI 運行它。 Openjourney 也是 HuggingFace 上下載量第二高的 AI 影像生成模型,僅次於 Stable Diffusion。
Openjourney 並未在其網站上列出本地運行模型的任何特定硬體要求,但您可以預期與 Stable Diffusion 類似的硬體要求。這意味著您的電腦上需要具有 4GB VRAM、16GB RAM 和大約 12 到 15GB 可用空間的專用 GPU 來保存模型及其相依性。
除非另有說明,否則 Openjourney 產生的圖像往往會在寫實主義和藝術之間取得平衡。如果您正在尋找全能型號,並且喜歡 Midjourney 的外觀和感覺,而無需付費訂閱,那麼 Openjourney 是最好的選擇之一。
以上是5 個最佳開源 AI 影像產生器的詳細內容。更多資訊請關注PHP中文網其他相關文章!