近日,由Emad Mostaque創立和資助的Stability.ai公司宣佈公開發布AI創造的藝術作品。
你可能認為這只是AI在藝術領域的另一次嘗試,但實際上遠不止如此。有兩個原因。 首先,與DALL-E 2不同的是,Stable Diffusion是開源的。這意味著任何人都可以利用它的骨幹,免費建立針對特定文字到圖像創作任務的應用程式。 另外,Midjourney的開發者實作了一項功能,讓使用者可以將其與Stable Diffusion結合起來,這導致了一些驚人的結果。
試想一下,接下來的幾個月會出現什麼。 第二,與DALL-E mini和Disco Diffusion不同,Stable Diffusion可以創造出驚人的逼真和藝術作品,對OpenAI或谷歌的模型沒有什麼可羨慕的。人們甚至聲稱它是「生成式搜尋引擎」中新的SOTA。 (除非另有說明,本文所有圖片都是透過Stable Diffusion創作的)。
Stable Diffusion 體現了人工智慧藝術世界的最佳特徵:它可以說是現有最好的人工智慧藝術模型,而且是開源的。這簡直是聞所未聞,將產生巨大的影響。 更有趣的是,關於這些服務的消息可能會透過最意想不到的來源到達你的手中。你的父母、你的孩子、你的伴侶、你的朋友或你的同事。 這些人往往是人工智慧領域發生的事情的局外人,他們即將發現這個領域的最新趨勢。藝術可能成為AI最終敲開那些對未來視而不見的人的大門的方式。這不是很有詩意嗎?
Stability.ai的誕生是為了創造「開放的AI工具,讓我們發揮潛能」。不只是從未進入大多數人手中的研究模型,而是具有現實世界應用的工具,開放給我和你來使用和探索。
這是與其他科技公司不同的地方,例如OpenAI,它嫉妒地守護著它最好的系統(GPT-3和DALL-E 2)的秘密,或者谷歌,它甚至從未打算將自己的(PaLM、LaMDA、Imagen或Parti)作為私人測試版發布。 Stability.ai的這次公開發布不僅分享了模型權重和程式碼——雖然這對科學和技術的健康發展很關鍵,但大多數人並不關心它們。而且也為我們這些不想或不知道如何編碼的人提供了一個無程式碼的即用型網站。
網站名叫DreamStudio Lite,可以免費使用,最多可產生200張圖片。像DALL-E 2一樣,它採用付費訂閱模式,可以用10英鎊獲得1千張圖片(OpenAI每月補充15個積分,但要獲得更多的積分,你必須以15美元購買115個包)。 DALL-E的成本為0.03美元/圖,而Stable Diffusion的成本為0.01英鎊/圖。 此外,還可以透過API大規模地使用Stable Diffusion(成本呈線性成長,所以你可以用1000英鎊獲得100K代)。除了影像生成,Stability.ai很快就會宣布DreamStudio Pro(音訊/視訊)和Enterprise(工作室)。 DreamStudio可能很快就會實現的另一個功能是,可以從其他圖像生成圖像,而不是通常的文字到圖像的設定。就像下面這樣:
#######
在網站上,還有一個關於提示工程的資源,如果你是這方面的新手,你可能會用得上。另外,與DALL-E 2不同,你可以控制參數來影響結果,並對其保留更多的代理權。 Stability.ai已經做了一切來促進人們對模型的存取。 OpenAI是第一個,必須走得更慢,以評估模型固有的潛在風險和偏見,但他們不需要將模型保持在封閉測試階段這麼久,也不需要建立這樣一個限制創造力的商業模式。 Midjourney和Stable Diffusion都已經證明了這一點。
#開源技術有其自身的限制。開放性應該走在隱私和嚴格控制之前,但不應該走在安全之前。 正如該公司在公告中解釋的那樣,它是「一個允許商業和非商業使用的許可」,重點是模型的開放和負責任的下游使用。它也強制要求衍生作品至少要受到同樣的基於使用者的限制。
開源模型本身是很好的模式,但如果我們不希望這項技術最終傷害人們,或以錯誤訊息的形式為互聯網增加更多的傲慢,建立合理的護欄也同樣重要。 「由於這些模型是在廣泛的互聯網搜刮的圖像-文本對上訓練出來的,模型可能會重現一些社會偏見,產生不安全的內容,所以開放的緩解策略以及對這些偏見的公開討論可以讓大家參與這個對話中來。」 在任何情況下,開放性安全性>隱私和控制。
憑藉著道德價值和開放性的堅實基礎,Stable Diffusion承諾在現實世界的影響力方面超越其競爭對手。
對於那些想下載它並在他們的電腦上運行它的人來說,你應該知道它需要6.9Gb的VRAM--這適合於高端消費級GPU,使它比DALL-E 2要輕,但對大多數用戶來說仍然是遙不可及的。其餘的人,像我一樣,可以馬上開始使用Dream Studio。
Stable Diffusion 普遍被認為是目前最好的AI藝術模型,它將成為無數應用程式、網路和服務的基礎,重新定義我們如何創造和與藝術互動。 但現在,專門為不同使用情況設計的應用程式將從頭開始建立,供所有人使用。人們正在增強兒童畫,用外畫 內畫製作拼貼畫,設計雜誌封面,畫漫畫,創造變形和動畫視頻,從圖像中生成圖像,等等。 其中一些應用在DALL-E和Midjourney中已經成為可能,但Stable Diffusion可以推動當前的創意革命進入下一個階段。用前特斯拉AI總監、李飛飛高徒Andrej Karpathy的話說,就是讓「藝術創作進入了人類AI合作的新時代。」
像Stable Diffusion這樣的AI藝術模型涉及一類新工具,應該用我們所處的新現實的新思維框架來理解。我們不能簡單地與其他時代進行類比或平行對比,並期望能夠準確地解釋或預測未來。 有些事情會相似,有些則不會。我們必須把這個即將到來的未來當作未知的領域。
毫無疑問,Stable Diffusion的公開發布是人工智慧藝術模型領域有史以來最重要和最有影響力的事件,而這只是一個開始。
作者之一的Emad Mostaque在Twitter上說:"隨著我們發布更快、更好和具體的模型,預計質量將繼續全面上升。不僅僅是圖像,下個月是音頻,然後轉向3D、視訊。語言、程式碼,以及更多訓練。
我們正處於一場為期數年的革命的邊緣,在我們互動、連結和理解藝術,特別是一般的創造力的方式。而且不只是在哲學、知識領域,而是作為現在每個人都分享和體驗的東西。 創意世界將永遠改變,我們必須進行開放和尊重的對話,為所有人創造一個更好的未來。只有負責任地使用開源技術,才能創造我們希望看到的改變。
以上是豈止DALL·E!現在AI畫家都會建模、做影片了,以後會什麼簡直不敢想的詳細內容。更多資訊請關注PHP中文網其他相關文章!