目錄
‍Stable Diffusion:開源模型的里程碑
用計算來加速基礎AI的開源
網友都玩兒瘋了
彩蛋
首頁 科技週邊 人工智慧 這個模型,讓前特斯拉AI總監Andrej Karpathy沉迷了整整三天!

這個模型,讓前特斯拉AI總監Andrej Karpathy沉迷了整整三天!

Apr 09, 2023 pm 04:51 PM
ai 模型

最近,一個叫Xander Steenbrugge的AI研究員兼數位藝術家,上傳了一段非常震撼的影片《跨越時間之旅》。

地球上的生物大演化,從原始海洋起始,到古代蜥蜴、恐龍、哺乳動物,再到猴子、猩猩、猿人、智人…最後出現了科幻中的未來世界。

而Steenbrugge也激動地評論道:我們正在跨越一個門檻,生成式人工智慧不再只是關於新穎的美學,而是演變成了一個驚人的工具,可以構建強大的、以人為中心的敘事。 Steenbrugge表示,這個影片用了36個連續的片語。為了找到可能的最佳順序,他嘗試了超過一千種不同的提示和種子,並在程式碼中應用了許多「提示工程」的技巧,來弄清楚到底哪些是有效的,哪些是無效的。

這個模型,讓前特斯拉AI總監Andrej Karpathy沉迷了整整三天!

前特斯拉AI高級總監Andrej Karpathy看完後大受震撼,也忍不住手癢嘗試了一波。

「超現實的蒸氣龐克神經網路機器,呈大腦形狀,放置在一個基座上,上面佈滿了齒輪製成的神經元」,在輸入這段文字後,他的大作也生成了。

2分鐘的影片(在A100上渲染約1小時),是透過在隨機雜訊輸入的模型之間平滑插值產生的。

這個名為Stable Diffusion的模型,採用的是兩個句子的意義之間「插值」的方式。插入的地方是語義的間隔,而不是視覺的空格,因此,它極大地改變了故事敘述的方式。

而這,只是由生成式人工智慧驅動的數位內容創作革命的開始。

‍Stable Diffusion:開源模型的里程碑

從2021年初以來,可以從文字描述生成圖像的人工智慧一直在快速發展。當時,OpenAI用DALL-E 1和CLIP展示了令人印象深刻的結果。

在2022年,OpenAI發布了令人印象深刻的DALL-E 2,Google展示了Imagen和Parti,Midjourney推出了公測版,Craiyon創作的AI圖像也遍布各種社群媒體。

而就現在最近,Stability AI又發布了一個全新的模型-Stable Diffusion。

這個模型,讓前特斯拉AI總監Andrej Karpathy沉迷了整整三天!

不過,與DALL-E 2不同的是,Stable Diffusion可以產生OpenAI禁止的各種知名人士。

雖然像是Midjourney、Pixelz.ai等等這些系統也可以做到,但它們生成的質量,還遠遠沒有達到能與Stable Diffusion相媲美的程度,而且還都不是開源的。

現在有邀請我們的老朋友馬斯克,表演一個秒變「黑寡婦」(史嘉蕾喬韓森)。

這個模型,讓前特斯拉AI總監Andrej Karpathy沉迷了整整三天!

顯然,身為主要開發者的Stability AI,希望不只一家公司或團隊能夠訓練Stable Diffusion的變體。

例如,你是沒有海量的GPU算力的研究人員。別擔心,Stable Diffusion即將能夠在一塊僅有5.1GB VRAM的顯示卡上運作。

再例如,你是平時使用配備蘋果M1晶片的MacBook的愛好者,Stable Diffusion也可以運作。只不過,這時影像生成的時間就要從幾秒鐘變成幾分鐘了。

如此看來,多模態模型正沿著先前大型語言模型所走的道路前進:遠離單一的供應商,並透過開放原始碼廣泛提供眾多的替代方案。

這個模型,讓前特斯拉AI總監Andrej Karpathy沉迷了整整三天!

此外,Runway已經在研究如何基於Stable Diffusion來實現文字到影片的編輯了。

一句話,讓網球場變成沙灘;

這個模型,讓前特斯拉AI總監Andrej Karpathy沉迷了整整三天!

#不管電閃雷鳴,還是風和日麗;

不管是在月球,還是火星之上;

這個模型,讓前特斯拉AI總監Andrej Karpathy沉迷了整整三天!

都無法阻止我打網球…

用計算來加速基礎AI的開源

在測試階段之後,Stable Diffusion就會免費,程式碼和經過訓練的模型將作為開源發布。還將有一個帶有Web介面的託管版本,供用戶測試系統。

Stable Diffusion 是 Stability AI、RunwayML、LMU Munich、EleutherAI 和 LAION 的研究人員合作的結果。 EleutherAI以其開源語言模型GPT-J-6B 和GPT-NeoX-20B等而聞名。

非營利組織LAION(大規模人工智慧開放網路)為訓練資料提供了開源LAION 5B資料集,該團隊在初始測試階段根據人工回饋對其進行過濾,以建立最終的LAION-Aesthetics訓練資料集。

Runway的Patrick Esser和LMU 慕尼黑的Robin Rombach領導了這個項目,他們在海德堡大學 CompVis小組的研究奠定了這個項目的基礎。在海德堡大學,他們創建了廣泛使用的VQGAN和Latent Diffusion。這兩個模型再加上OpenAI和Google Brain的成果,讓Stable Diffusion得以實現。

Stability AI成立於2020年,背後的出資人是數學家、電腦科學家Emad Mostaque。他曾在各種對沖基金擔任分析師。

憑藉Stability AI和他的私人財富,Mostaque希望能夠培育一個開源AI研究社群。他的新創公司之前就支持創建「LAION 5B」資料集。為了訓練Stable Diffusion的模型,Stability AI為伺服器提供了4,000個Nvidia A100 GPU。

「除了我們的75名員工之外,沒有任何其他人擁有決策權——無論是億萬富翁、大型基金,還是政府,我們是完全獨立的。」 Mostaque說。 「我們計劃使用我們的計算來加速基礎人工智能的開源。」

網友都玩兒瘋了

除了開頭地兩段視頻,也有網友用Stable Diffusion產生一段老化的動畫。

他表示,製作過程中在長提示中改變一個詞,比在短提示中有更微妙的效果。此外,使用描述,如老,中年,幼兒,通常比說明具體的年齡,如10歲,40歲,80歲效果更好。

這個模型,讓前特斯拉AI總監Andrej Karpathy沉迷了整整三天!

此外,還有各種夢幻的靜態圖片。

這個模型,讓前特斯拉AI總監Andrej Karpathy沉迷了整整三天!

「情人」

這個模型,讓前特斯拉AI總監Andrej Karpathy沉迷了整整三天!

「獅子」

這個模型,讓前特斯拉AI總監Andrej Karpathy沉迷了整整三天!

#Leyendecker與Maxence筆下的「黑魂」

這個模型,讓前特斯拉AI總監Andrej Karpathy沉迷了整整三天!

「賽博京劇」

彩蛋

感受一下特斯拉的前人工智慧和自動駕駛視覺總監Andrej Karpathy被虐的心路歷程。

#

這個模型,讓前特斯拉AI總監Andrej Karpathy沉迷了整整三天!

看完大神製作的影片之後,Karpathy非常興奮。

然後一波操作搞出來的成果,放進幼兒園小班都毫無違和感。 絕望的Karpathy直呼想要請一位「提示工程師」替自己創作。最後Karpathy終於悟了,創作出了他非常滿意的新作-蒸氣龐克人工神經網路機器,和藍莓義大利麵。

#

以上是這個模型,讓前特斯拉AI總監Andrej Karpathy沉迷了整整三天!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆樹的耳語 - 如何解鎖抓鉤
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1665
14
CakePHP 教程
1424
52
Laravel 教程
1321
25
PHP教程
1269
29
C# 教程
1249
24
C  中的chrono庫如何使用? C 中的chrono庫如何使用? Apr 28, 2025 pm 10:18 PM

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

如何理解C  中的DMA操作? 如何理解C 中的DMA操作? Apr 28, 2025 pm 10:09 PM

DMA在C 中是指DirectMemoryAccess,直接內存訪問技術,允許硬件設備直接與內存進行數據傳輸,不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序,實現方式因係統而異。 2)直接訪問內存可能帶來安全風險,需確保代碼的正確性和安全性。 3)DMA可提高性能,但使用不當可能導致系統性能下降。通過實踐和學習,可以掌握DMA的使用技巧,在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

怎樣在C  中處理高DPI顯示? 怎樣在C 中處理高DPI顯示? Apr 28, 2025 pm 09:57 PM

在C 中處理高DPI顯示可以通過以下步驟實現:1)理解DPI和縮放,使用操作系統API獲取DPI信息並調整圖形輸出;2)處理跨平台兼容性,使用如SDL或Qt的跨平台圖形庫;3)進行性能優化,通過緩存、硬件加速和動態調整細節級別來提升性能;4)解決常見問題,如模糊文本和界面元素過小,通過正確應用DPI縮放來解決。

C  中的實時操作系統編程是什麼? C 中的實時操作系統編程是什麼? Apr 28, 2025 pm 10:15 PM

C 在實時操作系統(RTOS)編程中表現出色,提供了高效的執行效率和精確的時間管理。 1)C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2)利用面向對象特性,C 可以設計靈活的任務調度系統。 3)C 支持高效的中斷處理,但需避免動態內存分配和異常處理以保證實時性。 4)模板編程和內聯函數有助於性能優化。 5)實際應用中,C 可用於實現高效的日誌系統。

怎樣在C  中測量線程性能? 怎樣在C 中測量線程性能? Apr 28, 2025 pm 10:21 PM

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析,步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析,步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能,並優化代碼。

量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 Apr 30, 2025 pm 07:24 PM

交易所內置量化工具包括:1. Binance(幣安):提供Binance Futures量化模塊,低手續費,支持AI輔助交易。 2. OKX(歐易):支持多賬戶管理和智能訂單路由,提供機構級風控。獨立量化策略平台有:3. 3Commas:拖拽式策略生成器,適用於多平台對沖套利。 4. Quadency:專業級算法策略庫,支持自定義風險閾值。 5. Pionex:內置16 預設策略,低交易手續費。垂直領域工具包括:6. Cryptohopper:雲端量化平台,支持150 技術指標。 7. Bitsgap:

給MySQL表添加和刪除字段的操作步驟 給MySQL表添加和刪除字段的操作步驟 Apr 29, 2025 pm 04:15 PM

在MySQL中,添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column,刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時,需指定位置以優化查詢性能和數據結構;刪除字段前需確認操作不可逆;使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。

deepseek官網是如何實現鼠標滾動事件穿透效果的? deepseek官網是如何實現鼠標滾動事件穿透效果的? Apr 30, 2025 pm 03:21 PM

如何實現鼠標滾動事件穿透效果?在我們瀏覽網頁時,經常會遇到一些特別的交互設計。比如在deepseek官網上,�...

See all articles