這個模型,讓前特斯拉AI總監Andrej Karpathy沉迷了整整三天!
最近,一個叫Xander Steenbrugge的AI研究員兼數位藝術家,上傳了一段非常震撼的影片《跨越時間之旅》。
地球上的生物大演化,從原始海洋起始,到古代蜥蜴、恐龍、哺乳動物,再到猴子、猩猩、猿人、智人…最後出現了科幻中的未來世界。
而Steenbrugge也激動地評論道:我們正在跨越一個門檻,生成式人工智慧不再只是關於新穎的美學,而是演變成了一個驚人的工具,可以構建強大的、以人為中心的敘事。 Steenbrugge表示,這個影片用了36個連續的片語。為了找到可能的最佳順序,他嘗試了超過一千種不同的提示和種子,並在程式碼中應用了許多「提示工程」的技巧,來弄清楚到底哪些是有效的,哪些是無效的。
前特斯拉AI高級總監Andrej Karpathy看完後大受震撼,也忍不住手癢嘗試了一波。
「超現實的蒸氣龐克神經網路機器,呈大腦形狀,放置在一個基座上,上面佈滿了齒輪製成的神經元」,在輸入這段文字後,他的大作也生成了。
2分鐘的影片(在A100上渲染約1小時),是透過在隨機雜訊輸入的模型之間平滑插值產生的。
這個名為Stable Diffusion的模型,採用的是兩個句子的意義之間「插值」的方式。插入的地方是語義的間隔,而不是視覺的空格,因此,它極大地改變了故事敘述的方式。
而這,只是由生成式人工智慧驅動的數位內容創作革命的開始。
Stable Diffusion:開源模型的里程碑
從2021年初以來,可以從文字描述生成圖像的人工智慧一直在快速發展。當時,OpenAI用DALL-E 1和CLIP展示了令人印象深刻的結果。
在2022年,OpenAI發布了令人印象深刻的DALL-E 2,Google展示了Imagen和Parti,Midjourney推出了公測版,Craiyon創作的AI圖像也遍布各種社群媒體。
而就現在最近,Stability AI又發布了一個全新的模型-Stable Diffusion。
不過,與DALL-E 2不同的是,Stable Diffusion可以產生OpenAI禁止的各種知名人士。
雖然像是Midjourney、Pixelz.ai等等這些系統也可以做到,但它們生成的質量,還遠遠沒有達到能與Stable Diffusion相媲美的程度,而且還都不是開源的。
現在有邀請我們的老朋友馬斯克,表演一個秒變「黑寡婦」(史嘉蕾喬韓森)。
顯然,身為主要開發者的Stability AI,希望不只一家公司或團隊能夠訓練Stable Diffusion的變體。
例如,你是沒有海量的GPU算力的研究人員。別擔心,Stable Diffusion即將能夠在一塊僅有5.1GB VRAM的顯示卡上運作。
再例如,你是平時使用配備蘋果M1晶片的MacBook的愛好者,Stable Diffusion也可以運作。只不過,這時影像生成的時間就要從幾秒鐘變成幾分鐘了。
如此看來,多模態模型正沿著先前大型語言模型所走的道路前進:遠離單一的供應商,並透過開放原始碼廣泛提供眾多的替代方案。
此外,Runway已經在研究如何基於Stable Diffusion來實現文字到影片的編輯了。
一句話,讓網球場變成沙灘;
#不管電閃雷鳴,還是風和日麗;
不管是在月球,還是火星之上;
都無法阻止我打網球…
用計算來加速基礎AI的開源
在測試階段之後,Stable Diffusion就會免費,程式碼和經過訓練的模型將作為開源發布。還將有一個帶有Web介面的託管版本,供用戶測試系統。
Stable Diffusion 是 Stability AI、RunwayML、LMU Munich、EleutherAI 和 LAION 的研究人員合作的結果。 EleutherAI以其開源語言模型GPT-J-6B 和GPT-NeoX-20B等而聞名。
非營利組織LAION(大規模人工智慧開放網路)為訓練資料提供了開源LAION 5B資料集,該團隊在初始測試階段根據人工回饋對其進行過濾,以建立最終的LAION-Aesthetics訓練資料集。
Runway的Patrick Esser和LMU 慕尼黑的Robin Rombach領導了這個項目,他們在海德堡大學 CompVis小組的研究奠定了這個項目的基礎。在海德堡大學,他們創建了廣泛使用的VQGAN和Latent Diffusion。這兩個模型再加上OpenAI和Google Brain的成果,讓Stable Diffusion得以實現。
Stability AI成立於2020年,背後的出資人是數學家、電腦科學家Emad Mostaque。他曾在各種對沖基金擔任分析師。
憑藉Stability AI和他的私人財富,Mostaque希望能夠培育一個開源AI研究社群。他的新創公司之前就支持創建「LAION 5B」資料集。為了訓練Stable Diffusion的模型,Stability AI為伺服器提供了4,000個Nvidia A100 GPU。
「除了我們的75名員工之外,沒有任何其他人擁有決策權——無論是億萬富翁、大型基金,還是政府,我們是完全獨立的。」 Mostaque說。 「我們計劃使用我們的計算來加速基礎人工智能的開源。」
網友都玩兒瘋了
除了開頭地兩段視頻,也有網友用Stable Diffusion產生一段老化的動畫。
他表示,製作過程中在長提示中改變一個詞,比在短提示中有更微妙的效果。此外,使用描述,如老,中年,幼兒,通常比說明具體的年齡,如10歲,40歲,80歲效果更好。
此外,還有各種夢幻的靜態圖片。
「情人」
「獅子」
#Leyendecker與Maxence筆下的「黑魂」
「賽博京劇」
彩蛋
感受一下特斯拉的前人工智慧和自動駕駛視覺總監Andrej Karpathy被虐的心路歷程。
#看完大神製作的影片之後,Karpathy非常興奮。
然後一波操作搞出來的成果,放進幼兒園小班都毫無違和感。 絕望的Karpathy直呼想要請一位「提示工程師」替自己創作。最後Karpathy終於悟了,創作出了他非常滿意的新作-蒸氣龐克人工神經網路機器,和藍莓義大利麵。
#以上是這個模型,讓前特斯拉AI總監Andrej Karpathy沉迷了整整三天!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

DMA在C 中是指DirectMemoryAccess,直接內存訪問技術,允許硬件設備直接與內存進行數據傳輸,不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序,實現方式因係統而異。 2)直接訪問內存可能帶來安全風險,需確保代碼的正確性和安全性。 3)DMA可提高性能,但使用不當可能導致系統性能下降。通過實踐和學習,可以掌握DMA的使用技巧,在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

在C 中處理高DPI顯示可以通過以下步驟實現:1)理解DPI和縮放,使用操作系統API獲取DPI信息並調整圖形輸出;2)處理跨平台兼容性,使用如SDL或Qt的跨平台圖形庫;3)進行性能優化,通過緩存、硬件加速和動態調整細節級別來提升性能;4)解決常見問題,如模糊文本和界面元素過小,通過正確應用DPI縮放來解決。

C 在實時操作系統(RTOS)編程中表現出色,提供了高效的執行效率和精確的時間管理。 1)C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2)利用面向對象特性,C 可以設計靈活的任務調度系統。 3)C 支持高效的中斷處理,但需避免動態內存分配和異常處理以保證實時性。 4)模板編程和內聯函數有助於性能優化。 5)實際應用中,C 可用於實現高效的日誌系統。

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析,步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析,步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能,並優化代碼。

交易所內置量化工具包括:1. Binance(幣安):提供Binance Futures量化模塊,低手續費,支持AI輔助交易。 2. OKX(歐易):支持多賬戶管理和智能訂單路由,提供機構級風控。獨立量化策略平台有:3. 3Commas:拖拽式策略生成器,適用於多平台對沖套利。 4. Quadency:專業級算法策略庫,支持自定義風險閾值。 5. Pionex:內置16 預設策略,低交易手續費。垂直領域工具包括:6. Cryptohopper:雲端量化平台,支持150 技術指標。 7. Bitsgap:

在MySQL中,添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column,刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時,需指定位置以優化查詢性能和數據結構;刪除字段前需確認操作不可逆;使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。

如何實現鼠標滾動事件穿透效果?在我們瀏覽網頁時,經常會遇到一些特別的交互設計。比如在deepseek官網上,�...
