矽谷押注，生成式AI火了，讓你把簡單文字變成圖像甚至視頻-人工智慧-PHP中文網

生成式 AI 的工作原理

創企、雲端服務供應商和晶片製造商或受益最大

倫理問題難以應對

首頁

科技週邊

人工智慧

矽谷押注，生成式AI火了，讓你把簡單文字變成圖像甚至視頻

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 09, 2023 pm 11:11 PM

近年來興起的所謂「生成式人工智慧（generative AI）」正吸引矽谷科技巨頭和創投機構的興趣，這種 AI 可以依據少量詞彙在幾秒鐘內生成與之相匹配的圖像。分析師預計，這種技術將被廣泛用於各行各業，並產生數兆美元的經濟價值。

雖然這些電腦程式產生的圖像並不完美，例如手上出現多餘的手指，四肢不自然的彎曲等。同時，圖像生成器在處理文字時也會遇到問題，例如生成無意義的符號等。然而，這些圖像生成程式可能是一場科技熱潮的開始。矽谷創投機構NextView Ventures 的投資人大衛貝塞爾（David Beisel）說：「在過去的三個月裡，『生成式人工智慧』這個詞已經變成了流行語。」

從2021 年開始，生成式AI 技術取得了巨大進步，甚至激勵許多人辭掉工作去創辦新公司，夢想著AI 將來可以為新一代科技巨頭提供動力。

在過去五年左右的時間裡，AI 領域始終處於蓬勃發展階段，但這些進步大多與理解現有數據有關。 AI 模型已經變得足夠高效，可以識別人們剛用手機拍攝的照片中是否有一隻貓。此外，這些模型也足夠可靠，每天可以為Google搜尋引擎提供數十億次搜尋結果。不過，生成式 AI 模型可以產生以前沒有的全新東西。換句話說，它們是在創造，而不僅僅是在分析數據。

AI 與機器學習平台Craiyon Productive AI 的創建者 Boris Dayma）說：「最令人印象深刻的是，生成式AI也能創造新的東西。它們不僅是創造類似的舊有圖像，還可以創造與以前完全不同的新事物。」

矽谷知名創投公司紅杉資本(Sequoia Capital )在其網站上發文表示：「從遊戲到廣告再到法律方面，生成式AI 可能會改變所有需要人類創造力發揮作用的領域。這種技術有可能產生數萬億美元的經濟價值。」更為有趣的是，紅杉資本也在貼文中指出，其上述文章部分是由GPT-3 撰寫的，後者本身就是能夠產生文字的生成式AI。

生成式 AI 的工作原理

影像產生所使用的技術來自機器學習的子集，稱為深度學習。自從 2012 年一篇關於影像分類的里程碑論文重新點燃人們對這項技術的興趣以來，深度學習推動了 AI 領域的大部分進步。深度學習使用在大數據集上訓練的模型，直到程式理解這些資料中的關係。然後，該模型可以用於應用程序，例如識別圖片中是否有狗或翻譯文字等。

影像產生器的工作原理就是逆轉這個過程。它們不是將英語翻譯成法語，而是將英語短語轉換成圖像。它們通常有兩個主要部分組成，一個是處理初始短語的部分，另一個是將資料轉換成圖像的部分。

第一部分生成式 AI 是基於名為 Generative Adversarial Networks（生成式對抗網絡，簡稱 GAN）的方法。此前，這些 GAN 通常被用於生成不存在的人的照片。本質上，它們的工作方式是讓兩個 AI 模型相互競爭，以便更好地創建符合預定目標的圖像。

而較新的方法通常使用轉換器，這是Google於 2017 年論文中首次提出的概念。這是一項新興技術，可以利用更大的數據集，儘管其培訓成本可能高達數百萬美元。

第一個獲得大量關注的圖像生成器是 Dall-E，它是矽谷新創公司 OpenAI 於 2021 年推出的專案。 OpenAI 今年發布了功能更強大的更新版本。專注於生成式AI 的開發者 Christian Cantrell說：「有了Dall-E 2，這真的是我們跨越恐怖谷效應（Uncanny Valley）的時刻。」

另一個常用的、基於AI 的圖像生成器是Craiyon，以前被稱為Dall-E Mini，它可以在網路上買到。使用者輸入短語後，可以幾分鐘內在瀏覽器中看到其給出的繪圖。

根據AI 與機器學習平台Craiyon Productive AI 的創建者戴瑪稱，自2021 年7 月推出以來，Craiyon 現在每天生成約1000 萬張圖片，總計生成10 億張以前從未見過的圖片。在今年早些時候使用量飆升後，戴瑪開始將全部精力投入 Craiyon 上。他說，他專注於使用廣告來保持用戶免費使用，因為該網站的伺服器成本很高。 Craiyon 上有個推特帳號，專門發布最奇怪、最有創意的圖片，它擁有超過 100 萬名粉絲。

但最能激發人們熱情的項目是 Stable Diffusion，該項目於今年 8 月向公眾發布。它的程式碼可以在 GitHub 上取得，可以在電腦上運行，也可以在雲端或透過程式設計介面運行。這讓用戶可以根據自己的目的調整程式碼，或在其基礎上建立新程式。

舉例來說，Stable Diffusion 透過一個外掛程式整合到Adobe Photoshop 中，讓使用者產生背景和影像的其他部分，然後他們可以使用圖層和其他PS 工具直接在應用中操作，將生成式AI 從生成成品圖像的技術變成了專業人士可以使用的工具。

該外掛程式的開發者坎特雷爾在 Adobe 工作了 20 年，今年辭職專注於生成式 AI。這位資深人士表示，該插件已被下載數萬次。藝術家告訴他，他們把它用在了無數他意想不到的地方，例如製作哥吉拉的動畫，或以藝術家可以想像的任何姿勢創作蜘蛛人的圖像。

使用生成式 AI 的新興藝術是如何建立“提示”，即生成圖像的短語。名為 Lexica 的搜尋引擎可以將 Stable Diffusion 的圖像和可用於生成它們的確切單字字串聯起來。 Reddit 和 Discord 等平台上，都有如何引導人們輸入想要產生圖像的短語技巧。

創企、雲端服務供應商和晶片製造商或受益最大

許多投資者將生成式AI 視為一種潛在的變革性平台，就像智慧型手機或網路的早期一樣。這種轉變極大地擴大了可能能夠使用這項技術的潛在市場規模。

坎特雷爾認為，生成式 AI 類似於一種更基礎的技術，即資料庫。他說：「生成式AI 有點兒像資料庫，資料庫幫助解鎖了應用程式的巨大潛力。我們生活中使用過的幾乎每款應用程式都是建立在資料庫之上的，但沒有人關心資料庫是如何運作的，他們只知道如何使用它。”

Compound VC 管理合夥人邁克爾·鄧普西（Michael Dempsey）表示，以前僅限於實驗室的技術進入主流的時刻“非常罕見”，吸引了風險投資者的大量關注，他們喜歡在潛力巨大的領域下注。但他警告說，生成式 AI 目前處於更接近炒作週期頂峰的「好奇心階段」。處於這個階段的公司可能會倒閉，因為它們沒有專注於企業或消費者願意付費的特定用途。

該領域的其他人認為，今天開創這些技術的新創公司最終可能會挑戰目前主導AI 領域的軟體巨頭，包括Google、Facebook 母公司Meta 以及微軟，並為下一代科技巨頭的崛起鋪平道路。

Hugging Face 執行長克萊門特·德蘭格（Clement Delangue）表示：「將會有一大批價值萬億美元的新公司誕生，這些新創公司將以這種新的技術為基礎。」Hugging Face 是個與GitHub 類似的開發者平台，託管著預先培訓的AI 模型，包括Craiyon 和Stable Diffusio。它的目標是讓程式設計師更容易建立 AI 技術。

有些公司已經獲得了大量投資。 Huging Face 在今年稍早從 Lux Capital 和紅杉資本等投資者那裡籌集了資金後，估值達到 20 億美元。該領域最著名的新創公司 OpenAI 已從微軟和 Khosla Ventures 獲得了超過 10 億美元的資金。同時，Stable Diffusion 開發商 Stability AI 正在洽談以高達 10 億美元的估值籌集風險資金。

亞馬遜、微軟和谷歌等雲端服務供應商也可能受益，因為生成式 AI 可能是運算密集型技術。 Meta 和Google已經聘請了該領域許多傑出人才，希望將這種先進技術整合到公司的產品中。今年 9 月，Meta 宣布了名為「Make-A-Video」的 AI 計劃，透過生成影片而不僅僅是圖像，使這項技術更上一層樓。

Meta 執行長 Mark Zuckerberg（Mark Zuckerberg）在他的Facebook 頁面上發文表示：「這是一個令人驚嘆的進步。生成影片比生成照片難得多，因為除了正確產生每個像素之外，系統還必須預測它們會隨著時間的推移發生怎樣的變化。」最近，Google也發布了名為Phenaki 的程式碼，可以將文字轉換為幾分鐘的影片。

這股熱潮也可能為英偉達、AMD 和英特爾等晶片製造商帶來提振，他們的圖形處理器是訓練和部署 AI 模型的理想選擇。在上週的會議上，英偉達執行長黃仁勳強調，生成式 AI 是該公司最新晶片的關鍵用途，並表示這類技術可能很快就會為通訊領域帶來革命性的變化。

不過，生成式 AI 為終端用戶帶來的好處依然有限。如今許多令人興奮的事情都圍繞著免費或低成本的實驗。例如，有些作者已經嘗試使用圖像生成器為文章製作插圖。英偉達正嘗試使用模型來產生新的人、動物、車輛或家具的 3D 圖像，這些圖像可以填充到虛擬遊戲世界中。

倫理問題難以應對

最終，每個開發生成式 AI 的人都將不得不努力解決圖像生成器帶來的倫理問題。

首先是就業問題。儘管許多程式需要強大的圖形處理器，但電腦生成的內容仍然比專業插畫家的時間成本便宜得多，後者每小時的報酬可能高達數百美元。生成式 AI 可能會給藝術家、錄像製作人和其他以創作作品為生的人帶來大麻煩。 Compound VC 管理合夥人邁克爾鄧普西說：「事實證明，機器學習模型可能會變得比人類工作得更好、更快、更便宜。」

#圍繞原創性和所有權，生成式AI 也會帶來更複雜的挑戰。這種 AI 模型是利用大量現有圖像進行培訓的，原始圖像的創建者是否對以原始風格生成的圖像擁有版權仍在爭論中。一位藝術家最近在美國科羅拉多州的藝術比賽中獲勝，他使用的圖像主要是由名為 MidJourney 的生成式 AI 創作的。他在獲勝後接受採訪時表示，他從自己生成的數百張圖像中選擇了一張，然後在 PS 中對其進行了調整和處理。

由 Stable Diffusion 產生的一些影像似乎留有浮水印，這表示原始資料集的一部分受到版權保護。有些提示指南建議使用者使用特定的、在世藝術家的名字，以便在模仿該藝術家創作風格的過程中獲得更好的結果。上個月，Getty Images 禁止用戶將生成式 AI 影像上傳到其庫存影像資料庫中，因為其擔心引發侵權糾紛。

影像產生器也可以用來創造商標人物或目標的新影像，如小小兵、漫威角色或《權力的遊戲》中的王座。隨著圖像生成軟體變得越來越好，它也有可能欺騙用戶，讓他們相信虛假訊息，或顯示從未發生過的事件的圖像或影片。

開發者還必須努力應對這樣一種可能，即基於大量資料訓練的AI 模型可能會在資料中包含與性別、種族或文化相關的偏見，這可能會導致模型在輸出中展示這種偏見。 Huging Face 已經發布了有關倫理問題的資料，並就以負責任態度開發 AI 模型的問題進行了討論。

Hugging Face 執行長克萊門特·德蘭格表示：「我們在這些模型上看到了短期和當前挑戰，因為它們屬於機率模型，在大數據集上訓練，往往會吸收許多偏見。」他舉例稱，生成式AI 曾被要求繪製「軟體工程師」的畫像，結果其生成了白人男性的圖像。

以上是矽谷押注，生成式AI火了，讓你把簡單文字變成圖像甚至視頻的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

AI Hentai Generator

免費產生 AI 無盡。

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

7542

CakePHP 教程

1381

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

Debian郵件服務器防火牆配置技巧 Apr 13, 2025 am 11:42 AM

配置Debian郵件服務器的防火牆是確保服務器安全性的重要步驟。以下是幾種常用的防火牆配置方法，包括iptables和firewalld的使用。使用iptables配置防火牆安裝iptables（如果尚未安裝）：sudoapt-getupdatesudoapt-getinstalliptables查看當前iptables規則：sudoiptables-L配置

debian readdir如何與其他工具集成 Apr 13, 2025 am 09:42 AM

Debian系統中的readdir函數是用於讀取目錄內容的系統調用，常用於C語言編程。本文將介紹如何將readdir與其他工具集成，以增強其功能。方法一：C語言程序與管道結合首先，編寫一個C程序調用readdir函數並輸出結果：#include#include#includeintmain(intargc,char*argv[]){DIR*dir;structdirent*entry;if(argc!=2){

Debian郵件服務器SSL證書安裝方法 Apr 13, 2025 am 11:39 AM

在Debian郵件服務器上安裝SSL證書的步驟如下：1.安裝OpenSSL工具包首先，確保你的系統上已經安裝了OpenSSL工具包。如果沒有安裝，可以使用以下命令進行安裝：sudoapt-getupdatesudoapt-getinstallopenssl2.生成私鑰和證書請求接下來，使用OpenSSL生成一個2048位的RSA私鑰和一個證書請求（CSR）：openss

Debian OpenSSL如何進行數字簽名驗證 Apr 13, 2025 am 11:09 AM

在Debian系統上使用OpenSSL進行數字簽名驗證，可以按照以下步驟操作：準備工作安裝OpenSSL：確保你的Debian系統已經安裝了OpenSSL。如果沒有安裝，可以使用以下命令進行安裝：sudoaptupdatesudoaptinstallopenssl獲取公鑰：數字簽名驗證需要使用簽名者的公鑰。通常，公鑰會以文件的形式提供，例如public_key.pe

centos關機命令行 Apr 14, 2025 pm 09:12 PM

CentOS 關機命令為 shutdown，語法為 shutdown [選項] 時間 [信息]。選項包括：-h 立即停止系統；-P 關機後關電源；-r 重新啟動；-t 等待時間。時間可指定為立即 (now)、分鐘數 ( minutes) 或特定時間 (hh:mm)。可添加信息在系統消息中顯示。

Debian OpenSSL如何防止中間人攻擊 Apr 13, 2025 am 10:30 AM

在Debian系統中，OpenSSL是一個重要的庫，用於加密、解密和證書管理。為了防止中間人攻擊（MITM），可以採取以下措施：使用HTTPS：確保所有網絡請求使用HTTPS協議，而不是HTTP。 HTTPS使用TLS（傳輸層安全協議）加密通信數據，確保數據在傳輸過程中不會被竊取或篡改。驗證服務器證書：在客戶端手動驗證服務器證書，確保其可信。可以通過URLSession的委託方法來手動驗證服務器

Debian Hadoop日誌管理怎麼做 Apr 13, 2025 am 10:45 AM

在Debian上管理Hadoop日誌，可以遵循以下步驟和最佳實踐：日誌聚合啟用日誌聚合：在yarn-site.xml文件中設置yarn.log-aggregation-enable為true，以啟用日誌聚合功能。配置日誌保留策略：設置yarn.log-aggregation.retain-seconds來定義日誌的保留時間，例如保留172800秒（2天）。指定日誌存儲路徑：通過yarn.n

索尼證實PS5 Pro使用特製GPU 與AMD合作研發AI可能性 Apr 13, 2025 pm 11:45 PM

SonyInteractiveEntertainment（SIE，索尼互动娱乐）首席架构师MarkCerny公开更多次世代主机PlayStation5Pro(PS5Pro)硬体细节，包括性能升级的AMDRDNA2.x架构GPU，以及与AMD合作代号「Amethyst」的机器学习/人工智慧计划。PS5Pro性能提升的重点仍集中在更强大的GPU、先进的光线追踪与AI驱动的PSSR超解析度功能等3大支柱上。GPU採用客制化的AMDRDNA2架构，索尼将其命名为RDNA2.x，它拥有部分RDNA3架构才

See all articles

矽谷押注，生成式AI火了，讓你把簡單文字變成圖像甚至視頻

生成式 AI 的工作原理

創企、雲端服務供應商和晶片製造商或受益最大

倫理問題難以應對

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題