目錄
 01  相對創造力的概念和定義
 02  統計創造力的概念和定義
 03  自迴歸模型的統計創造力的測量和應用
 04  基於提示的大型語言模型的統計創造力的測量和應用
 05  統計創造力損失的定義與最佳化方法
 06  相關工作
首頁 科技週邊 人工智慧 人工智慧能夠像人類一樣展現創造力嗎?

人工智慧能夠像人類一樣展現創造力嗎?

Jan 08, 2024 pm 01:33 PM
模型

創造力是人類的一種獨特的能力,它使我們能夠創造出新穎、有價值、有意義的作品,如藝術、文學、科學、技術等。創造力也是人類社會的一種重要的驅動力,它促進了文化、經濟、教育等領域的發展和進步。創造力到底是什麼?它是如何產生的?它又如何被評估和提升的?這些問題一直困擾著心理學家、認知科學家、哲學家等多個學科的研究者。隨著人工智慧(AI)技術的快速發展,這些問題也引起了AI領域的關注。 AI是否可以像人類一樣有創造力?如果可以,那麼如何定義、測量和培養AI的創造力?這些問題不僅具有理論的意義,也具有實踐的價值,因為AI的創造力將影響AI在各領域的應用與發展。

科技學術論壇arxiv.org於1月3日發表了最新的論文《Can AI Be as Creative as Humans?》,該論文由來自美國、英國、新加坡等國家的多位知名的AI研究者共同撰寫,該論文是對AI創造力的一次深入的探索,提出了一種新穎的創造力評估的範式,即相對創造力(Relative Creativity),並建立了一個可量化的創造力框架,即統計創造力(Statistical Creativity)。論文不僅推進了理論的討論,而且提供了評估和提升AI創造潛力的實用工具和方法。論文的主要貢獻和創新點如下:

提出了相對創造力的概念,將AI系統的創造力評估從絕對的標準轉變為與特定的人類創造者的比較,從而認識到創造過程中的固有主觀性,並藉鑒了圖靈測試(Turing Test)評估智能的比較方法。這項創新方法將AI的創造力與人類的創造力進行比較,使得我們更能理解AI系統在創作過程中的表現和能力。透過將主觀性納入評估體系,我們能夠更全面地評估AI系統的創造力,並將其與人類創造者進行對比,從而更

為了評估AI的創造力,引入了統計創造力的概念,結合理論建構和實證評估的方法。此方法著重於AI是否可以模仿特定族群的創造性輸出,從而量化評估AI的創造力,並提升了理論架構的實際適用性。

將統計創造力應用於自迴歸模型是一種廣泛使用的語言模型技術。這種技術被認為具有一定的創造能力,並且在評估模型的統計創造力方面有了實用的度量標準。特別是在下一個標記預測方面,這種度量標準能夠適應當代AI模型的需求,並展現出與技術進步保持同步的潛力。

研究引入了一種名為統計創造力損失(Statistical Creativity Loss)的目標函數,用於訓練具有創造力的AI模型。研究也分析了統計創造力損失的上界,以及它與深度學習中的泛化相關的概念,如Rademacher複雜度、互資訊和ε-覆蓋數等。這些理論指導和實際措施為培養AI模型的創造能力提供了重要的幫助。

 01  相對創造力的概念和定義

#創造力是一種難以定義和測量的能力,因為它涉及主觀的、情境的、多維度的和動態的因素。對於什麼是創造力,什麼是有創造力的作品,可能有不同的看法和標準。因此要給創造力一個絕對的定義,或是給AI系統一個絕對的創造力評估,是不現實的,也是不公平的。作者認為,創造力的評估應該是相對的,而不是絕對的,即應該根據不同的人類創造者的水平和特點,來比較AI系統的創造力。這樣創造力的評估就不再是一個靜態的、固定的、單一的標準,而是一個動態的、靈活的、多樣化的過程,更能反映創造力的本質和多樣性。

作者提出了相對創造力(Relative Creativity)的概念,將其定義為:一個AI系統被認為具有相對創造力,如果它能夠根據給定的人類創造者的生平信息,生成與該創造者的作品無法區分的作品,那麼AI系統就可以被認為與該創造者一樣有創造力。相對創造力的「相對性」體現在它取決於被比較的個體的差異。例如,一個AI系統可能在與一個非專家的人類創造者比較時顯得非常有創造力,但在與一個專家的設計師或藝術家比較時顯得不那麼有創造力。相對創造力也承認創造力的主觀性,例如原創性、發散性思考和解決問題的技能,這些因素都被融入到錨定人類創造者的選擇過程中。由於創造力的評估是基於人類的視角的,因此相對創造力的概念也受到了圖靈測試(Turing Test)的啟發,這是一種評估AI智能的比較方法,透過判斷AI系統是否能夠與人類進行無法區分的對話。

人工智慧能夠像人類一樣展現創造力嗎?圖片

圖 1: 相對創造力和統計創造力的說明。 在圖1中,我們對相對創造力(a)和統計創造力(b)進行了解釋。相對創造力指的是評估人工智慧在創造藝術方面的能力,與假設的人類創作者相比幾乎沒有區別,同時考慮到相同的傳記影響。而統計創造力則是透過衡量人工智慧產生的創作與現有人類創作者無法區分的能力來進行評估,這種衡量是透過分佈距離測量來確定的。

相對創造力與圖靈測驗有一些相似之處,但也有一些差異。相似之處在於,它們都是基於人類的視角,透過比較AI系統和人類的表現,來評估AI系統的能力。差別在於,圖靈測驗的目標是評估AI系統的智能,而相對創造力的目標是評估AI系統的創造力。智能和創造力是兩個不同的維度,它們可能有一些重疊,但也有一些差異。例如,一個AI系統可能很聰明,但不一定很有創造力,反之亦然。另一個差異在於,圖靈測驗的評估是基於對話的,而相對創造力的評估是基於作品的。對話是一種互動的、動態的、即時的過程,而作品是一種靜態的、固定的、延遲的結果。因此,相對創造力的評估可能更加困難,因為它需要考慮更多的因素,如作品的風格、內容、品質、原創性等。作者認為,相對創造力是一種更全面和深入的創造力評估方法,它不僅考慮了AI系統的表現,而且考慮了人類創造者的背景和特徵。

 02  統計創造力的概念和定義

#相對創造力的概念雖然具有啟發性,但是它還缺乏一個可操作的評估方法。為了彌補這一缺陷,作者引入了統計創造力(Statistical Creativity)的概念,將其定義為:一個AI系統被認為具有統計創造力,如果它能夠在給定一個人類創造者群體的情況下,生成與該群體的創造性輸出無法區分的輸出,那麼AI系統就可以被認為與該群體一樣有創造力。統計創造力的「統計性」體現在它是基於可觀察的數據,而不是抽象的標準,來評估AI系統的創造力。

人工智慧能夠像人類一樣展現創造力嗎?圖片

作者提出了一個統計創造力的測量,即E0(q),它是一個經驗的度量,用來估計一個AI模型和一個人類創造者群體的創造能力之間的不可區分性。 E0(q)的值越低,表示AI模型越能夠模仿該群體的創造能力。作者也給出了一個統計創造力的定理,明確了一個AI模型能夠被歸類為具有δ-創造力的條件,即E0(q)

 03  自迴歸模型的統計創造力的測量和應用

自迴歸模型是一種常見的大型語言模型(LLMs)技術,它透過基於前文的機率分佈來預測下一個標記,從而產生連貫的文字序列。自回歸模型被認為具有一定程度的創造能力,因為它們能夠產生新穎的文本,如詩歌、故事、代碼等。然而如何評估和提升自迴歸模型的創造力,仍然是一個開放的問題。作者將統計創造力的概念應用於自迴歸模型,提出了一個針對下一個標記預測的統計創造力的測量,即E1(q),它是一個經驗的度量,用來估計一個自迴歸模型和一個人類創造者群體的創造能力之間的不可區分性。 E1(q)的值越低,表示自迴歸模型越能夠模仿該群體的創造能力。

人工智慧能夠像人類一樣展現創造力嗎?圖片

作者也給了自迴歸模型的統計創造力的定理,明確了一個自迴歸模型能夠被歸類為具有δ-創造力的條件,即E1(q)

下一個標記預測是自迴歸模型的核心技術,它決定了模型產生的文字序列的品質和多樣性。下一個標記預測的難度取決於給定的上下文,以及目標的標記的可能性。如果上下文是清晰和具體的,那麼下一個標記的預測就比較容易,因為有一些標記是比較合理和常見的。例如,如果上下文是“我喜歡吃”,那麼下一個標記可能是“蘋果”、“麵包”、“餃子”等。但是,如果上下文是模糊和抽象的,那麼下一個標記的預測就比較困難,因為有很多標記都是可能的,而且沒有明顯的優勢。例如,如果上下文是“我想要”,那麼下一個標記可能是“旅行”、“學習”、“睡覺”等。在這種情況下,自迴歸模型需要有更強的創造力,才能產生有意義和有趣的文字序列。

下一個標記預測的重要性在於它反映了自回歸模型的創造力的水平,以及它與人類創造者的創造力的相似性。如果一個自回歸模型能夠在不同的脈絡下,產生與人類創造者的作品無法區分的下一個標記,那麼它就表現出了與人類創造者一樣的創造力。這種創造力的評估可以透過統計創造力的測量,如E1(q),來進行。作者認為,這種評估方法是一種更客觀和科學的方法,它不依賴人類的主觀判斷,而是基於數據和機率的計算。作者的研究為自回歸模型的創造力提供了一個新的觀點和方法,有助於提高模型的生成能力和品質。

 04  基於提示的大型語言模型的統計創造力的測量和應用

基於提示的大型語言模型(prompt-conditioned large language models,LLMs)是一種前沿的模型範式,能夠利用提示(prompts)來解鎖模型的潛在能力。提示是一種向模型提供輸入和輸出格式的方法,可以用來指導模型完成不同的任務,如文字分類、文字生成、文字摘要等。提示的作用類似人類的啟發,可以激發模型的創造力和靈活性。然而,如何評估和提升基於提示的LLMs的創造力,仍然是一個開放的問題。作者將統計創造力的概念應用於基於提示的LLMs,提出了一個針對不同的上下文提示的統計創造力的度量,即E2(q),它是一個經驗的度量,用來估計一個基於提示的LLM和一個人類創造者群體的創造能力之間的不可區分性。 E2(q)的值越低,表示基於提示的LLM越能夠模仿該群體的創造能力。作者也給出了一個基於提示的LLM的統計創造力的推論,明確了一個基於提示的LLM能夠被歸類為具有δ-創造力的條件,即E2(q)

 05  統計創造力損失的定義與最佳化方法

統計創造力損失(Statistical Creativity Loss)是可最佳化的目標函數,用於訓練具有創造力的AI模型。它是基於統計創造力的測量,如E0(q)、E1(q)或E2(q),來定義的。統計創造力損失的數值越低,表示AI模型越能夠模仿人類創造者群體的創造能力。作者提出了一個統計創造力損失的上界,公式(2),以及它與深度學習中的泛化(generalization)相關的概念,如Rademacher複雜度(Rademacher complexity)、互資訊(mutual information)和ε -覆蓋數(ε-covering number)等。作者分析了統計創造力損失的上界與下一個標記預測的對數似然(log-likelihood)的關係,以及達到統計創造力所需的創造者-作品數據的數量。作者的發現強調了創造者-作品對的多樣性的重要性,而不僅僅是擁有大量的創造數據。這項見解使得統計創造力的概念在基於下一個標記預測的當前AI框架中特別適用。作者的研究不僅提供了理論視角,也引導了AI創造力的討論,並倡導使用相對評估來促進實證研究,建立一個評估和提升AI模型創造能力的框架。

 06  相關工作

#作者最後回顧了先前關於創造力的定義和應用的相關工作,主要涉及視覺和語言兩個領域。作者指出,雖然有許多研究試圖在生成模型中應用創造力的元素,但沒有直接定義創造力或直接優化它。相反,作者的研究旨在建立一個創造力的理論基礎,這個框架自然地包含了先前關於生成的多樣性和品質的見解。作者期待他們的貢獻能為未來的研究奠定基礎,引導模型創造力的提升。

在視覺領域,創造性的圖像生成模型已經取得了顯著的發展,引發了關於機器能否產生創造性藝術的問題。 Hertzmann (2018) 深入探討了這個問題,強調了電腦圖形學和藝術創新之間的交叉點。 Xu et al. (2012a) 提出了一種創意十足的三維建模方法,能夠根據使用者的偏好產生多樣的模型。生成對抗網絡(GANs)(Goodfellow et al., 2014) 被 Elgammal et al. (2017) 用來驅動創造獨特的藝術風格,透過最大化與已知風格的偏差。 Sbai et al. (2018) 進一步增加了這種偏差,鼓勵模型與訓練集的風格不同。創意的生成也可以被視為一種組合的過程,Ge et al. (2021) 和 Ranaweera (2016) 強調了細部元素的整合的重要性。 Vinker et al. (2023) 在此基礎上,將個人化的概念分解為視覺元素,用於創新的重組,豐富了創造性的輸出。

在語言領域,語言模型的發展也促使研究者探索如何優化資料的使用,以提高模型在不同的領域、任務和語言中的適應性(Gururangan et al., 2020; Devlin et al., 2019; Conneau et al., 2020)。研究者也表現出了利用語言模型來解讀人類溝通中的細微差別的傾向 (Schwartz et al., 2013; Wu et al., 2022)。這種洞察力也被用來改進分類模型 (Hovy, 2015; Flek, 2020)。隨著生成模型的日益普及,人們也對可控制的文本生成感興趣,即模型的輸出必須滿足一些約束,如禮貌(Saha et al., 2022; Sennrich et al., 2016)、情感(Liu et al., 2021; Dathathri et al., 2019; He et al., 2020) 或其他風格約束。最後,文字風格轉換(TST),即將輸入文字的風格轉換為設定的目標風格,也成為了一個熱門的任務。風格可以指一系列不同的文本和作者特定的特徵,如禮貌(Madaan et al., 2020)、正式度(Rao and Tetreault, 2018; Briakou et al., 2021)、簡單度(Zhu et al., 2010; van den Bercken et al., 2019; Weng et al., 2019; Cao et al., 2020)、作者(Xu et al., 2012b; Carlson et al., 2018)、作者性別(Prabhumoye et al. , 2018) 等(Jin et al., 2022)。雖然所有這些應用都試圖在生成模型中應用創造力的元素,但沒有直接定義創造力或直接優化它。相反,它們的重點是提高模型在預先定義的任務上的表現,作為創造力的代理。與之相反,作者的研究以建立創造力的理論基礎為目標。這個框架自然地包含了先前關於生成的多樣性和品質的見解。作者期待他們的貢獻能為未來的研究奠定基礎,引導模型創造力的提升。

參考資料:https://arxiv.org/abs/2401.01623

#

以上是人工智慧能夠像人類一樣展現創造力嗎?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆樹的耳語 - 如何解鎖抓鉤
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1666
14
CakePHP 教程
1425
52
Laravel 教程
1325
25
PHP教程
1272
29
C# 教程
1252
24
全球最強開源 MoE 模型來了,中文能力比肩 GPT-4,價格僅 GPT-4-Turbo 的近百分之一 全球最強開源 MoE 模型來了,中文能力比肩 GPT-4,價格僅 GPT-4-Turbo 的近百分之一 May 07, 2024 pm 04:13 PM

想像一下,一個人工智慧模型,不僅擁有超越傳統運算的能力,還能以更低的成本實現更有效率的效能。這不是科幻,DeepSeek-V2[1],全球最強開源MoE模型來了。 DeepSeek-V2是一個強大的專家混合(MoE)語言模型,具有訓練經濟、推理高效的特點。它由236B個參數組成,其中21B個參數用於啟動每個標記。與DeepSeek67B相比,DeepSeek-V2效能更強,同時節省了42.5%的訓練成本,減少了93.3%的KV緩存,最大生成吞吐量提高到5.76倍。 DeepSeek是一家探索通用人工智

Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇 Google狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理訓練最快選擇 Apr 01, 2024 pm 07:46 PM

谷歌力推的JAX在最近的基準測試中表現已經超過Pytorch和TensorFlow,7項指標排名第一。而且測試並不是JAX性能表現最好的TPU上完成的。雖然現在在開發者中,Pytorch依然比Tensorflow更受歡迎。但未來,也許有更多的大型模型會基於JAX平台進行訓練和運行。模型最近,Keras團隊為三個後端(TensorFlow、JAX、PyTorch)與原生PyTorch實作以及搭配TensorFlow的Keras2進行了基準測試。首先,他們為生成式和非生成式人工智慧任務選擇了一組主流

AI顛覆數學研究!菲爾茲獎得主、華裔數學家領銜11篇頂刊論文|陶哲軒轉贊 AI顛覆數學研究!菲爾茲獎得主、華裔數學家領銜11篇頂刊論文|陶哲軒轉贊 Apr 09, 2024 am 11:52 AM

AI,的確正在改變數學。最近,一直十分關注這個議題的陶哲軒,轉發了最近一期的《美國數學學會通報》(BulletinoftheAmericanMathematicalSociety)。圍繞著「機器會改變數學嗎?」這個話題,許多數學家發表了自己的觀點,全程火花四射,內容硬核,精彩紛呈。作者陣容強大,包括菲爾茲獎得主AkshayVenkatesh、華裔數學家鄭樂雋、紐大電腦科學家ErnestDavis等多位業界知名學者。 AI的世界已經發生了天翻地覆的變化,要知道,其中許多文章是在一年前提交的,而在這一

替代MLP的KAN,被開源專案擴展到卷積了 替代MLP的KAN,被開源專案擴展到卷積了 Jun 01, 2024 pm 10:03 PM

本月初,來自MIT等機構的研究者提出了一種非常有潛力的MLP替代方法—KAN。 KAN在準確性和可解釋性方面表現優於MLP。而且它能以非常少的參數量勝過以更大參數量運行的MLP。例如,作者表示,他們用KAN以更小的網路和更高的自動化程度重現了DeepMind的結果。具體來說,DeepMind的MLP有大約300,000個參數,而KAN只有約200個參數。 KAN與MLP一樣具有強大的數學基礎,MLP基於通用逼近定理,而KAN基於Kolmogorov-Arnold表示定理。如下圖所示,KAN在邊上具

你好,電動Atlas!波士頓動力機器人復活,180度詭異動作嚇到馬斯克 你好,電動Atlas!波士頓動力機器人復活,180度詭異動作嚇到馬斯克 Apr 18, 2024 pm 07:58 PM

波士頓動力Atlas,正式進入電動機器人時代!昨天,液壓Atlas剛「含淚」退出歷史舞台,今天波士頓動力就宣布:電動Atlas上崗。看來,在商用人形機器人領域,波士頓動力是下定決心要跟特斯拉硬剛一把了。新影片放出後,短短十幾小時內,就已經有一百多萬觀看。舊人離去,新角色登場,這是歷史的必然。毫無疑問,今年是人形機器人的爆發年。網友銳評:機器人的進步,讓今年看起來像人類的開幕式動作、自由度遠超人類,但這真不是恐怖片?影片一開始,Atlas平靜地躺在地上,看起來應該是仰面朝天。接下來,讓人驚掉下巴

時間序列預測 NLP大模型新作:為時序預測自動產生隱式Prompt 時間序列預測 NLP大模型新作:為時序預測自動產生隱式Prompt Mar 18, 2024 am 09:20 AM

今天我想分享一個最新的研究工作,這項研究來自康乃狄克大學,提出了一種將時間序列資料與自然語言處理(NLP)大模型在隱空間上對齊的方法,以提高時間序列預測的效果。此方法的關鍵在於利用隱空間提示(prompt)來增強時間序列預測的準確性。論文標題:S2IP-LLM:SemanticSpaceInformedPromptLearningwithLLMforTimeSeriesForecasting下載網址:https://arxiv.org/pdf/2403.05798v1.pdf1、問題背景大模型

特斯拉機器人進廠打工,馬斯克:手的自由度今年將達到22個! 特斯拉機器人進廠打工,馬斯克:手的自由度今年將達到22個! May 06, 2024 pm 04:13 PM

特斯拉機器人Optimus最新影片出爐,已經可以在工廠裡打工了。正常速度下,它分揀電池(特斯拉的4680電池)是這樣的:官方還放出了20倍速下的樣子——在小小的「工位」上,揀啊揀啊揀:這次放出的影片亮點之一在於Optimus在廠子裡完成這項工作,是完全自主的,全程沒有人為的干預。而且在Optimus的視角之下,它還可以把放歪了的電池重新撿起來放置,主打一個自動糾錯:對於Optimus的手,英偉達科學家JimFan給出了高度的評價:Optimus的手是全球五指機器人裡最靈巧的之一。它的手不僅有觸覺

DualBEV:大幅超越BEVFormer、BEVDet4D,開卷! DualBEV:大幅超越BEVFormer、BEVDet4D,開卷! Mar 21, 2024 pm 05:21 PM

這篇論文探討了在自動駕駛中,從不同視角(如透視圖和鳥瞰圖)準確檢測物體的問題,特別是如何有效地從透視圖(PV)到鳥瞰圖(BEV)空間轉換特徵,這一轉換是透過視覺轉換(VT)模組實施的。現有的方法大致分為兩種策略:2D到3D和3D到2D轉換。 2D到3D的方法透過預測深度機率來提升密集的2D特徵,但深度預測的固有不確定性,尤其是在遠處區域,可能會引入不準確性。而3D到2D的方法通常使用3D查詢來採樣2D特徵,並透過Transformer學習3D和2D特徵之間對應關係的注意力權重,這增加了計算和部署的

See all articles