由於Google的人工智慧(AI) 子公司DeepMind幾週前發表了一篇論文,描述了他們稱為Gato 的「通才」代理(可以使用相同的訓練模型執行不同的任務),並聲稱通用人工智慧(AGI) 可以透過可以透過純粹的規模化實現 ,由此在人工智慧產業內引發了激烈的爭論。雖然看起來有點學術性,但現實情況是,如果通用人工智慧指日可待,我們的社會——包括我們的法律、法規和經濟模型,都還沒準備好。
事實上,多虧了同一個訓練有素的模型,通才代理 Gato 能夠玩 Atari、為圖片添加字幕、聊天或用真正的機械臂堆疊積木。它還可以根據其上下文決定是否輸出文字、連接扭力、按鈕按下或其他標記。因此,它看起來確實是比流行的GPT-3、DALL-E 2、PaLM 或Flamingo 更通用的AI 模型,這些模型在非常狹窄的特定任務上變得非常出色,例如自然語言寫作、語言理解或根據描述建立圖像。
這讓DeepMind的科學家、牛津大學教授南多·德弗萊塔斯(Nando de Freitas)聲稱“現在一切都與規模有關!遊戲結束!” ,並認為人工通用智能(AGI)可以透過完全規模化(即更大的模型、更大的訓練資料集和更強的運算能力)來實現。然而,de Freitas說的遊戲」是什麼「?這場辯論到底是關於什麼呢?
在討論這場辯論的細節及其對更廣泛社會的影響之前,有必要先退一步了解背景。
「人工智慧,Artificial Intelligence」一詞的含義多年來一直在變化, 但從高級和通用的角度來看,它可以被定義為智慧代理的研究領域,它指的是任何感知其環境並採取行動,以最大限度地實現其目標的機會的系統。這個定義有意地將代理或機器是否真的會「思考」的問題置之度外,因為這個問題長期以來一直是激烈爭論的對象。 1950年,英國數學家阿蘭·圖靈在他著名的《 模仿遊戲 》論文中主張,與其考慮機器是否會思考,不如關注「機器是否有可能表現出智能行為」。
這種差異在概念上導致了人工智慧的兩個主要分支:強人工智慧和弱人工智慧。強人工智慧,也稱為通用人工智慧 (AGI) ,是人工智慧的一種理論形式,機器需要與人類相同的智慧。因此,它將具有自我意識,具有解決問題、學習和規劃未來的能力。這是人工智慧最雄心勃勃的定義,「人工智慧的聖杯」——但目前,這仍然是純粹的理論。實現強人工智慧的方法通常圍繞著符號人工智慧,即機器形成物理和抽象「世界」的內部符號表示,因此可以應用規則或推理來進一步學習和做出決定。
雖然這一領域的研究仍在繼續,但迄今為止,它在解決現實生活問題方面取得的成功有限,因為世界的內部或像徵性表徵會隨著規模的擴大而迅速變得難以管理。
弱人工智慧,也稱為“狹義人工智慧”,是一種沒有那麼雄心勃勃的人工智慧方法,專注於執行特定任務,例如根據用戶輸入回答問題、識別人臉或下棋,同時依靠人類幹預來定義其學習演算法的參數並提供相關的訓練資料以確保準確性。
然而,在弱人工智慧方面取得了顯著進步,眾所周知的例子包括人臉辨識演算法、自然語言模型(如OpenAI的GPT-n)、虛擬助理(如Siri或Alexa)、谷歌/DeepMind的下棋程序AlphaZero,以及在某種程度上的無人駕駛汽車。
實現弱人工智慧的方法通常圍繞著使用人工神經網路展開,人工神經網路是受構成動物大腦的生物神經網路啟發的系統。它們是互連節點或神經元的集合,結合激活函數,該函數根據「輸入層」中呈現的數據和互連中的權重確定輸出。為了調整互連中的權重以使「輸出」有用或正確,可以透過暴露於許多資料範例和「反向傳播」輸出損失來「訓練」網路。
可以說,還有第三個分支叫做“神經符號人工智慧”,它將神經網路和基於規則的人工智慧結合在一起。雖然在概念上很有希望,也很合理,因為它似乎更接近我們生物大腦的運作方式,但它仍處於非常早期的階段。
目前爭論的關鍵是,有了足夠規模的AI和機器學習模型,是否能夠真正實現人工通用智慧(AGI), 從而徹底擺脫符號人工智慧。現在只是一個硬體擴展和優化問題,還是我們需要在 AI 演算法和模型中發現和開發更多?
特斯拉似乎也接受Google/DeepMind的觀點。在2021年的人工智慧(AI)日活動上,特斯拉宣布推出特斯拉機器人( Tesla Bot ),也稱為擎天柱(Optimus),這是一款通用人形機器人,將由特斯拉為其汽車中使用的高級駕駛輔助系統開發的同一套AI系統控制。有趣的是,該公司執行長馬斯克表示,他希望在2023年之前將機器人投入生產,並聲稱擎天柱最終將能夠做“任何人類不想做的事情”,這意味著他預計AGI屆時將成為可能。
然而,其他人工智慧研究團隊——主要包括Yann LeCun, Meta的首席人工智慧科學家和紐約大學教授,他們更喜歡沒有那麼雄心勃勃的人類人工智慧(HLAI)一詞—— 認為仍有許多問題需要解決,而且純粹運算能力無法解決這些問題,可能需要新模型甚至軟體範例。
在這些問題中,機器有能力透過像嬰兒一樣的觀察來了解世界是如何運作的,透過它的行動來預測如何影響世界,處理世界固有的不可預測性,預測一系列行動的影響從而能夠推理和計劃,並在抽象空間中表示和預測。最終,爭論的焦點是,這是否可以透過僅使用我們現有的人工神經網路進行基於梯度的學習來實現,或者是否需要更多的突破。
雖然深度學習模型確實能夠在不需要人工幹預的情況下從數據中產生“關鍵特徵”,因此人們很容易相信,它們將能夠利用更多的數據和計算能力來挖掘和解決剩餘的問題,但這可能太好了,以致於不真實。打個簡單的比方,設計和製造越來越快、越來越強大的汽車並不會讓它們飛起來,因為我們需要充分了解空氣動力學才能先解決飛行問題。
使用深度學習AI模型取得的進展令人印象深刻,但值得思考的是,弱AI從業者的樂觀觀點是否僅僅是馬斯洛之鎚或「工具法則」的案例,即「如果你擁有的唯一工具是一把錘子,你往往會把每個問題都視為釘子」。
像Google/DeepMind、Meta或特斯拉這樣的基礎研究通常會讓私人企業感到不安,因為儘管它們的預算很大,但這些組織往往更傾向於競爭和上市速度,而不是學術合作和長期思考。
解決通用人工智慧可能需要兩種方法,而不是強弱 AI 支持者之間的競爭。用人腦進行類比並不牽強,人腦有意識和無意識的學習能力。我們的小腦約佔大腦體積的 10%,但包含超過 50% 的神經元總數,負責與運動技能相關的協調和運動,尤其是手和腳,以及保持姿勢和平衡。這是在不知不覺中快速完成的,我們無法真正解釋我們是如何做到的。然而,我們有意識的大腦雖然慢得多,但能夠處理抽象概念、計劃和預測。此外,有意識地獲取知識是可能的,透過訓練和重複,實現自動化——這是職業運動員所擅長的。
人們不禁要問,如果大自然在幾十萬年的時間裡以這種混合的方式進化了人類的大腦,為什麼一般的人工智慧系統會依賴單一的模型或演算法。
#不考慮最終實現通用人工智慧的特定潛在AI技術,這一事件將對我們的社會產生巨大的影響——就像輪子、蒸汽機、電力或計算機一樣。可以說,如果企業可以完全用機器人取代人力,我們的資本主義經濟模式將需要改變,否則社會動盪最終會隨之而來。
說了這麼多,很可能正在進行的辯論有點像企業公關,事實上,通用人工智慧比我們目前認為的更遠,因此我們有時間解決它的潛在影響。然而,在較短的時間內,很明顯,對通用人工智慧的追求將繼續推動特定技術領域的投資,例如軟體和半導體。
弱人工智慧框架下特定用例的成功導致對我們現有硬體能力面臨的壓力越來越大。例如,2020 年推出的流行的Generative Pre-Trained Transformer 3 (GPT-3) 模型OpenAI,已經能夠以與人類相當的流暢度編寫原始散文,它擁有1750 億個參數,需要幾個月的時間來訓練。
可以說,當今一些現有的半導體產品——包括 CPU、GPU 和 FPGA——能夠或多或少地有效地計算深度學習演算法。然而,隨著模型大小的增加,它們的性能變得不能令人滿意,並且出現了針對 AI 工作負載優化的客製化設計的需求。亞馬遜、阿里巴巴、百度和谷歌等領先的雲端服務供應商,以及特斯拉和各種半導體新創企業,如寒武紀、Cerebras、Esperanto、Graphcore、Groq、Mythic 和Sambanova,都採用了這條路線。
以上是Game Over?強AI與弱AI之爭的詳細內容。更多資訊請關注PHP中文網其他相關文章!