大規模模型的發展受到限制，需要創建可解釋的人工智慧理論-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

大規模模型的發展受到限制，需要創建可解釋的人工智慧理論

王林

Jan 16, 2024 pm 10:00 PM

大模型可解釋ai

GPT-4的限制在於僅能與數位世界互動，而我們最終需要與實體世界互動。為此，機器人的出現尤其重要，它代表著具身智慧的實現。張鈸指出，並非必須開發人形機器人，也不需要過於複雜的硬體。他主張以一定的硬體為基礎進行強化學習研究。這樣的方法可以在不改變原有意義的情況下進行微調。

全世界對大模型的強大能力和潛力感到驚訝，但無法解釋其原因，只能將其歸結為「湧現」現象。為了人工智慧產業的健康發展，必須綜合科學研究、技術創新和產業發展。要發展第三代人工智慧，必須建立可解釋和魯棒的理論和方法，否則AI技術將永遠難以令人信服。

大規模模型的發展受到限制，需要創建可解釋的人工智慧理論

大語言模型存在天花板。

雖然通往通用人工智慧的道路依然艱難，但大語言模式為AI產業開闢了一條寬廣的道路。在智譜AI 2024年度技術開放日上，張鈸院士表示，大模型為發展通用硬體和軟體提供了機會。

傳統AI範式利用特定的演算法和規則完成特定任務，生成式AI範式是基於一種稱為基礎模型的通用模型，透過廣泛文字資料的訓練，在開領域（open domain，開域）內可以產生類似於人類層級的高品質文字、圖像和其他內容，透過微調等方式可適配於廣泛的下游任務。生成式AI向通用AI邁出一步，第二步是AI智能體，第三步則是具身智能。張鈸表示，GPT-4只能和數位世界打交道，我們最終必須跟實體世界打交道，這就需要機器人，也就是具身智慧。具身智能的提出有助於建構完整的智能體，讓智能體既有感知，也有思考。「不一定要做人形機器人，因為很多時候只要用手或腳就可以了，不需要把硬體搞得非常複雜。」他主張以一定的硬體為基礎進行強化學習研究。

生成式AI大模型具備三大能力和一大缺點。首先是強大的生成能力，它能夠根據上下文和過去的對話生成多樣性的連貫文本，讓人們感到驚訝。其次是強大的遷移能力，即透過代理任務的訓練和細調適配，能夠應用到感興趣的下游任務中。第三是強大的交互能力，包括人機交互、多智能體之間的交互以及與環境的交互，使得AI能夠在各個領域展現出與人類相媲美的智能水平。然而，這些大模型也存在著一個缺點，就是幻覺。有時候，它們會產生看似合理的編造或無意義的答案。

人工智慧有助於推動經濟成長，建築、維護、安裝等產業難以被自動化和智慧化，但行政管理等白領工作或被AI取代。 AI可提高大多數人類工作的品質和效率，但被AI完全取代的工作仍是少數。之所以AI還不能取代大多數工作，是因為大模型還存在著難以逾越的天花板。張鈸表示，大模型的所有工作都是外部提示而非主動，並且在外部提示的情況下利用機率預測完成任務，而人類的工作依靠內部意圖驅動。大語言模型生成語言與人類語言生成只是行為上的相似性，而內在機制根本不同，大語言模型存在不自知、質量不可控、不可信、不魯棒等天花板，給出不同的提示詞，大模型會輸出不同的答案。大模型也會產生幻覺，「不管模型多大，幻覺這個缺點一直存在。」

他提出，要發展第三代人工智慧，必須建立可解釋和穩健的人工智慧理論和方法，發展安全、可控、可信、可靠、可擴展的AI技術，推動AI的創新應用和產業化。如果無法建立可解釋和魯棒的人工智慧理論，AI技術是不可靠的，AI技術永遠難以令人相信。「到目前為止，這個理論還沒有建立起來，這也是人工智慧之所以發展緩慢和曲折的原因。理論建立不起來，是因為受到三個特定限制，過去只能在特定領域利用特定模型解決特定任務，這怎麼可能建立通用理論？大模型的出現為建立這個理論提供了可能性。」

張鈸表示，大模型為我們提供了發展通用硬體和軟體的機會。人工智慧正進入穩定發展的階段，對各行各業有巨大影響，必須抓住機會發展人工智慧產業。但仍有大量不確定性，因為AI不可預測、不可控制。全世界對大模型強大的生成能力、遷移能力、互動能力感到驚訝，卻無法解釋，只能歸結為「湧現」。所以為了人工智慧產業的健康發展，必須將科學研究、技術創新、產業發展結合起來。

以上是大規模模型的發展受到限制，需要創建可解釋的人工智慧理論的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學

1653

CakePHP 教程

1413

Laravel 教程

1304

PHP教程

1251

C# 教程

1224

Related knowledge

大模型App騰訊元寶上線！混元再升級，打造可隨身攜帶的全能AI助理 Jun 09, 2024 pm 10:38 PM

5月30日，騰訊宣布旗下混元大模型全面升級，基於混元大模型的App「騰訊元寶」正式上線，蘋果及安卓應用程式商店皆可下載。相較於先前測試階段的混元小程式版本，面向工作效率場景，騰訊元寶提供了AI搜尋、AI總結、AI寫作等核心能力；面向日常生活場景，元寶的玩法也更加豐富，提供了多個特色AI應用，並新增了創建個人智能體等玩法。「騰訊做大模型不爭一時之先。」騰訊雲副總裁、騰訊混元大模型負責人劉煜宏表示：「過去的一年，我們持續推進騰訊混元大模型的能力爬坡，在豐富、海量的業務場景中打磨技術，同時洞察用戶的真實需求

位元組跳動豆包大模型發布，火山引擎全端 AI 服務協助企業智慧轉型 Jun 05, 2024 pm 07:59 PM

火山引擎總裁譚待企業要做好大模型落地，面臨模型效果、推理成本、落地難度的三大關鍵挑戰：既要有好的基礎大模型做支撐，解決複雜難題，也要有低成本的推理服務讓大模型廣泛應用，還要更多工具、平台和應用程式幫助企業做好場景落地。 ——譚待火山引擎總裁01.豆包大模型首次亮相大使用量打磨好模型模型效果是AI落地最關鍵的挑戰。譚待指出，只有大的使用量，才能打磨出好模型。目前，豆包大模型日均處理1,200億tokens文字、生成3,000萬張圖片。為助力企業做好大模型場景落地，位元組跳動自主研發的豆包大模型將透過火山

揭露NVIDIA大模型推理架構：TensorRT-LLM Feb 01, 2024 pm 05:24 PM

一、TensorRT-LLM的產品定位TensorRT-LLM是NVIDIA為大型語言模型（LLM）所開發的可擴展推理方案。它基於TensorRT深度學習編譯框架建構、編譯和執行計算圖，並藉鑒了FastTransformer中高效的Kernels實作。此外，它還利用NCCL實現設備間的通訊。開發者可以根據技術發展和需求差異，客製化算子以滿足特定需求，例如基於cutlass開發客製化的GEMM。 TensorRT-LLM是NVIDIA官方推理方案，致力於提供高效能並不斷完善其實用性。 TensorRT-LL

工業知識圖譜進階實戰 Jun 13, 2024 am 11:59 AM

一、背景簡介首先來介紹雲問科技的發展歷程。雲問科技公...2023年，正是大模型盛行的時期，很多企業認為已經大模型之後圖譜的重要性大大降低了，之前研究的預置的資訊化系統也都不重要了。不過隨著RAG的推廣、資料治理的盛行，我們發現更有效率的資料治理和高品質的資料是提升私有化大模型效果的重要前提，因此越來越多的企業開始重視知識建構的相關內容。這也推動了知識的建構和加工開始向更高層次發展，其中有許多技巧和方法可以挖掘。可見一個新技術的出現，並不是將所有的舊技術打敗，也有可能將新技術和舊技術相互融合後

對標GPT-4！中國移動九天大模型通過雙備案 Apr 04, 2024 am 09:31 AM

4月4日消息，日前，國家網信辦公佈已備案大模型清單，中國移動「九天自然語言交互大模型」名列其中，標誌著中國移動九天AI大模型可正式對外提供生成式人工智慧服務。中國移動表示，這是同時透過國家「生成式人工智慧服務備案」和「境內深度合成服務演算法備案」雙備案的首個央企研發的大模型。據介紹，九天自然語言交互大模型具有產業能力增強、安全可信、支援全端國產化等特點，已形成90億、139億、570億、千億等多種參數量版本，可靈活部署於雲、邊、端不同場

利用昇腾AI技术，秦岭·秦川交通大模型助力西安打造智慧交通创新中心 Oct 15, 2023 am 08:17 AM

“高度复杂、碎片化程度高、跨领域”一直是交通行业数智化升级路上的首要痛点。近日，由中科视语、西安市雁塔区政府、西安未来人工智能计算中心联合打造的参数规模千亿级的“秦岭·秦川交通大模型”，面向智慧交通领域，为西安及其周边地区打造智慧交通创新支点。“秦岭·秦川交通大模型”结合西安当地海量开放场景下的交通生态数据、中科视语自研的原创先进算法以及西安未来人工智能计算中心昇腾AI的强大算力，为路网监测、应急指挥、养护管理、公众出行等智慧交通全场景带来数智化变革。交通管理在不同城市有不同的特点，不同道路的交

新測試基準發布，最強開源Llama 3尷尬了 Apr 23, 2024 pm 12:13 PM

如果試題太簡單，學霸和學渣都能考90分，拉不開差距……隨著Claude3、Llama3甚至之後GPT-5等更強模型發布，業界急需一款更難、更有區分度的基準測試。大模型競技場背後組織LMSYS推出下一代基準測試Arena-Hard，引起廣泛關注。 Llama3的兩個指令微調版本實力到底如何，也有了最新參考。與先前大家分數都相近的MTBench相比，Arena-Hard區分度從22.6%提升到87.4%，孰強孰弱一目了然。 Arena-Hard利用競技場即時人類數據構建，與人類偏好一致率也高達89.1%

GPT Store都開不下去，這家國產平台怎麼敢走這條路的？？ Apr 19, 2024 pm 09:30 PM

注意看，這個男人把超1000種大模型接入，讓你可插拔無縫切換使用。最近也上線了可視化的AI工作流程：給你一個直覺的拖放介面，拖拖、拉拉、拽拽，就能在無限畫布上編排自己個兒的Workflow。正所謂兵貴神速，量子位聽說，這個AIWorkflow上線不到48小時，就已經有用戶配出了100多個節點的個人工作流程。不賣關子，今天要聊的是LLMOps公司Dify，及其CEO張路宇。張路宇也是Dify的創辦人。投入創業前，有11年的網路經驗。搞產品設計，懂專案管理，也對SaaS有點自己的獨到見解。後來他

See all articles

大規模模型的發展受到限制，需要創建可解釋的人工智慧理論

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題