目錄
HuggingGPT:你的AI模型“調包俠”
專案已開源,名叫「賈維斯」
首頁 科技週邊 人工智慧 HuggingGPT火了:一個ChatGPT控制所有AI模型,自動幫人完成AI任務,網友:留口飯吃吧

HuggingGPT火了:一個ChatGPT控制所有AI模型,自動幫人完成AI任務,網友:留口飯吃吧

Apr 07, 2023 pm 09:21 PM
ai 模型 hugginggpt

最強組合:HuggingFace ChatGPT -

HuggingGPT,它來了!

只要給定一個AI任務,例如「下面這張圖片裡有什麼動物,每種有幾隻」。

它就能幫你自動分析需要哪些AI模型,然後直接去呼叫HuggingFace上的對應模型,來幫你執行並完成。

HuggingGPT火了:一個ChatGPT控制所有AI模型,自動幫人完成AI任務,網友:留口飯吃吧

整個過程,你要做的就只是用自然語言將你的需求輸出。

這項由浙大與微軟亞研院的合作成果,一發布就迅速爆火。

HuggingGPT火了:一個ChatGPT控制所有AI模型,自動幫人完成AI任務,網友:留口飯吃吧

英偉達AI研究科學家Jim Fan直呼:

這是我本週讀到的最有趣的論文。它的想法非常接近「Everything App」(萬物皆App,被AI直接讀取資訊)。

而一位網友則「直拍大腿」:

這不就是ChatGPT「調包俠」嗎?

HuggingGPT火了:一個ChatGPT控制所有AI模型,自動幫人完成AI任務,網友:留口飯吃吧

AI進化速度一日千里,給我們留口飯吃吧…

HuggingGPT火了:一個ChatGPT控制所有AI模型,自動幫人完成AI任務,網友:留口飯吃吧

所以,具體怎麼回事?

HuggingGPT:你的AI模型“調包俠”

其實,若說這個組合物只是“調包俠”,那格局小了。

它的真正用義,是AGI。

如作者所言,邁向AGI的關鍵一步是能夠解決具有不同領域和模式的複雜AI任務。

我們目前的成果離此還有距離──大量模型只能出色地完成某一特定任務。

然而大語言模型LLM在語言理解、生成、互動和推理方面的表現,讓作者想到:

可以將它們作為中間控制器,來管理現有的所有AI模型,透過“調動和組合每個人的力量”,來解決複雜的AI任務。

在這個系統中,語言是通用的介面。

於是,HuggingGPT就誕生了。

它的工程流程分為四個步驟:

首先,任務規劃。 ChatGPT將使用者的需求解析為任務列表,並確定任務之間的執行順序和資源依賴關係。

其次,模型選擇。 ChatGPT根據HuggingFace上託管的各專家模型的描述,為任務分配合適的模型。

接著,任務執行。混合端點(包括本地推理和HuggingFace推理)上被選定的專家模型根據任務順序和依賴關係執行分配的任務,並將執行資訊和結果給到ChatGPT。

最後,輸出結果。由ChatGPT總結各模型的執行過程日誌和推理結果,給出最終的輸出。

如下圖所示。

假定我們給出這樣一個請求:

請產生一個女孩正在看書的圖片,她的姿勢與example.jpg中的男孩相同。然後請用你的聲音描述新圖片。

可以看到HuggingGPT是如何將它拆解為6個子任務,並分別選定模型執行得到最終結果的。

HuggingGPT火了:一個ChatGPT控制所有AI模型,自動幫人完成AI任務,網友:留口飯吃吧

具體效果怎麼樣?

作者採用gpt-3.5-turbo和text-davinci-003這兩個可以透過OpenAI API公開存取的變體,進行了實測。

如下圖所示:

在任務之間存在資源依賴關係的情況下,HuggingGPT可以根據使用者的抽象請求正確解析出具體任務,完成圖片轉換。

HuggingGPT火了:一個ChatGPT控制所有AI模型,自動幫人完成AI任務,網友:留口飯吃吧

在音訊和視訊任務中,它也展現了組織模型之間合作的能力,透過分別並行和串列執行兩個模型的方式,完了一段「太空人在太空中行走」的影片和配音作品。

HuggingGPT火了:一個ChatGPT控制所有AI模型,自動幫人完成AI任務,網友:留口飯吃吧

此外,它還可以整合多個使用者的輸入資源執行簡單的推理,例如在以下三張圖片中,數出其中有多少匹斑馬。

HuggingGPT火了:一個ChatGPT控制所有AI模型,自動幫人完成AI任務,網友:留口飯吃吧

一句話總結:HuggingGPT可以在各種形式的複雜任務上表現出良好的效能。

專案已開源,名叫「賈維斯」

目前,HuggingGPT的論文已經發布,專案則正在建設中,程式碼只開源了一部分,已攬獲1.4k標星。

我們注意到,它的專案名稱很有意思,不叫本名HuggingGPT,而是鋼鐵人裡的AI管家賈維斯(JARVIS)。

HuggingGPT火了:一個ChatGPT控制所有AI模型,自動幫人完成AI任務,網友:留口飯吃吧

有人發現它和3月份剛發布的Visual ChatGPT的想法非常像:後者HuggingGPT,主要是可調用的模型範圍擴展到了更多,包括數量和類型。

HuggingGPT火了:一個ChatGPT控制所有AI模型,自動幫人完成AI任務,網友:留口飯吃吧

不錯,其實它們都有一個共同作者:微軟亞研院。

具體而言,Visual ChatGPT的一作是M​​SRA資深研究員吳晨飛,通訊作者為MSRA首席研究員段楠。

HuggingGPT則包含兩位共同一作:

Shen Yongliang,TA來自浙江大學,在MSRA實習期間完成此工作;

Song Kaitao,MSRA研究員。

其通訊作者為浙大計算機系教授莊越挺。

HuggingGPT火了:一個ChatGPT控制所有AI模型,自動幫人完成AI任務,網友:留口飯吃吧

最後,對於這個強大新工具的誕生,網友們很是興奮,有人表示:

ChatGPT已成為人類創建的所有AI的總指揮官了。

HuggingGPT火了:一個ChatGPT控制所有AI模型,自動幫人完成AI任務,網友:留口飯吃吧

也有人據此認為:

AGI可能不是LLM,而是由一個「中間人」LLM連接的多個相互關聯的模型。

HuggingGPT火了:一個ChatGPT控制所有AI模型,自動幫人完成AI任務,網友:留口飯吃吧

那麼,我們是否已經開啟「半AGI」的時代了?

HuggingGPT火了:一個ChatGPT控制所有AI模型,自動幫人完成AI任務,網友:留口飯吃吧

論文網址:https://www.php.cn/link/1ecdec353419f6d7e30857d00d0312d1
#計畫連結:https://www.php.cn/link/859555c74e9afd45ab771c615c1e49a6

#參考連結:#https://www.php.cn/ link/62d2b7ba91f34c0ac08aa11c359a8d2c

#

以上是HuggingGPT火了:一個ChatGPT控制所有AI模型,自動幫人完成AI任務,網友:留口飯吃吧的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1664
14
CakePHP 教程
1423
52
Laravel 教程
1319
25
PHP教程
1269
29
C# 教程
1248
24
如何理解C  中的DMA操作? 如何理解C 中的DMA操作? Apr 28, 2025 pm 10:09 PM

DMA在C 中是指DirectMemoryAccess,直接內存訪問技術,允許硬件設備直接與內存進行數據傳輸,不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序,實現方式因係統而異。 2)直接訪問內存可能帶來安全風險,需確保代碼的正確性和安全性。 3)DMA可提高性能,但使用不當可能導致系統性能下降。通過實踐和學習,可以掌握DMA的使用技巧,在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

C  中的chrono庫如何使用? C 中的chrono庫如何使用? Apr 28, 2025 pm 10:18 PM

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

怎樣在C  中處理高DPI顯示? 怎樣在C 中處理高DPI顯示? Apr 28, 2025 pm 09:57 PM

在C 中處理高DPI顯示可以通過以下步驟實現:1)理解DPI和縮放,使用操作系統API獲取DPI信息並調整圖形輸出;2)處理跨平台兼容性,使用如SDL或Qt的跨平台圖形庫;3)進行性能優化,通過緩存、硬件加速和動態調整細節級別來提升性能;4)解決常見問題,如模糊文本和界面元素過小,通過正確應用DPI縮放來解決。

C  中的實時操作系統編程是什麼? C 中的實時操作系統編程是什麼? Apr 28, 2025 pm 10:15 PM

C 在實時操作系統(RTOS)編程中表現出色,提供了高效的執行效率和精確的時間管理。 1)C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2)利用面向對象特性,C 可以設計靈活的任務調度系統。 3)C 支持高效的中斷處理,但需避免動態內存分配和異常處理以保證實時性。 4)模板編程和內聯函數有助於性能優化。 5)實際應用中,C 可用於實現高效的日誌系統。

怎樣在C  中測量線程性能? 怎樣在C 中測量線程性能? Apr 28, 2025 pm 10:21 PM

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析,步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析,步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能,並優化代碼。

量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 Apr 30, 2025 pm 07:24 PM

交易所內置量化工具包括:1. Binance(幣安):提供Binance Futures量化模塊,低手續費,支持AI輔助交易。 2. OKX(歐易):支持多賬戶管理和智能訂單路由,提供機構級風控。獨立量化策略平台有:3. 3Commas:拖拽式策略生成器,適用於多平台對沖套利。 4. Quadency:專業級算法策略庫,支持自定義風險閾值。 5. Pionex:內置16 預設策略,低交易手續費。垂直領域工具包括:6. Cryptohopper:雲端量化平台,支持150 技術指標。 7. Bitsgap:

給MySQL表添加和刪除字段的操作步驟 給MySQL表添加和刪除字段的操作步驟 Apr 29, 2025 pm 04:15 PM

在MySQL中,添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column,刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時,需指定位置以優化查詢性能和數據結構;刪除字段前需確認操作不可逆;使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。

C  中的字符串流如何使用? C 中的字符串流如何使用? Apr 28, 2025 pm 09:12 PM

C 中使用字符串流的主要步驟和注意事項如下:1.創建輸出字符串流並轉換數據,如將整數轉換為字符串。 2.應用於復雜數據結構的序列化,如將vector轉換為字符串。 3.注意性能問題,避免在處理大量數據時頻繁使用字符串流,可考慮使用std::string的append方法。 4.注意內存管理,避免頻繁創建和銷毀字符串流對象,可以重用或使用std::stringstream。

See all articles