超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品-人工智慧-PHP中文網

多視覺任務的通用介面

首頁

科技週邊

人工智慧

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

PHPz

Oct 19, 2023 am 11:13 AM

ai 模型

GPT-4V來做目標偵測？網友實測：還沒準備好。

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

雖然偵測到的類別沒問題，但大多數邊界框都錯放了。

沒關係，有人會出手！

那個搶跑GPT-4看圖能力幾個月的迷你GPT-4升級啦－MiniGPT-v2。

△（左邊為GPT-4V生成，右邊為MiniGPT-v2生成）

而且只是一句簡單指令：[grounding] describe this image in detail就實現的結果。

不僅如此，還輕鬆處理各類視覺任務。

圈選一個物體，提示字前面加上 [identify] 可讓模型直接辨識出物體的名字。

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

當然也可以什麼都不加，直接問~

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

#MiniGPT-v2由來自MiniGPT-4的原班人馬（KAUST沙烏地阿拉伯阿卜杜拉國王科技大學）以及Meta的五位研究員共同開發。

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

上次MiniGPT-4剛出來就引發巨大關注，一時間伺服器被擠爆，如今GItHub專案已超22000 顆星。

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

此番升級，已經有網友開始用上了~

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

多視覺任務的通用介面

大模型作為各文本應用的通用介面，大家已經司空見慣了。受此靈感，研究團隊想要建立一個可用於多種視覺任務的統一介面，例如圖像描述、視覺問題解答等。

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

「如何在單一模型的條件下，使用簡單多模態指令來高效完成各類任務？」成為團隊需要解決的難題。

簡單來說，MiniGPT-v2由三個部分組成：視覺主幹、線性層和大型語言模型。

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

此模型以ViT視覺主幹為基礎，所有訓練階段都保持不變。從ViT中歸納出四個相鄰的視覺輸出標記，並透過線性圖層將它們投影到 LLaMA-2語言模型空間。

團隊建議在訓練模型為不同任務使用獨特的標識符，這樣一來大模型就能輕鬆分辨出每個任務指令，還能提高每個任務的學習效率。

訓練主要分為三個階段：預訓練－多任務訓練－多模式指令調整。

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

最終，MiniGPT-v2 在許多視覺問題解答和視覺接地基準測試中，成績都優於其他視覺語言通用模型。

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

最終這個模型可以完成多種視覺任務，例如目標物件描述、視覺定位、圖像說明、視覺問題解答以及從給定的輸入文字直接解析圖片對象。

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

有興趣的朋友，可戳下方Demo連結體驗：

https://minigpt-v2.github.io/
https://huggingface.co/spaces/Vision-CAIR/MiniGPT-v2

論文連結：https://arxiv.org/abs/2310.09478

GitHub連結：https://github.com/Vision-CAIR/MiniGPT-4

以上是超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

7844

Java教學

1649

CakePHP 教程

1403

Laravel 教程

1300

PHP教程

1241

Related knowledge

大宗交易的虛擬貨幣交易平台排行榜top10最新發布 Apr 22, 2025 am 08:18 AM

選擇大宗交易平台時應考慮以下因素：1. 流動性：優先選擇日均交易量超50億美元的平台。 2. 合規性：查看平台是否持有美國FinCEN、歐盟MiCA等牌照。 3. 安全性：冷錢包存儲比例和保險機制是關鍵指標。 4. 服務能力：是否提供專屬客戶經理和定制化交易工具。

數字貨幣交易所App前十名蘋果版下載入口匯總 Apr 22, 2025 am 09:27 AM

提供各種複雜的交易工具和市場分析。覆蓋 100 多個國家，日均衍生品交易量超 300 億美元，支持 300 多個交易對與 200 倍槓桿，技術實力強大，擁有龐大的全球用戶基礎，提供專業的交易平台、安全存儲解決方案以及豐富的交易對。

排名前十的虛擬貨幣交易app有哪些十大數字貨幣交易所平台推薦 Apr 22, 2025 pm 01:12 PM

2025年安全的數字貨幣交易所排名前十依次為：1. Binance，2. OKX，3. gate.io，4. Coinbase，5. Kraken，6. Huobi，7. Bitfinex，8. KuCoin，9. Bybit，10. Bitstamp，這些平台均採用了多層次的安全措施，包括冷熱錢包分離、多重簽名技術以及24/7的監控系統，確保用戶資金的安全。

穩定幣有哪些？穩定幣如何交易？ Apr 22, 2025 am 10:12 AM

常見的穩定幣有：1. 泰達幣（USDT），由Tether發行，與美元掛鉤，應用廣泛但透明性曾受質疑；2. 美元幣（USDC），由Circle和Coinbase發行，透明度高，受機構青睞；3. 戴幣（DAI），由MakerDAO發行，去中心化，DeFi領域受歡迎；4. 幣安美元（BUSD），由幣安和Paxos合作，交易和支付表現出色；5. 真實美元（TUSD），由TrustTo

目前有多少穩定幣交易所？穩定幣種類有多少？ Apr 22, 2025 am 10:09 AM

截至2025年，穩定幣交易所數量約為千家。 1. 法定貨幣支持的穩定幣包括USDT、USDC等。 2. 加密貨幣支持的穩定幣如DAI、sUSD。 3. 算法穩定幣如TerraUSD。 4. 還有混合型穩定幣。

幣圈十大交易所有哪些最新幣圈app推薦 Apr 24, 2025 am 11:57 AM

選擇可靠的交易所至關重要，Binance、OKX、Gate.io等十大交易所各具特色，CoinGecko、Crypto.com等新app也值得關注。

DLC是什麼幣 DLC幣前景怎麼樣 Apr 24, 2025 pm 12:03 PM

DLC幣是基於區塊鏈的加密貨幣，旨在提供高效、安全的交易平台，支持智能合約和跨鏈技術，適用於金融和支付領域。

2025下一個千倍幣可能有哪些 Apr 24, 2025 pm 01:45 PM

截至2025年4月，有七个加密货币项目被认为具有显著增长潜力：1. Filecoin（FIL）通过分布式存储网络实现快速发展；2. Aptos（APT）以高性能Layer 1公链吸引DApp开发者；3. Polygon（MATIC）提升以太坊网络性能；4. Chainlink（LINK）作为去中心化预言机网络满足智能合约需求；5. Avalanche（AVAX）以快速交易和

See all articles

超火迷你GPT-4視覺能力暴漲，GitHub兩萬星，華人團隊出品

多視覺任務的通用介面

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題