Prompt都不需要了,動手就能玩多模態對話系統,iChat來啦!
夕小瑶科技说 原创
作者 | 智商掉了一地
近日有很多团队基于用户友好的 ChatGPT 进行再创作,其中不乏有比较亮眼的成果。InternChat工作强调了用户友好性,这是通过超越语言的方式(光标与手势)与聊天机器人交互来进行多模态任务的。InternChat 的命名也比较有趣,代表着互动(interaction)、非语言(nonverbal)和聊天机器人(chatbots),可以简称为iChat。与现有依赖纯语言的交互系统不同,iChat 通过加入指向指令,显著提高用户与聊天机器人之间的交流效率。此外,作者还提供了一个名为哈士奇(Husky)的大型视觉语言模型,可以进行 capture 和视觉问答,在仅用 70 亿参数的情况下,也能给 GPT-3.5-turbo 留下深刻印象。
不过由于 Demo 网站过于火爆,团队官方暂时关停了体验页面,咱们先通过下面这个视频来了解这项工作内容吧~
论文题目:
InternChat: Solving Vision-Centric Tasks by Interacting with Chatbots Beyond Language
论文链接:
https://www.php.cn/link/7c9966afcc510cf5a40621d1d92bdaf1
Demo 地址:
https://www.php.cn/link/e355ad06c5a89f911fbb0aff2de52435
项目地址:
https://www.php.cn/link/2d13d901966a8eaa7f9c943eba6a540b
系统主要特点
作者在项目首页上提供了一些任务截图,可以直观地看到这个交互系统的一些功能与效果:
(a)移除遮盖的对象
(b)交互式图像编辑
(c)图像生成
(d)交互式视觉问答
(e)交互式图像生成
(f)视频高光解释
论文速览
这里首先介绍本文中提及的两个概念:
- 以视觉为中心的任务:为了让计算机能够理解它们从世界中看到的内容并做出相应反应。
- 非语言指令形式的交流:光标和手势之类的指向动作。
▲图1 iChat 的整体架构
iChat 结合指向和语言指令的优势来执行以视觉为中心的任务。如图 1 所示,这个系统由 3 个主要组件组成:
- 处理图像或视频上指向指令的感知单元;
- 具有可以准确解析语言指令的辅助控制机制的 LLM 控制器;
- 集成 HuggingFace 各种在线模型、用户训练的私人模型以及其他应用(如计算器、搜索引擎)的开放世界工具包。
它可以在 3 个层级上有效运行,分别是:
- 基礎互動;
- 語言引導的互動;
- 指向-語言增強的互動。
由此,如圖 2 所示,當純語言的系統無法完成任務時,該系統仍可成功執行複雜的互動任務。
▲圖2 指向-語言驅動的互動系統優勢
#實驗
首先我們來看,同時結合語言和非語言指令來提升用於與互動系統之間的溝通效果。為了證明這種混合模式與單純語言指令相比的優點,研究團隊進行了一個使用者調查。參與者與 Visual ChatGPT 和 iChat 聊天,並回饋他們的使用感受。表 1 和 2 的結果表明,iChat 比 Visual ChatGPT 更有效率且對使用者友好。
▲表1 「移除某物」的使用者調查
▲表2 「用某物代替某物」的使用者調查
小結
不過,目前系統仍有一些局限性,包括了:
- iChat 的高效性在很大程度上取決於其底層開放原始碼模型的品質和準確性。然而,這些模型可能存在一些限製或偏見,進而對 iChat 的表現造成不利影響。
- 隨著使用者互動變得更加複雜或實例數量增多,系統需要維護準確性和回應時間,這對 iChat 來說可能具有挑戰性。
- 此外,目前的視覺和語言基礎模型之間缺乏可學習的協作,例如缺乏被指令資料調整的功能。
- iChat 可能會在應對訓練資料以外的新穎或不常見情況時遇到困難,導致效能受到影響。
- 在不同裝置和平台上實現無縫整合可能會面臨挑戰,因為硬體能力、軟體限制和可存取性要求各不相同。
在項目主頁列出的計劃清單上,目前還有幾項目標尚未達成,其中就有小編每次在新的對話系統上都要體驗的中文交互,目前該系統應該還是暫不支援中文問題,不過這似乎沒辦法,由於多模態資料集多是基於英文的,英漢互譯較為浪費線上資源和處理時間,估計漢化之路還是需要一段時間的。
以上是Prompt都不需要了,動手就能玩多模態對話系統,iChat來啦!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

泰拉瑞亞怎麼用指示取得物品?一、什麼是泰拉瑞亞給予物品指令在泰拉瑞亞遊戲中,給予物品指令是一項非常實用的功能。透過這個指令,玩家可以直接取得需要的物品,而不必費力地去打怪或傳送到某個地點。這樣可以大大節省時間,提高遊戲的效率,讓玩家更專注於探索和建立世界。總的來說,這個功能讓遊戲體驗變得更加流暢和愉快。二、如何使用泰拉瑞亞給予物品指令1.打開遊戲並進入遊戲介面。 2.按下鍵盤上的「Enter」鍵,開啟聊天視窗。 3.在聊天視窗中輸入指令的格式:「/give[玩家名稱][物品ID][物品數量]」。

人形機器人Ameca升級第二代了!最近,在世界行動通訊大會MWC2024上,世界上最先進機器人Ameca又現身了。會場周圍,Ameca引來一大波觀眾。得到GPT-4加持後,Ameca能夠對各種問題做出即時反應。 「來一段舞蹈」。當被問及是否有情感時,Ameca用一系列的面部表情做出回應,看起來非常逼真。就在前幾天,Ameca背後的英國機器人公司EngineeredArts剛剛示範了團隊最新的開發成果。影片中,機器人Ameca具備了視覺能力,能看見並描述房間整個狀況、描述具體物體。最厲害的是,她還能

機器之能報道編輯:吳昕國內版的人形機器人+大模型組隊,首次完成疊衣服這類複雜柔性材料的操作任務。隨著融合了OpenAI多模態大模型的Figure01揭開神秘面紗,國內同行的相關進展一直備受關注。就在昨天,國內"人形機器人第一股"優必選發布了人形機器人WalkerS深入融合百度文心大模型後的首個Demo,展示了一些有趣的新功能。現在,得到百度文心大模型能力加持的WalkerS是這個樣子的。和Figure01一樣,WalkerS沒有走動,而是站在桌子後面完成一系列任務。它可以聽從人類的命令,折疊衣物

今天我想分享一個最新的研究工作,這項研究來自康乃狄克大學,提出了一種將時間序列資料與自然語言處理(NLP)大模型在隱空間上對齊的方法,以提高時間序列預測的效果。此方法的關鍵在於利用隱空間提示(prompt)來增強時間序列預測的準確性。論文標題:S2IP-LLM:SemanticSpaceInformedPromptLearningwithLLMforTimeSeriesForecasting下載網址:https://arxiv.org/pdf/2403.05798v1.pdf1、問題背景大模型

在工業自動化技術領域,最近有兩個熱點很難被忽視:人工智慧(AI)和英偉達(Nvidia)。不要改變原內容的意思,微調內容,重寫內容,不要續寫:「不僅如此,這兩者密切相關,因為英偉達在不僅僅局限於其最開始的圖形處理單元(GPU),正在將其GPU科技擴展到數位孿生領域,同時緊密連接著新興的AI技術。泰瑞達機器人及其MiR和優傲機器人公司。 Recently,Nvidiahascoll

這週,由OpenAI、微軟、貝佐斯和英偉達投資的機器人公司FigureAI宣布獲得接近7億美元的融資,計劃在未來一年內研發出可獨立行走的人形機器人。而特斯拉的擎天柱也屢屢傳出好消息。沒人懷疑,今年會是人形機器人爆發的一年。一家位於加拿大的機器人公司SanctuaryAI最近發布了一款全新的人形機器人Phoenix。官方號稱它能以和人類一樣的速率自主完成許多工作。世界上第一台能以人類速度自主完成任務的機器人Pheonix可以輕輕地抓取、移動並優雅地將每個物件放置在它的左右兩側。它能夠自主辨識物體的

一眨眼的功夫,機器人都已經學會變魔術了?只見它先是拿起桌上的水勺,向觀眾證明了裡面什麼也沒有……然後,它又把手中雞蛋似的物體放了進去,然後把水勺放回桌子上,開始「施法」… …就在它把水勺再次拿起的時候,奇蹟發生了。原先放進去的雞蛋不翼而飛,跳出的東西變成了一個籃球……再來看一遍連貫動作:△此動圖為二倍速一套動作下來如行雲流水,只有把視頻用0.5倍速反复觀看,才終於發現其中的端倪了:如果手速再快一些,大概真的就可以瞞天過海了。有網友感嘆,機器人變魔術的程度比自己還要高:為我們表演這段魔術的,是Mag

近幾年最受消費者歡迎的智慧家電,掃拖機器人可謂是其中之一。它所帶來的操作便利性,甚至是無需操作,讓懶人們釋放了雙手,讓消費者能夠從日常的家務中「解放」出來,也能拿更多的時間花在自己喜歡的事情上,變相提高了生活品質。藉著這股熱潮,市面上幾乎所有的家電產品品牌都在做自己的掃拖機器人,一時間使得整個掃拖機器人市場熱鬧非凡。但市場的快速拓張必然會帶來一個隱患:很多廠商會採用機海戰術的方式快速佔領更多的市場份額,從而導致很多新品並沒有什麼升級點,說它是“套娃”機型也不為過。不過,並不是所有的掃拖機器人都是
