「社交達人」GPT-4!解讀表情、揣測心理全都會
想像一下,您正在參加一個充滿活力的雞尾酒會,局間充滿了熱烈的談話聲和玻璃杯碰撞的叮噹聲。
此時,您作為一個悠閒的觀察者,怡然自得地躲在角落。然而,就算沒有處在聚會的中心,您還是可以輕鬆地弄清楚不同人之間的社會關係,了解正在發生的事情,甚至透過閱讀人們的言語和非言語線索來讀懂明里暗裡的社交訊息。
如果一個LLM能夠復現這種程度的社交能力呢?這不,Koko Mind就是這麼東西。
隨便打開一個視頻,模型就開始分析人物表情,得出人物情緒的結論。
然後,在右邊的prompt欄也可以提出問題,讓AI進一步分析影片中暗流湧動的社交謎題。
(說實話對有些人來說這都很難)
圖片
- Koko Mind包含了150個複雜的多方社交互動以及自由文字問題和答案。
為了確保資料的多樣性和可擴展性,並避免資料污染,所有社交互動、問題和答案均由GPT-4生成,並隨後由人類專家驗證。 -
分析資料基於三個不同的來源:
#GPT-4-only:此子集僅由GPT-4透過提示創建。
基於電影:為了避免資料污染,這部分資料是基於從2022年後上映的電影中提取的各種場景。 GPT-4負責塑造這些場景,在保留核心本質的同時添加了自己的元素。
- 三種資料來源的佔如下:
-
-
-
#對於每次社交互動,研究者都會提出各種問題,旨在探討以下幾個和社交理解息息相關的面向。 -
心理理論:評估對其他人心理狀態和觀點的理解的問題。 -
社會規範:旨在辨別情境中的社會價值觀和規範的問題。
社會關係:關注人際動態與關係。
- 反事實問題:旨在探索替代結果或可能性的假設查詢。
- 社會建議:提出與特定情況相關的建議或行動建議的問題。
研究者以text-davinci-003 作為參考,評估了AlpacaEval後的不同模型。 - 其中,研究人員從上下文中刪除了括號中的非語言線索(例如,緊張地喝咖啡等)。
以下則是一些有趣的要點:
#在兩個模型中,與Claude相比,GPT-4在識別獲勝模型方面表現出更大的確定性和信心。
##################當上下文沒有非語言線索,且互動要麼完全由GPT-4生成,要麼基於電影時,Claude的表現優於GPT- 4。 #####################而如果上下文包含了非語言線索,那麼GPT-4總是比Claude更好。 ###############(一個可能的解釋是,GPT-4是一種多模態模型可以更好地理解額外的非語言資訊。)###### #######在部落格中,研究人員繪製了表格,可以清楚的看到各個模型的表現。 ######圖片
結果雖然在很多方面都令人興奮,但也有一定的限制。首先, Koko Mind的規模相對較小,這可能會限制研究人員結論的廣泛適用性和全面性。
其次, Koko Mind中的所有互動都是由GPT-4產生的,需要手動驗證,這使得資料集難以擴展。
另外,雖然Koko Mind在資料集中提供了經過人工驗證的答案,研究人員在評估時沒有使用這些答案作為參考,並且由於這些答案是由GPT-4生成的,因此它們可能偏向GPT-4。
未來的研究可以集中在如何評估模型上具有經過人工驗證的機器生成的參考答案。
當然,雖說有這樣或那樣的限制,研究人員仍將Koko Mind視為未來與社會智慧、多模態語言模型等相關的研究的跳板。
以上是「社交達人」GPT-4!解讀表情、揣測心理全都會的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

想像一下,一個人工智慧模型,不僅擁有超越傳統運算的能力,還能以更低的成本實現更有效率的效能。這不是科幻,DeepSeek-V2[1],全球最強開源MoE模型來了。 DeepSeek-V2是一個強大的專家混合(MoE)語言模型,具有訓練經濟、推理高效的特點。它由236B個參數組成,其中21B個參數用於啟動每個標記。與DeepSeek67B相比,DeepSeek-V2效能更強,同時節省了42.5%的訓練成本,減少了93.3%的KV緩存,最大生成吞吐量提高到5.76倍。 DeepSeek是一家探索通用人工智

關於Llama3,又有測試結果新鮮出爐-大模型評測社群LMSYS發布了一份大模型排行榜單,Llama3位列第五,英文單項與GPT-4並列第一。圖片不同於其他Benchmark,這份榜單的依據是模型一對一battle,由全網測評者自行命題並評分。最終,Llama3取得了榜單中的第五名,排在前面的是GPT-4的三個不同版本,以及Claude3超大杯Opus。而在英文單項榜單中,Llama3反超了Claude,與GPT-4打成了平手。對於這一結果,Meta的首席科學家LeCun十分高興,轉發了推文並

人形機器人Ameca升級第二代了!最近,在世界行動通訊大會MWC2024上,世界上最先進機器人Ameca又現身了。會場周圍,Ameca引來一大波觀眾。得到GPT-4加持後,Ameca能夠對各種問題做出即時反應。 「來一段舞蹈」。當被問及是否有情感時,Ameca用一系列的面部表情做出回應,看起來非常逼真。就在前幾天,Ameca背後的英國機器人公司EngineeredArts剛剛示範了團隊最新的開發成果。影片中,機器人Ameca具備了視覺能力,能看見並描述房間整個狀況、描述具體物體。最厲害的是,她還能

卷瘋了卷瘋了,大模型又變天了。就在剛剛,全球最強AI模型一夜易主,GPT-4被拉下神壇。 Anthropic發布了最新的Claude3系列模型,一句話評價:真·全面碾壓GPT-4!在多模態和語言能力指標上,Claude3都贏麻了。用Anthropic的話來說,Claude3系列模型在推理、數學、編碼、多語言理解和視覺方面,都樹立了新的行業基準! Anthropic,就是曾因安全理念不合,而從OpenAI「叛逃」出的員工組成的新創公司,他們的產品一再給OpenAI暴擊。這次的Claude3,更是整了個大的

一覺醒來,工作的方式被徹底改變。微軟把AI神器GPT-4全面接入Office,這下ChatPPT、ChatWord、ChatExcel一家整整齊齊。 CEO納德拉在發表會上直接放話:今天,進入人機互動的新時代,重新發明生產力。新功能名叫Microsoft 365 Copilot(副駕駛),與改變了程式設計師的程式碼助手GitHub Copilot成為一個系列,繼續改變更多人。現在AI不光能自動做PPT,而且能根據Word文件的內容一鍵做出精美排版。甚至連上台時對著每一頁PPT該講什麼話,都給一起安排

開發ChatGPT的OpenAI公司在網站上展示了摩根士丹利進行的一個案例研究。其主題是「摩根士丹利財富管理部署GPT-4來組織其龐大的知識庫。」該案例研究引述摩根士丹利分析、數據與創新主管JeffMcMillan的話說,「該模型將為一個面向內部的聊天機器人提供動力,該機器人將對財富管理內容進行全面搜索,並有效地解鎖摩根士丹利財富管理的累積知識」。 McMillan進一步強調:「採用GPT-4,你基本上立刻就擁有了財富管理領域最博學的人的知識……可以把它想像成我們的首席投資策略師、首席全球經濟學家

不到一分鐘、不超過20步,任意繞過安全限制,成功越獄大型模型!而且不必知道模型內部細節-只需要兩個黑盒子模型互動,就能讓AI全自動攻陷AI,說出危險內容。聽說曾經紅極一時的“奶奶漏洞”已經被修復了:如今,面對“偵探漏洞”、“冒險家漏洞”和“作家漏洞”,人工智能應該採取何種應對策略呢?一波猛攻下來,GPT-4也遭不住,直接說出要給供水系統投毒只要…這樣那樣。關鍵這只是賓州大學研究團隊曬出的一小波漏洞,而用上他們最新開發的演算法,AI可以自動產生各種攻擊提示。研究人員表示,這種方法相比於現有的

《ComputerWorld》雜誌曾經寫過一篇文章,說“編程到1960年就會消失”,因為IBM開發了一種新語言FORTRAN,這種新語言可以讓工程師寫出他們所需的數學公式,然後提交給電腦運行,所以程式設計就會終結。圖片又過了幾年,我們聽到了一種新說法:任何業務人員都可以使用業務術語來描述自己的問題,告訴電腦要做什麼,使用這種叫做COBOL的程式語言,公司不再需要程式設計師了。後來,據說IBM開發了一門名為RPG的新程式語言,可以讓員工填寫表格並產生報告,因此大部分企業的程式設計需求都可以透過它來完成圖
