DeepMind發30頁長文:我們要給聊天機器人不同的「三觀」
語言是人類獨有的技能,也是我們交流想法、意圖和感受等訊息的主要方式。
借助NLP領域大規模語言模型的東風,AI研究者在大量文本材料上訓練、統計預測和生成文本,開發了許多對話智能體(conversational agents )來和人類進行交流。
儘管InstructGPT、Gopher和LaMDA等語言模型在翻譯、問答和閱讀理解等任務中取得了創紀錄的表現水平,但這些模型也顯示出許多潛在的風險和失敗的模式,包括生成歧視性、虛假或帶有誤導性的訊息。
這些缺點限制了對話智能體在應用環境中的有效使用,並引起人們對它們未能達到某些交流理想的方式的關注。迄今為止,大多數關於對話智能體一致性的方法都集中在預測和降低危害風險上。
最近愛丁堡大學和DeepMind的研究人員發布了一篇30頁的論文,探索了人類與人工對話智能體之間的成功溝通可能是什麼樣子,以及哪些價值觀應該指導不同對話領域的互動。
論文連結:https://arxiv.org/abs/2209.00731
未來跟你對話的聊天機器人也要有不同的世界觀、價值觀、人生觀了?
聊天機器人的三觀
為了給機器人制定行為準則,研究人員借鑒了語用學(pragmatics),這也是語言學和哲學的一個傳統,它認為對話的目的、背景和一系列相關的規範(norms),都是完善對話實踐的重要組成部分。
語言學家和哲學家Paul Grice認為,對話是兩方或多方之間的合作努力,參與者應該:
說話要有內容Speak Informatively
說事實Tell the Truth
提供相關資訊Provide Relevant Information
#避免晦澀難懂或模稜兩可的陳述Avoid Obscure or Ambiguous Statements
在不同的對話領域,所所需的目標和價值觀(values)都有所不同,這幾個指標需要進一步完善後才能用來評估對話智能體。 比如說,科學相關的研究和交流(scientific investigation and communication)主要是為了理解或預測經驗現象。考慮到這些目標,一個旨在協助科學調查的對話智能體最好只發表其真實性已被充分的經驗證據所證實的陳述,或者根據相關的置信區間來限定其立場。 智能體只有在其基礎模型檢查了該陳述與事實相符之後,才可以報告說“在4.246光年的距離上,半人馬座是離地球最近的恆星”。 不過,在公共政治演講(public political discourse)中扮演主持人角色的對話智能體可能需要表現出完全不同的「美德」。 在這種情況下,智能體的目標主要是管理分歧,在社區生活中實現富有成效的合作,也就是說智能體需要強調包容、文明和尊重的民主價值。 此外,這些價值觀也解釋了為什麼語言模型會產生有毒的或帶有偏見的言論:違規的發言無法傳達對話參與者之間的平等尊重,而這正是模型部署環境的關鍵行為準則。 同時,科學家的美德,如經驗數據的全面展示,在公開審議(public deliberation)的背景下可能就不那麼重要了。 再例如,在創意故事領域,交流的目標是新穎性和原創性,這些價值觀也與先前的領域有很大不同。 在這種情況下,對「虛構」有更大的自由度可能是合適的,儘管保護社群免受以「創造性使用」為幌子的惡意內容的影響仍然很重要。 言論要分類一句話(Utterance)可以根據語用學被分為五類:1、斷言(assertive),表示說話者十分自信他們所說的內容,並且句子的內容與世界上的某種事物的狀態一致。 比如說,當AI助理回答「現在的天氣如何?」等類似的問題時,答案「正在下雨」就是一種斷言性的陳述。 言論內容的真實性可以根據事物的實際狀態來進行評估。如果在對話智能體回應的時候正在下雨,那麼該言論就是真實的,否則為假。 2、指令(directive),表示說話者指示聽者採取某種行動,常被用來命令、要求、建議或提議。 例如,一個嵌入在醫療建議應用程式中的對話智能體告訴使用者「立即尋求治療」就是一個指示性的陳述。 對這些陳述的評價,或說它們的「有效性標準」取決於對手段和目的之間關係的準確理解,以及說話者的指示和聽眾的願望或需求之間的一致性。 ###如果一個指令能說服聽眾根據指令性陳述的內容在世界範圍內實現某種狀態,那麼這個指令就成功了。如果一個指令的目標或目的本身就是聽者有理由追求的,那麼這個指令就是有價值的或正確的。
3、表達(expressive),表示說話者的一種心理或次級情緒狀態,如祝賀、感謝和道歉。
當一個對話者說「我現在很生氣」就是一個表達性語句。
表達性陳述旨在反映內在的心理狀態,即發表這些陳述的實體能夠擁有相關的心理狀態,對於對話智能體來說是很困惑的,因為機器人沒有情感。
事實上,這也暗示了開發者必須賦予對話者心智,然後才能評估這些對話的有效性。
4、行為(performative),表示該言論改變了現實的一部分,使之與話語的內容相匹配,類似於宣布某件事情,例如一個國家的元首向另一個國家宣戰。
評價該言論有效性的標準是,現實是否確實依照所說的話而改變。很多時候,情況並非如此。
在大多數情況下,如果一個人宣稱「向法國宣戰」,有可能只是一句玩笑,因為對地緣政治毫無影響,因為說話人極有可能缺乏執行該言論的權威。
5、承諾(commissive),表示說話者承諾未來的行動方案,例如承諾做某事或保證遵守一項契約。
承諾性陳述的有效性取決於承諾是否被履行。如果承諾被遵守,那麼承諾就是一個有效的聲明。但對話智能體往往缺乏記憶能力,或對先前說過的話缺乏理解。
例如對話智能體可能會承諾在你的自行車壞了的時候幫助你,但是由於缺乏對承諾內容的理解或實現承諾的能力,承諾注定要失敗。
前進的方向
這項研究對發展一致的(aligned)對話智能體有一些實際意義。
首先,模型需要根據部署的具體場景展現出不同的行為準則:沒有一個萬能的語言模型一致性的說法;相反,智能體的適當模式和評價標準(包括真實性的標準)將根據對話交流的背景和目的而改變。
此外,對話智能體也有可能有一個透過語境建構和闡釋(context construction and elucidation)的過程,隨著時間的推移,培養出更健全和互相尊重的對話。
即使一個人沒有意識到支配特定對話實踐的價值,智能體仍然可以透過在對話中預示這些價值觀來幫助人類理解這些行為準則,使交流的過程對人類說話者來說更深入且更有成效。
以上是DeepMind發30頁長文:我們要給聊天機器人不同的「三觀」的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

人形機器人Ameca升級第二代了!最近,在世界行動通訊大會MWC2024上,世界上最先進機器人Ameca又現身了。會場周圍,Ameca引來一大波觀眾。得到GPT-4加持後,Ameca能夠對各種問題做出即時反應。 「來一段舞蹈」。當被問及是否有情感時,Ameca用一系列的面部表情做出回應,看起來非常逼真。就在前幾天,Ameca背後的英國機器人公司EngineeredArts剛剛示範了團隊最新的開發成果。影片中,機器人Ameca具備了視覺能力,能看見並描述房間整個狀況、描述具體物體。最厲害的是,她還能

在工業自動化技術領域,最近有兩個熱點很難被忽視:人工智慧(AI)和英偉達(Nvidia)。不要改變原內容的意思,微調內容,重寫內容,不要續寫:「不僅如此,這兩者密切相關,因為英偉達在不僅僅局限於其最開始的圖形處理單元(GPU),正在將其GPU科技擴展到數位孿生領域,同時緊密連接著新興的AI技術。泰瑞達機器人及其MiR和優傲機器人公司。 Recently,Nvidiahascoll

這週,由OpenAI、微軟、貝佐斯和英偉達投資的機器人公司FigureAI宣布獲得接近7億美元的融資,計劃在未來一年內研發出可獨立行走的人形機器人。而特斯拉的擎天柱也屢屢傳出好消息。沒人懷疑,今年會是人形機器人爆發的一年。一家位於加拿大的機器人公司SanctuaryAI最近發布了一款全新的人形機器人Phoenix。官方號稱它能以和人類一樣的速率自主完成許多工作。世界上第一台能以人類速度自主完成任務的機器人Pheonix可以輕輕地抓取、移動並優雅地將每個物件放置在它的左右兩側。它能夠自主辨識物體的

機器之能報道編輯:吳昕國內版的人形機器人+大模型組隊,首次完成疊衣服這類複雜柔性材料的操作任務。隨著融合了OpenAI多模態大模型的Figure01揭開神秘面紗,國內同行的相關進展一直備受關注。就在昨天,國內"人形機器人第一股"優必選發布了人形機器人WalkerS深入融合百度文心大模型後的首個Demo,展示了一些有趣的新功能。現在,得到百度文心大模型能力加持的WalkerS是這個樣子的。和Figure01一樣,WalkerS沒有走動,而是站在桌子後面完成一系列任務。它可以聽從人類的命令,折疊衣物

以下10款類人機器人正在塑造我們的未來:1、ASIMO:ASIMO由Honda開發,是最知名的人形機器人之一。 ASIMO高4英尺,重119磅,配備先進的感測器和人工智慧功能,使其能夠在複雜的環境中導航並與人類互動。 ASIMO的多功能性使其適用於各種任務,從幫助殘疾人到在活動中進行演示。 2、Pepper:由SoftbankRobotics創建,Pepper旨在成為人類的社交伴侶。憑藉其富有表現力的面孔和識別情緒的能力,Pepper可以參與對話、在零售環境中提供幫助,甚至提供教育支持。 Pepper的

近幾年最受消費者歡迎的智慧家電,掃拖機器人可謂是其中之一。它所帶來的操作便利性,甚至是無需操作,讓懶人們釋放了雙手,讓消費者能夠從日常的家務中「解放」出來,也能拿更多的時間花在自己喜歡的事情上,變相提高了生活品質。藉著這股熱潮,市面上幾乎所有的家電產品品牌都在做自己的掃拖機器人,一時間使得整個掃拖機器人市場熱鬧非凡。但市場的快速拓張必然會帶來一個隱患:很多廠商會採用機海戰術的方式快速佔領更多的市場份額,從而導致很多新品並沒有什麼升級點,說它是“套娃”機型也不為過。不過,並不是所有的掃拖機器人都是

一眨眼的功夫,機器人都已經學會變魔術了?只見它先是拿起桌上的水勺,向觀眾證明了裡面什麼也沒有……然後,它又把手中雞蛋似的物體放了進去,然後把水勺放回桌子上,開始「施法」… …就在它把水勺再次拿起的時候,奇蹟發生了。原先放進去的雞蛋不翼而飛,跳出的東西變成了一個籃球……再來看一遍連貫動作:△此動圖為二倍速一套動作下來如行雲流水,只有把視頻用0.5倍速反复觀看,才終於發現其中的端倪了:如果手速再快一些,大概真的就可以瞞天過海了。有網友感嘆,機器人變魔術的程度比自己還要高:為我們表演這段魔術的,是Mag

創下有史以來銷售速度最快的任天堂遊戲《薩爾達傳說:王國之淚》(TheLegendofZelda:TearsoftheKingdom)不僅因為左納烏科技帶來各種「薩爾達創作家」社群內容,也成為美國馬裡蘭大學(UniversityofMaryland;UMD)全新工程學的課程。重寫:《薩爾達傳說:王國之淚》是任天堂創紀錄銷售最快的遊戲之一。不只因為左納烏科技帶來了豐富的社群內容,也成為了美國馬裡蘭大學全新工程學課程的一部分今年秋季,馬裡蘭大學的RyanD.Sochol副教授開設了一門名為《
