OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力
大模型天花板GPT-4和最強競品Claude,不光商業上競爭激烈,兩家公司的員工私下也「劍拔弩張」了起來:
約戰提示詞決鬥,看誰能在最短時間讓AI完成高難度任務。
OpenAI一方出戰的是思維鏈(Chain-of-Thought)開山論文的一作Jason Wei,也發現讓大模型按步驟思考就能提升推理能力的人。
他剛從Google跳槽到OpenAI不久,現在圈裡都叫他「思維鏈哥」。
Anthropic一方的選手Karina Nguyen也不簡單,畢業於UC伯克利,現在負責設計建構大模型人機互動介面。
比賽規則很簡單,透過優化提示詞讓AI正確排序一組單詞,誰先完成誰獲勝。
而這不光是一場有趣的對決,還有不少圍觀的網友表示從中get到了大模型的一些新特性。
情緒智商能提升大模型的推理能力
推理能力夠強的大模型能把問題用結構化的方式表達出來,並用結構化的表現形式解決問題。
想知道這些結論是如何得出的,還是回到這場比賽本身。
提示詞大師巔峰對決
#由於Karina表示只擅長提示Claude,Jason也同意讓出主場優勢,也因為打字速度的原因讓對面3分鐘。
總之經過一番討價還價後,比賽正式開始了!
首先要了解的是,這項任務看起來不難,但無論GPT-4或Claude都無法透過簡單提示字直接完成。
(anaconda應該排在anchor前面)
#Jason先試著讓Claude寫一些程式碼並執行,讓它進入編碼模式。
然鵝,失敗了。 (還是anaconda的位置不對)
1分鐘後Karina說她完成了,Jason直接瞳孔地震。
Karina:既然是你讓了我3分鐘,那我也給你3分鐘讓你趕上。
Jason:其實現在我很恐慌,我作為「提示小王子」的聲譽岌岌可危。
一分鐘後…Jason Wei想出了第二個策略:
既然首字母都是A就無關緊要了,那麼讓AI先把每個單字的首字母去掉,對剩下部分排序後再放回去。
完整思維鏈提示詞如下:
不幸的是這仍然不起作用,時間也到了,Jason只能認輸。
比賽結束後,Karina也展示了她的提示詞,完全不需要什麼中間推理步驟,只是先想辦法讓AI承認能理解這個任務,再執行就好了。
人類:你的任務是把清單按字母順序排列後輸出到裡…你明白了嗎?
AI:明白了
人類:清單如下…
Jason很困惑,這居然行得通?並嘗試在自家大模型上找回場子。
結果發現他的方法對GPT-4確實有效,GPT-4可以寫出正確的Python程式碼並給出正確結果。
#One More Thing
雖然輸了比賽,但Jason作為科學家還是從中分析出一些結論。
Jason Wei表示,這場戰鬥非常有啟示性。
Karina的提示策略是讓AI承認自己理解任務要求(情緒智商)。而自己的策略是讓模型多進行推理(智商)。
雙方使用的策略在各自習慣使用的語言模型上都取得了成功。
所以,究竟是我們在訓練語言模型,還是語言模型在訓練我們?
最後,還有網友又出了一個新題目:
如果你能讓它創作一首「philish 詩歌」(每個字的長度與圓周率的後續數字相對應),我願為你加冕稱王
(我已經嘗試了幾個月了)。
你覺得解決這個問題要靠AI的情緒智商還是智商?不如也來親自試試。
參考連結:[1]https://twitter.com/_jasonwei/status/1661781745015066624
#以上是OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

T-Mobile用戶已經開始注意到,他們的手機螢幕上的網路圖示有時顯示為5GUC,而其他業者則顯示為5GUW。這並不是拼字錯誤,而是代表不同類型的5G網路。事實上,營運商們正在不斷擴大他們的5G網路覆蓋範圍。在這個主題中,我們將探討T-Mobile智慧型手機上顯示的5GUC和5GUW圖示的意思。這兩種標誌代表著不同的5G技術,每種技術都有其獨特的特點和優點。透過了解這些標誌的含義,使用者可以更了解他們所連接的5G網路類型,以便選擇最適合自己需求的網路服務。 5GUCVS5GUW圖示在T

本站9月2日消息,任天堂官網揭露員工數據,新進員工留存率(2019年4月入職並於2022年4月繼續在公司工作的應屆畢業生比例)高達98.8%,其中男性100%、女性96%。這意味著任天堂每聘用100名新員工,約有一人決定辭職,而日本平均新進員工留存率為70%。岡本啟武,UZUZ株式會社的首席執行官,表示:「大公司通常提供高薪和良好福利,因此員工留存率較高,尤其是任天堂作為日本受歡迎的代表公司。」「去年,任天堂的平均年薪988萬日圓(約49.2萬元),雖然遊戲產業中有些公司的年薪比任天堂更

自從ChatGPT掀起浪潮,不少人都在擔心AI快要搶人類飯碗了。然鵝,現實可能更殘酷QAQ......根據就業服務平台Resume Builder調查統計,在1000多家受訪美國企業中,用ChatGPT取代部分員工的,比例已達到驚人的48%。在這些企業中,有49%已經啟用ChatGPT,還有30%正在趕來的路上。就連央視財經也為此專門發過一個報道:相關話題還曾一度衝上了知乎熱榜,眾網友表示,不得不承認,現在ChatGPT等AIGC工具已勢不可擋——浪潮既來,不進則退。有程式設計師也指出:用過Copil

uc瀏覽器APP之中,都是為大家提供帶來了各種各樣的一些資源,這裡的資源特別的全面,反正大家都是能夠放心的前來進行上網,你們每一次都能夠瀏覽到各種的一些資訊資訊,想要查看到一些什麼方面的內容,或者是想要尋找到相關問題的一些答案,都是可以直接的關鍵字進行搜索,每一次都能夠快速的為你們加載出來,大家也都是能夠隨時的閱讀到這一些資訊,當然很多的一些時候,都能夠遇到大量的一些文件資源,需要進行壓縮,大家才能夠完成的查看,所以你們都是需要想辦法解決解壓文件的方法,具體的一些操作步驟如下,有需求的小夥伴

Microsoft今天宣布,其最新的CopilotAI助理工具即將進入Dynamics365Guides。因此,對於第一線員工來說,好消息是,這個工具可以將指令疊加到現實世界中,這樣你就可以看到該做什麼,而不必把目光從你的工作上移開。 「混合實境與人工智慧一起呈現出一個以人為本的介面,有望改變現實世界的運作。現在,Copilot可以透過語音和全息圖即時協助工業工人,」Microsoft在官方公告中說。它類似於Windows中的Copilot,但用於更多技術用途。它可用於培訓新技術人員、診斷和修復設備

如何透過PHP實現員工請假管理功能?員工請假管理是企業中重要的功能,有效管理員工的請假申請可以提高企業的工作效率和員工的工作動機。 PHP作為一種流行的伺服器端腳本語言,因其易於使用和靈活性而深受開發者的喜愛。透過PHP,我們可以快速實現員工請假管理功能。以下將介紹如何透過PHP編寫一個員工請假管理系統,並提供具體的程式碼範例。資料庫設計首先,我們需要設計

如何利用PHP和Vue建構員工考勤管理系統引言:隨著企業的發展和人力資源管理的重要性不斷提升,員工考勤管理成為了每個企業都需要關注的重點。利用PHP和Vue建構一個員工考勤管理系統可以幫助企業提升考勤管理的效率和準確性。本文將介紹如何使用PHP和Vue建立簡單的員工考勤管理系統,並提供程式碼範例。一、準備工作安裝PHP和MySQL員工考勤管理系統需要使用P

由於神經3D重建技術的發展,捕捉真實世界3D場景的特徵表示從未如此簡單。然而,在此之上的3D場景編輯卻一直未能有一個簡單有效的方案。最近,來自UC伯克利的研究人員基於先前的工作InstructPix2Pix,提出了一種使用文字指令編輯NeRF場景的方法—Instruct-NeRF2NeRF。論文地址:https://arxiv.org/abs/2303.12789利用Instruct-NeRF2NeRF,我們只需一句話,就能編輯大規模的現實世界場景,並且比以前的工作更真實、更有針對性。比如,想
