搞科研新姿勢:讓GPT-3給你打下手

WBOY
發布: 2023-04-12 12:22:03
轉載
762 人瀏覽過

本文經AI新媒體量子位元(公眾號ID: QbitAI)授權轉載,轉載請聯絡出處

搞科研的最新姿勢,被一位華人小哥解鎖了-

告訴AI你的研究目標,再把資料集「投餵」進去,完事。

這是來自伯克利的博士生Zhong Ruiqi等人的最新研究,把從海量資料集中繁瑣的「取證」過程,統統交給GPT-3來解決:

搞科研新姿勢:讓GPT-3給你打下手

#他們也發現,這種用AI搞科研的方法不僅效率高,還能得出人類沒有想到的「意外驚喜」。

讓GPT-3幫你搞科研

那麼小哥他們為什麼突發奇想地要用這種方式搞科研呢?

這是因為他們發現,對大型語料庫做深入的挖掘確實能得到一些有用的結果,但這個過程要是讓人類來搞,那簡直就太費時費力了。

因此,他們便決定把這個繁瑣的過程交給GPT-3來處理,並把這個任務命名為「D5」:

Goal Driven Discovery of Distributional Differences via Language Descriptions.

透過語言描述,實現目標驅動的分散式差異的發現。

「D5」任務的過程,簡單來說就是兩個動作:

  • 輸入研究目標
  • 輸入兩個語料庫

搞科研新姿勢:讓GPT-3給你打下手

#例如在上面這個案例中,小哥先是給AI輸進去了兩個語料庫:

  • 語料庫A:服用藥物A後病患的反應報告
  • 語料庫B:服用藥物B後病患的反應報告

然後再向AI確定自己的研究目標,即「我想了解一下藥物A的副作用」。

在AI收到任務後,立刻開始執行分析工作,最後得出了它的結論:

語料庫A中的樣本,有更多的病人會提到「妄想症」(paranoia)。

不過試想一下,若讓人類科研人員做這項工作,光是了解語料庫A和B就需要花費大量的時間,更別提還得進一步做對比分析等工作了。

而D5任務之所以能夠做得如此絲滑,是因為小哥他們在此背後還做了不少工作。

例如建立OpenD5元資料集,它包含符合D5任務的675個開放式問題,所涉及領域涵蓋商業、社會科學、人文科學、健康和機器學習等。

搞科研新姿勢:讓GPT-3給你打下手

並且每個開放式問題都會對應一個語料庫對兒(語料庫A和語料庫B),平均有17000個樣本。

小哥也把每個語料庫中的50%當作研究部分,另外50%則是拿來做驗證。

基於此,小哥他們再構建了一個“D5系統”,它的工作原理和人類從數據庫中獲取發現類似,分為兩個階段,即創造性地提出一個假設,再在數據集上嚴格驗證這個假設。

依照這個思路,研究人員接下來用GPT-3做了次實驗。

他們先向GPT3展示研究目標和每個語料庫中的一些樣本,然後讓它提出一個假設清單。

最終實驗發現,GPT-3可以使用目標描述來提出更相關、更新穎、更有意義的假設。

搞科研新姿勢:讓GPT-3給你打下手

也正因為OpenD5資料集所涵蓋的領域眾多,因此小哥表示他們的D5系統具備應用範圍廣的特性。

也存在一些缺陷

但對於這套D5系統,小哥也直言不諱地道出了它的缺陷。

例如,若是語料庫中含有較多的俚語、俗語或帶有情緒的詞彙,那麼AI所給的「發現」就會有偏差。

簡而言之,就是AI對於特定情況的詞彙或描述產生了錯誤的理解和分析。

搞科研新姿勢:讓GPT-3給你打下手

除此之外,小哥也表示更靈活的語料庫、更具擴展性的系統,也是他們未來重點研究的方向。

不過似乎這項研究讓小哥也是興奮不已,畢竟離他「建構一個用AI稿科研」的夢想更近了一步。

搞科研新姿勢:讓GPT-3給你打下手

參考連結:

[1] https://www.php.cn/link/ b1adda14824f50ef24ff1c05bb66faf3
#[2] #https://www.php.cn/link/ec26fc2eb2b75aece19c70392#dc74c2#

以上是搞科研新姿勢:讓GPT-3給你打下手的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:51cto.com
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板