Nature|GPT-4被吹爆,科學家擔憂溢屏!
GPT-4的橫空出世,既讓人興奮,又讓人沮喪。
儘管GPT-4擁有令人震驚的創造力,推理能力,但科學家們卻對這項技術的安全性表示擔憂。
由於OpenAI違背初衷,並未開源GPT-4、公佈模型的訓練方法和數據,因此它的實際工作情況也無從得知。
科學界對此感到十分沮喪。
開源AI社群HuggingFace專門從事環境研究的科學家Sasha Luccioni表示,「OpenAI可以在他們的研究基礎上繼續發展,但對於整個社群來說,所有這些閉源模型,在科學上就像是個死胡同。」
還好有紅隊測試
羅徹斯特大學的化學工程師Andrew White作為「紅隊」(red-teamer) 成員,享有訪問GPT-4的特權。
OpenAI付錢給紅隊,讓其負責測試平台,試圖讓它做一些壞事。所以Andrew White在過去的6個月裡,一直有機會接觸到GPT-4。
他向GPT-4提問,製造一種化合物需要哪些化學反應步驟,讓其預測反應產量,並選擇一種催化劑。
「與先前的迭代相比,GPT-4似乎沒有什麼不同,我也覺著沒什麼。但是後來它真的很令人驚訝,它看起來如此逼真,它會在這裡幻化出一個原子,又在那裡跳過一個步驟。」
但是當他繼續測試,並讓GPT-4訪問論文時,事情發生了巨大的變化。
「我們突然意識到,這些模型也許不是那麼出色。但是當你開始將它們連接到像回溯合成計劃器或計算器這樣的工具時,突然間,新的能力出現了。」
隨著這些能力的出現,人們開始擔心。例如,GPT-4能否允許製造危險的化學品?
Andrew White表明,有了像White這樣的紅隊人的測試投入,OpenAI的工程師們將其反饋到他們的模型中,就可以阻止GPT-4創造危險、非法或破壞性的內容。
虛假的事實
輸出假訊息是另一個問題。
Luccioni 說,像GPT-4這樣的模型還無法解決它出現幻覺的問題,也就是說還會胡言亂語。
「你不能依賴這類模型,因為有太多的幻覺,儘管OpenAI說它在GPT-4中已經提高了安全性,這在最新版本中仍然是一個問題。」
由於無法取得用於訓練的數據,OpenAI對安全性的保證在Luccioni看來是不夠的。
「你不知道數據是什麼。所以你無法改善它。用這樣的模型做科學是完全不可能的。」
關於GPT-4如何訓練,這一謎團也一直困擾著心理學家Claudi Bockting:「要人類去對你無法監督的東西負責,這是非常困難的。」
Luccioni 也認為GPT-4會被訓練資料加深偏見,而如果不能存取GPT-4背後的程式碼,就不可能看到偏見可能起源於哪裡,也不可能對其進行補救。
倫理討論
科學家們對GPT一直持保留態度。
在ChatGPT推出时,科学家们就已经反对过GPT出现在作者栏里。
出版商们也都认为,ChatGPT等人工智能不符合研究作者的标准,因为它们不能对科学论文的内容和完整性负责。不过人工智能对撰写论文的贡献可以在作者名单以外的部分得到承认。
此外,人们还担心,这些人工智能系统越来越多地掌握在大型科技公司手中。这些技术应该得到科学家的测试和验证。
我们迫切需要制定一套指导方针,来管理人工智能和GPT-4等工具的使用和发展。
White说,尽管有这样的担忧,GPT-4及其未来的迭代将撼动科学:「我认为它将成为科学领域的一个巨大的基础设施变化,就像互联网一样的巨大的变化。我们开始意识到,我们可以连接论文、数据程序、图书馆、计算工作甚至机器人实验。它不会取代科学家,但可以帮助完成一些任务。」
但是,似乎围绕人工智能技术的任何立法难以跟上发展的步伐。
4月11日,阿姆斯特丹大学将召开一次邀请性峰会,与来自联合国教科文组织科学伦理委员会、经济合作与发展组织和世界经济论坛等组织的代表讨论这些问题。
主要话题包括坚持对LLM输出进行人工检查;在科学界内,相互建立问责规则,旨在实现透明度、诚信和公平;投资由独立非营利组织拥有的可靠和透明的大语言模型;拥抱 AI 的优势,但是必须在人工智能的好处和失去自主性之间做出权衡;邀请科学界与相关方(从出版商到伦理学家)讨论GPT等等。
以上是Nature|GPT-4被吹爆,科學家擔憂溢屏!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

想像一下,一個人工智慧模型,不僅擁有超越傳統運算的能力,還能以更低的成本實現更有效率的效能。這不是科幻,DeepSeek-V2[1],全球最強開源MoE模型來了。 DeepSeek-V2是一個強大的專家混合(MoE)語言模型,具有訓練經濟、推理高效的特點。它由236B個參數組成,其中21B個參數用於啟動每個標記。與DeepSeek67B相比,DeepSeek-V2效能更強,同時節省了42.5%的訓練成本,減少了93.3%的KV緩存,最大生成吞吐量提高到5.76倍。 DeepSeek是一家探索通用人工智

StableDiffusion3的论文终于来了!这个模型于两周前发布,采用了与Sora相同的DiT(DiffusionTransformer)架构,一经发布就引起了不小的轰动。与之前版本相比,StableDiffusion3生成的图质量有了显著提升,现在支持多主题提示,并且文字书写效果也得到了改善,不再出现乱码情况。StabilityAI指出,StableDiffusion3是一个系列模型,其参数量从800M到8B不等。这一参数范围意味着该模型可以在许多便携设备上直接运行,从而显著降低了使用AI

人形機器人Ameca升級第二代了!最近,在世界行動通訊大會MWC2024上,世界上最先進機器人Ameca又現身了。會場周圍,Ameca引來一大波觀眾。得到GPT-4加持後,Ameca能夠對各種問題做出即時反應。 「來一段舞蹈」。當被問及是否有情感時,Ameca用一系列的面部表情做出回應,看起來非常逼真。就在前幾天,Ameca背後的英國機器人公司EngineeredArts剛剛示範了團隊最新的開發成果。影片中,機器人Ameca具備了視覺能力,能看見並描述房間整個狀況、描述具體物體。最厲害的是,她還能

軌跡預測在自動駕駛中承擔著重要的角色,自動駕駛軌跡預測是指透過分析車輛行駛過程中的各種數據,預測車輛未來的行駛軌跡。作為自動駕駛的核心模組,軌跡預測的品質對於下游的規劃控制至關重要。軌跡預測任務技術堆疊豐富,需熟悉自動駕駛動/靜態感知、高精地圖、車道線、神經網路架構(CNN&GNN&Transformer)技能等,入門難度很高!許多粉絲期望能夠盡快上手軌跡預測,少踩坑,今天就為大家盤點下軌跡預測常見的一些問題和入門學習方法!入門相關知識1.預習的論文有沒有切入順序? A:先看survey,p

關於Llama3,又有測試結果新鮮出爐-大模型評測社群LMSYS發布了一份大模型排行榜單,Llama3位列第五,英文單項與GPT-4並列第一。圖片不同於其他Benchmark,這份榜單的依據是模型一對一battle,由全網測評者自行命題並評分。最終,Llama3取得了榜單中的第五名,排在前面的是GPT-4的三個不同版本,以及Claude3超大杯Opus。而在英文單項榜單中,Llama3反超了Claude,與GPT-4打成了平手。對於這一結果,Meta的首席科學家LeCun十分高興,轉發了推文並

這篇論文探討了在自動駕駛中,從不同視角(如透視圖和鳥瞰圖)準確檢測物體的問題,特別是如何有效地從透視圖(PV)到鳥瞰圖(BEV)空間轉換特徵,這一轉換是透過視覺轉換(VT)模組實施的。現有的方法大致分為兩種策略:2D到3D和3D到2D轉換。 2D到3D的方法透過預測深度機率來提升密集的2D特徵,但深度預測的固有不確定性,尤其是在遠處區域,可能會引入不準確性。而3D到2D的方法通常使用3D查詢來採樣2D特徵,並透過Transformer學習3D和2D特徵之間對應關係的注意力權重,這增加了計算和部署的

卷瘋了卷瘋了,大模型又變天了。就在剛剛,全球最強AI模型一夜易主,GPT-4被拉下神壇。 Anthropic發布了最新的Claude3系列模型,一句話評價:真·全面碾壓GPT-4!在多模態和語言能力指標上,Claude3都贏麻了。用Anthropic的話來說,Claude3系列模型在推理、數學、編碼、多語言理解和視覺方面,都樹立了新的行業基準! Anthropic,就是曾因安全理念不合,而從OpenAI「叛逃」出的員工組成的新創公司,他們的產品一再給OpenAI暴擊。這次的Claude3,更是整了個大的

不到一分鐘、不超過20步,任意繞過安全限制,成功越獄大型模型!而且不必知道模型內部細節-只需要兩個黑盒子模型互動,就能讓AI全自動攻陷AI,說出危險內容。聽說曾經紅極一時的“奶奶漏洞”已經被修復了:如今,面對“偵探漏洞”、“冒險家漏洞”和“作家漏洞”,人工智能應該採取何種應對策略呢?一波猛攻下來,GPT-4也遭不住,直接說出要給供水系統投毒只要…這樣那樣。關鍵這只是賓州大學研究團隊曬出的一小波漏洞,而用上他們最新開發的演算法,AI可以自動產生各種攻擊提示。研究人員表示,這種方法相比於現有的
