大模型時代如何捕捉不良內容?歐盟法案要求AI公司確保用戶知情權
在過去的 10 年裡,大型科技公司在許多技術上變得非常擅長:語言、預測、個人化、存檔、文字解析和資料處理。但它們在捕捉、標記和刪除有害內容方面仍然十分糟糕。對於在美國傳播的選舉和疫苗陰謀論,只需回顧過去兩年的事件,就能了解它們對現實世界造成的傷害。
這種差異引發了一些問題。為什麼科技公司在內容審核上沒有改進?他們可以被迫這麼做嗎?人工智慧的新進展會提高我們捕捉不良資訊的能力嗎?
大多數情況下,當科技公司被美國國會要求對傳播仇恨和錯誤訊息做出解釋時,它們往往會把自己失敗的原因歸咎於語言本身的複雜性。高層表示,在不同語言和背景下理解和防止上下文相關的仇恨言論是一項難度很高的任務。
馬克‧祖克柏(Mark Zuckerberg)最喜歡說的一句話是,科技公司不應該承擔解決世界上所有政治問題的責任。
(資料來源:STEPHANIE ARNETT/MITTR | GETTY IMAGES)
大多數公司目前同時使用技術和人工內容審核員,後者的工作被低估了,這反映在他們微薄的薪酬上。
例如,在 Facebook 上刪除的所有內容中,人工智慧目前負責了 97%。
然而,史丹佛網路觀測站的研究經理蕾妮·迪雷斯塔(Renee DiResta)說,人工智慧並不擅長解釋細微差別和背景,所以它不可能完全取代人類內容審查員,即使人類也不總是擅長解釋這些事情。
由於自動內容審核系統通常是根據英文資料進行訓練的,因此文化背景和語言也會帶來挑戰,難以有效處理其他語言的內容。
哈尼·法里德教授於加州大學柏克萊分校資訊學院提供了一個更為明顯的解釋。據法里德所言,由於內容審核不符合科技公司的經濟利益,因此它沒有跟上風險的發展。這一切都與貪婪有關。別再假裝這不是錢的問題了。 ”
由於聯邦監管的缺失,網路暴力的受害者很難要求平台承擔經濟責任。
內容審核似乎是科技公司和不良行為者之間一場永無止境的戰爭。當科技公司推出內容監管規則時,不良行為者通常會使用表情符號或故意拼字錯誤來避免被偵測。然後這些公司試圖堵住漏洞,人們再尋找新的漏洞,如此循環。
現在,大型語言模型來了...
現在的處境已經很難了。隨著生成式人工智慧和ChatGPT等大型語言模型的出現,情況可能會更加惡劣。生成式技術也有問題——例如,它傾向於自信地編造一些事情,並把它們作為事實呈現出來——但有一點是明確的:人工智慧在語言方面越來越強大了,非常強大。
雖然迪雷斯塔和法里德都很謹慎,但他們認為現在還為時過早去做出對事情如何發展的判斷。儘管許多像 GPT-4 和 Bard 這樣的大模型都有內建的內容審核過濾器,但它們仍然可能產生有毒的輸出,例如仇恨言論或如何製造炸彈的指令。
生成式人工智慧可使壞人在更大規模和更快速度上進行虛假資訊欺騙活動。考慮到人工智慧生成內容的識別和標記方法嚴重不足,這個情況非常可怕。
另一方面,最新的大型語言模型在文字解釋方面比之前的人工智慧系統要表現得更出色。理論上,它們可以用來促進自動內容審核的發展。
科技公司需要投資重新設計大型語言模型,以實現這一特定目標。儘管微軟等公司已開始研究此事,但尚未出現引人注目的活動。
法里德表示:「儘管我們已經看到了許多技術進步,但我對內容審核方面的任何改進都持懷疑態度。」
儘管大型語言模型發展迅速,但它們仍然面臨上下文理解方面的挑戰,這可能導致它們無法像人類審核員那樣準確地理解帖子和圖像之間的微小差別。跨文化的可擴展性和特殊性也帶來了問題。 「你會針對特定類型的小眾市場部署一種模型嗎?是按國家劃分的嗎?是按社區來做的嗎?這不是一個放之四海而皆準的問題,」迪雷斯塔說。
基於新技術的新工具
生成式人工智慧最終對線上資訊領域是有害還是有益,可能在很大程度上取決於科技公司能否拿出好的、被廣泛採用的工具來告訴我們內容是否是由人工智慧產生的。
迪雷斯塔告訴我說,檢測合成介質可能是需要優先考慮的技術挑戰,因為這很有挑戰性。這包括像數位浮水印這樣的方法,它指的是嵌入一段程式碼,作為一種永久性的標記,表明附加的內容是由人工智慧製作的。用於檢測人工智慧生成或操縱的貼文的自動化工具很有吸引力,因為與浮水印不同,它們不需要人工智慧生成內容的創建者主動標記。換句話說,目前嘗試辨識機器生成內容的工具的表現還不夠出色。
一些公司甚至提出了使用數學來安全地記錄資訊的加密簽名,例如一段內容是如何產生的,但這將依賴像水印這樣的自願披露技術。
歐盟上週剛提出的最新版《人工智慧法案》(AI Act)要求,使用生成式人工智慧的公司要在內容確實是由機器生成時通知用戶。在未來幾個月,我們可能會聽到更多有關新興工具的消息,因為對人工智慧生成內容透明度的需求正在增加。
支援:Ren
原文:
https://www.technologyreview.com/2023/05/15/1073019/catching-bad-content-in-the-age-of-ai/
以上是大模型時代如何捕捉不良內容?歐盟法案要求AI公司確保用戶知情權的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

5月30日,騰訊宣布旗下混元大模型全面升級,基於混元大模型的App「騰訊元寶」正式上線,蘋果及安卓應用程式商店皆可下載。相較於先前測試階段的混元小程式版本,面向工作效率場景,騰訊元寶提供了AI搜尋、AI總結、AI寫作等核心能力;面向日常生活場景,元寶的玩法也更加豐富,提供了多個特色AI應用,並新增了創建個人智能體等玩法。 「騰訊做大模型不爭一時之先。」騰訊雲副總裁、騰訊混元大模型負責人劉煜宏表示:「過去的一年,我們持續推進騰訊混元大模型的能力爬坡,在豐富、海量的業務場景中打磨技術,同時洞察用戶的真實需求

火山引擎總裁譚待企業要做好大模型落地,面臨模型效果、推理成本、落地難度的三大關鍵挑戰:既要有好的基礎大模型做支撐,解決複雜難題,也要有低成本的推理服務讓大模型廣泛應用,還要更多工具、平台和應用程式幫助企業做好場景落地。 ——譚待火山引擎總裁01.豆包大模型首次亮相大使用量打磨好模型模型效果是AI落地最關鍵的挑戰。譚待指出,只有大的使用量,才能打磨出好模型。目前,豆包大模型日均處理1,200億tokens文字、生成3,000萬張圖片。為助力企業做好大模型場景落地,位元組跳動自主研發的豆包大模型將透過火山

一、TensorRT-LLM的產品定位TensorRT-LLM是NVIDIA為大型語言模型(LLM)所開發的可擴展推理方案。它基於TensorRT深度學習編譯框架建構、編譯和執行計算圖,並藉鑒了FastTransformer中高效的Kernels實作。此外,它還利用NCCL實現設備間的通訊。開發者可以根據技術發展和需求差異,客製化算子以滿足特定需求,例如基於cutlass開發客製化的GEMM。 TensorRT-LLM是NVIDIA官方推理方案,致力於提供高效能並不斷完善其實用性。 TensorRT-LL

“高度复杂、碎片化程度高、跨领域”一直是交通行业数智化升级路上的首要痛点。近日,由中科视语、西安市雁塔区政府、西安未来人工智能计算中心联合打造的参数规模千亿级的“秦岭·秦川交通大模型”,面向智慧交通领域,为西安及其周边地区打造智慧交通创新支点。“秦岭·秦川交通大模型”结合西安当地海量开放场景下的交通生态数据、中科视语自研的原创先进算法以及西安未来人工智能计算中心昇腾AI的强大算力,为路网监测、应急指挥、养护管理、公众出行等智慧交通全场景带来数智化变革。交通管理在不同城市有不同的特点,不同道路的交

4月4日消息,日前,國家網信辦公佈已備案大模型清單,中國移動「九天自然語言交互大模型」名列其中,標誌著中國移動九天AI大模型可正式對外提供生成式人工智慧服務。中國移動表示,這是同時透過國家「生成式人工智慧服務備案」和「境內深度合成服務演算法備案」雙備案的首個央企研發的大模型。據介紹,九天自然語言交互大模型具有產業能力增強、安全可信、支援全端國產化等特點,已形成90億、139億、570億、千億等多種參數量版本,可靈活部署於雲、邊、端不同場

一、背景簡介首先來介紹雲問科技的發展歷程。雲問科技公...2023年,正是大模型盛行的時期,很多企業認為已經大模型之後圖譜的重要性大大降低了,之前研究的預置的資訊化系統也都不重要了。不過隨著RAG的推廣、資料治理的盛行,我們發現更有效率的資料治理和高品質的資料是提升私有化大模型效果的重要前提,因此越來越多的企業開始重視知識建構的相關內容。這也推動了知識的建構和加工開始向更高層次發展,其中有許多技巧和方法可以挖掘。可見一個新技術的出現,並不是將所有的舊技術打敗,也有可能將新技術和舊技術相互融合後

如果試題太簡單,學霸和學渣都能考90分,拉不開差距……隨著Claude3、Llama3甚至之後GPT-5等更強模型發布,業界急需一款更難、更有區分度的基準測試。大模型競技場背後組織LMSYS推出下一代基準測試Arena-Hard,引起廣泛關注。 Llama3的兩個指令微調版本實力到底如何,也有了最新參考。與先前大家分數都相近的MTBench相比,Arena-Hard區分度從22.6%提升到87.4%,孰強孰弱一目了然。 Arena-Hard利用競技場即時人類數據構建,與人類偏好一致率也高達89.1%

注意看,這個男人把超1000種大模型接入,讓你可插拔無縫切換使用。最近也上線了可視化的AI工作流程:給你一個直覺的拖放介面,拖拖、拉拉、拽拽,就能在無限畫布上編排自己個兒的Workflow。正所謂兵貴神速,量子位聽說,這個AIWorkflow上線不到48小時,就已經有用戶配出了100多個節點的個人工作流程。不賣關子,今天要聊的是LLMOps公司Dify,及其CEO張路宇。張路宇也是Dify的創辦人。投入創業前,有11年的網路經驗。搞產品設計,懂專案管理,也對SaaS有點自己的獨到見解。後來他
