除了RAG,還有這五種方法消除大模型幻覺
出品 | 51CTO技術堆疊(微訊號:blog51cto)
#眾所周知,LLM會產生幻覺-也就是產生不正確、誤導或無意義的訊息。
有趣的是,有些人,如OpenAI的CEO Sam Altman,將AI的想像視為創造力,而有些人則認為想像可能有助於做出新的科學發現。
然而,在大多數情況下,提供正確回答至關重要,幻覺並不是一項特性,而是一種缺陷。
那麼,要如何減少LLM的幻覺呢?長上下文? RAG?微調?
其實,長上下文LLMs並非萬無一失,向量搜尋RAG也不盡如人意,而微調則伴隨著其自身的挑戰和限制。
以下是一些可以用來減少LLM幻覺的進階技術。
1.高級提示詞
關於使用更好或更高級的提示詞(prompts)是否能解決大型語言模型(LLM)的幻覺問題,確實存在很多討論。
圖片
有些人認為寫更詳細的提示字對解決(幻覺)問題沒有幫助,但Google大腦(Google Brain)的共同創始人吳恩達(Andrew Ng)等人卻看到了其中的潛力。他們提出了一種新的方法,即透過深度學習技術來產生提示詞,以幫助人們更好地解決問題。這種方法利用了大量的數據和強大的運算能力,可以自動產生與問題相關的提示詞,從而提高問題解決的效率。儘管這個領域
吳恩達認為,GPT-4和其他先進模型的推理能力使它們非常擅長解釋帶有詳細說明的複雜提示詞。
圖片
「透過多範例學習,開發者可以在提示詞中給出數十個,甚至數百個範例,這比少示例學習更為有效,」他寫道。
圖片
為了改進提示詞,許多新的進展也不斷湧現,例如Anthropic公司於5月10日發布了一款新的「Prompt Generator」工具,該工具可以將簡單的描述轉換為針對大型語言模型(LLMs)最佳化的高階提示詞。透過Anthropic控制台,就可以產生用於生產的提示詞。
最近,馬克安德森(Marc Andreessen)也表示,透過正確的提示,我們可以解鎖AI模型中的潛在超級天才。 “在不同領域的提示技術可以解鎖這種潛在超級天才”,他補充道。
2.Meta AI的Chain-of-Verification(CoVe)
Meta AI的Chain-of-Verification(CoVe)是另一種技術。這種方法透過將事實查核分解為可管理的步驟,提高反應準確性,並與人類驅動的事實查核過程保持一致,來減少大型語言模型(LLMs)的幻覺現象。
圖片
CoVe涉及產生初始回應、規劃驗證問題、獨立回答這些問題,並產生最終經過驗證的回應。透過系統地驗證和糾正其輸出,這種方法顯著提高了模型的準確性。
它透過減少幻覺並增加事實正確性,在各種任務中提高了性能,如基於列表的問題、閉卷問答和長篇文本生成等。
3.知識圖譜
RAG(檢索增強的生成)不再局限於向量資料庫匹配,目前引入了許多先進的RAG技術,顯著提高了檢索效果。
圖片
例如,將知識圖譜(KGs)整合到RAG中。透過利用知識圖譜中結構化且相互關聯的數據,可以大大增強目前RAG系統的推理能力。
4.Raptor
另一種技術是Raptor,該方法透過建立更高層次的抽象來處理跨越多個文件的問題。它在回答涉及多個文件概念的查詢時特別有用。
圖片
像Raptor這樣的方法與長上下文大型語言模型(LLMs)非常契合,因為你可以直接嵌入整個文件而無需分塊。
此方法透過將外部檢索機制與變換器模型整合來減少幻覺現象。當接收到查詢時,Raptor首先從外部知識庫中檢索相關且經過驗證的資訊。
然后,将这些检索到的数据与原始查询一起嵌入到模型的上下文中。通过将模型的响应基于事实和相关信息,Raptor确保生成的内容既准确又符合上下文。
5.共形抽离(Conformal Abstention)
论文《通过共形抽离缓解大型语言模型的幻觉现象》介绍了一种通过应用共形预测技术来确定模型何时应该避免给出响应,从而减少大型语言模型(LLMs)中的幻觉现象的方法。
图片
通过使用自我一致性来评估响应的相似性,并利用共形预测进行严格的保证,该方法确保模型只在对其准确性有信心时才做出响应。
这种方法在保持平衡的抽离率的同时,有效地限制了幻觉现象的发生率,特别有利于需要长篇回答的任务。它通过避免错误或不合逻辑的响应,显著提高了模型输出的可靠性。
6.RAG减少结构化输出中的幻觉现象
最近,ServiceNow通过RAG减少了结构化输出中的幻觉现象,提高了大型语言模型(LLM)的性能,实现了域外泛化,同时最小化了资源使用。
图片
该技术涉及一个RAG系统,该系统在生成文本之前从外部知识库中检索相关的JSON对象。这确保了生成过程基于准确且相关的数据。
图片
通过融入这一预检索步骤,模型不太可能产生错误或捏造的信息,从而减少了幻觉现象。此外,这种方法允许使用较小的模型而不牺牲性能,使其既高效又有效。
https://www.51cto.com/aigc/
以上是除了RAG,還有這五種方法消除大模型幻覺的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

5月30日,騰訊宣布旗下混元大模型全面升級,基於混元大模型的App「騰訊元寶」正式上線,蘋果及安卓應用程式商店皆可下載。相較於先前測試階段的混元小程式版本,面向工作效率場景,騰訊元寶提供了AI搜尋、AI總結、AI寫作等核心能力;面向日常生活場景,元寶的玩法也更加豐富,提供了多個特色AI應用,並新增了創建個人智能體等玩法。 「騰訊做大模型不爭一時之先。」騰訊雲副總裁、騰訊混元大模型負責人劉煜宏表示:「過去的一年,我們持續推進騰訊混元大模型的能力爬坡,在豐富、海量的業務場景中打磨技術,同時洞察用戶的真實需求

火山引擎總裁譚待企業要做好大模型落地,面臨模型效果、推理成本、落地難度的三大關鍵挑戰:既要有好的基礎大模型做支撐,解決複雜難題,也要有低成本的推理服務讓大模型廣泛應用,還要更多工具、平台和應用程式幫助企業做好場景落地。 ——譚待火山引擎總裁01.豆包大模型首次亮相大使用量打磨好模型模型效果是AI落地最關鍵的挑戰。譚待指出,只有大的使用量,才能打磨出好模型。目前,豆包大模型日均處理1,200億tokens文字、生成3,000萬張圖片。為助力企業做好大模型場景落地,位元組跳動自主研發的豆包大模型將透過火山

透過將檢索增強生成和語意記憶納入AI編碼助手,提升開發人員的生產力、效率和準確性。譯自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG,作者JanakiramMSV。雖然基本AI程式設計助理自然有幫助,但由於依賴對軟體語言和編寫軟體最常見模式的整體理解,因此常常無法提供最相關和正確的程式碼建議。這些編碼助手產生的代碼適合解決他們負責解決的問題,但通常不符合各個團隊的編碼標準、慣例和風格。這通常會導致需要修改或完善其建議,以便將程式碼接受到應

圖檢索增強生成(GraphRAG)正逐漸流行起來,成為傳統向量搜尋方法的強大補充。這種方法利用圖資料庫的結構化特性,將資料以節點和關係的形式組織起來,從而增強檢索資訊的深度和上下文關聯性。圖在表示和儲存多樣化且相互關聯的資訊方面具有天然優勢,能夠輕鬆捕捉不同資料類型間的複雜關係和屬性。而向量資料庫則處理這類結構化資訊時則顯得力不從心,它們更專注於處理高維度向量表示的非結構化資料。在RAG應用中,結合結構化的圖資料和非結構化的文字向量搜索,可以讓我們同時享受兩者的優勢,這也是本文將要探討的內容。構

一、TensorRT-LLM的產品定位TensorRT-LLM是NVIDIA為大型語言模型(LLM)所開發的可擴展推理方案。它基於TensorRT深度學習編譯框架建構、編譯和執行計算圖,並藉鑒了FastTransformer中高效的Kernels實作。此外,它還利用NCCL實現設備間的通訊。開發者可以根據技術發展和需求差異,客製化算子以滿足特定需求,例如基於cutlass開發客製化的GEMM。 TensorRT-LLM是NVIDIA官方推理方案,致力於提供高效能並不斷完善其實用性。 TensorRT-LL

一、背景簡介首先來介紹雲問科技的發展歷程。雲問科技公...2023年,正是大模型盛行的時期,很多企業認為已經大模型之後圖譜的重要性大大降低了,之前研究的預置的資訊化系統也都不重要了。不過隨著RAG的推廣、資料治理的盛行,我們發現更有效率的資料治理和高品質的資料是提升私有化大模型效果的重要前提,因此越來越多的企業開始重視知識建構的相關內容。這也推動了知識的建構和加工開始向更高層次發展,其中有許多技巧和方法可以挖掘。可見一個新技術的出現,並不是將所有的舊技術打敗,也有可能將新技術和舊技術相互融合後

注意看,這個男人把超1000種大模型接入,讓你可插拔無縫切換使用。最近也上線了可視化的AI工作流程:給你一個直覺的拖放介面,拖拖、拉拉、拽拽,就能在無限畫布上編排自己個兒的Workflow。正所謂兵貴神速,量子位聽說,這個AIWorkflow上線不到48小時,就已經有用戶配出了100多個節點的個人工作流程。不賣關子,今天要聊的是LLMOps公司Dify,及其CEO張路宇。張路宇也是Dify的創辦人。投入創業前,有11年的網路經驗。搞產品設計,懂專案管理,也對SaaS有點自己的獨到見解。後來他

4月4日消息,日前,國家網信辦公佈已備案大模型清單,中國移動「九天自然語言交互大模型」名列其中,標誌著中國移動九天AI大模型可正式對外提供生成式人工智慧服務。中國移動表示,這是同時透過國家「生成式人工智慧服務備案」和「境內深度合成服務演算法備案」雙備案的首個央企研發的大模型。據介紹,九天自然語言交互大模型具有產業能力增強、安全可信、支援全端國產化等特點,已形成90億、139億、570億、千億等多種參數量版本,可靈活部署於雲、邊、端不同場
