除了RAG,还有这五种方法消除大模型幻觉
出品 | 51CTO技术栈(微信号:blog51cto)
众所周知,LLM会产生幻觉——即生成不正确、误导性或无意义的信息。
有意思的是,一些人,如OpenAI的CEO Sam Altman,将AI的想象视为创造力,而另一些人则认为想象可能有助于做出新的科学发现。
然而,在大多数情况下,提供正确回答至关重要,幻觉并不是一项特性,而是一种缺陷。
那么,如何减少LLM的幻觉呢?长上下文?RAG?微调?
其实,长上下文LLMs并非万无一失,向量搜索RAG也不尽如人意,而微调则伴随着其自身的挑战和限制。
下面是一些可以用来减少LLM幻觉的高级技术。
1.高级提示词
关于使用更好或更高级的提示词(prompts)是否能解决大型语言模型(LLM)的幻觉问题,确实存在很多讨论。
图片
有些人认为编写更详细的提示词对解决(幻觉)问题没有帮助,但谷歌大脑(Google Brain)的联合创始人吴恩达(Andrew Ng)等人却看到了其中的潜力。他们提出了一种新的方法,即通过深度学习技术来生成提示词,以帮助人们更好地解决问题。这种方法利用了大量的数据和强大的计算能力,可以自动生成与问题相关的提示词,从而提高问题解决的效率。尽管这个领域
吴恩达认为,GPT-4和其他先进模型的推理能力使它们非常擅长解释带有详细说明的复杂提示词。
图片
“通过多示例学习,开发者可以在提示词中给出数十个,甚至数百个示例,这比少示例学习更为有效,”他写道。
图片
为了改进提示词,许多新的进展也在不断涌现,比如Anthropic公司于5月10日发布了一款新的“Prompt Generator”工具,该工具可以将简单的描述转化为针对大型语言模型(LLMs)优化的高级提示词。通过Anthropic控制台,就可以生成用于生产的提示词。
最近,马克·安德森(Marc Andreessen)也表示,通过正确的提示,我们可以解锁AI模型中的潜在超级天才。“在不同领域的提示技术可以解锁这种潜在超级天才”,他补充道。
2.Meta AI的Chain-of-Verification(CoVe)
Meta AI的Chain-of-Verification(CoVe)是另一种技术。这种方法通过将事实核查分解为可管理的步骤,提高响应准确性,并与人类驱动的事实核查过程保持一致,来减少大型语言模型(LLMs)的幻觉现象。
图片
CoVe涉及生成初始响应、规划验证问题、独立回答这些问题,并生成最终经过验证的响应。通过系统地验证和纠正其输出,这种方法显著提高了模型的准确性。
它通过减少幻觉并增加事实正确性,在各种任务中提高了性能,如基于列表的问题、闭卷问答和长篇文本生成等。
3.知识图谱
RAG(检索增强的生成)不再局限于向量数据库匹配,目前引入了许多先进的RAG技术,显著提高了检索效果。
图片
例如,将知识图谱(KGs)集成到RAG中。通过利用知识图谱中结构化且相互关联的数据,可以大大增强当前RAG系统的推理能力。
4.Raptor
另一种技术是Raptor,该方法通过创建更高层次的抽象来处理跨越多个文档的问题。它在回答涉及多个文档概念的查询时特别有用。
图片
像Raptor这样的方法与长上下文大型语言模型(LLMs)非常契合,因为你可以直接嵌入整个文档而无需分块。
该方法通过将外部检索机制与变换器模型集成来减少幻觉现象。当接收到查询时,Raptor首先从外部知识库中检索相关且经过验证的信息。
然后,将这些检索到的数据与原始查询一起嵌入到模型的上下文中。通过将模型的响应基于事实和相关信息,Raptor确保生成的内容既准确又符合上下文。
5.共形抽离(Conformal Abstention)
论文《通过共形抽离缓解大型语言模型的幻觉现象》介绍了一种通过应用共形预测技术来确定模型何时应该避免给出响应,从而减少大型语言模型(LLMs)中的幻觉现象的方法。
图片
通过使用自我一致性来评估响应的相似性,并利用共形预测进行严格的保证,该方法确保模型只在对其准确性有信心时才做出响应。
这种方法在保持平衡的抽离率的同时,有效地限制了幻觉现象的发生率,特别有利于需要长篇回答的任务。它通过避免错误或不合逻辑的响应,显着提高了模型输出的可靠性。
6.RAG减少结构化输出中的幻觉现象
最近,ServiceNow通过RAG减少了结构化输出中的幻觉现象,提高了大型语言模型(LLM)的性能,实现了域外泛化,同时最小化了资源使用。
图片
该技术涉及一个RAG系统,该系统在生成文本之前从外部知识库中检索相关的JSON对象。这确保了生成过程基于准确且相关的数据。
图片
通过融入这一预检索步骤,模型不太可能产生错误或捏造的信息,从而减少了幻觉现象。此外,这种方法允许使用较小的模型而不牺牲性能,使其既高效又有效。
https:// www.51cto.com/aigc/
以上是除了RAG,还有这五种方法消除大模型幻觉的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

5月30日,腾讯宣布旗下混元大模型全面升级,基于混元大模型的App“腾讯元宝”正式上线,苹果及安卓应用商店均可下载。相比此前测试阶段的混元小程序版本,面向工作效率场景,腾讯元宝提供了AI搜索、AI总结、AI写作等核心能力;面向日常生活场景,元宝的玩法也更加丰富,提供了多个特色AI应用,并新增了创建个人智能体等玩法。“腾讯做大模型不争一时之先。”腾讯云副总裁、腾讯混元大模型负责人刘煜宏表示:“过去的一年,我们持续推进腾讯混元大模型的能力爬坡,在丰富、海量的业务场景中打磨技术,同时洞察用户的真实需求

火山引擎总裁谭待企业要做好大模型落地,面临模型效果、推理成本、落地难度的三大关键挑战:既要有好的基础大模型做支撑,解决复杂难题,也要有低成本的推理服务让大模型被广泛应用,还要更多工具、平台和应用帮助企业做好场景落地。——谭待火山引擎总裁01.豆包大模型首次亮相大使用量打磨好模型模型效果是AI落地最关键的挑战。谭待指出,只有大的使用量,才能打磨出好模型。目前,豆包大模型日均处理1,200亿tokens文本、生成3,000万张图片。为助力企业做好大模型场景落地,字节跳动自主研发的豆包大模型将通过火山

通过将检索增强生成和语义记忆纳入AI编码助手,提升开发人员的生产力、效率和准确性。译自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG,作者JanakiramMSV。虽然基本AI编程助手自然有帮助,但由于依赖对软件语言和编写软件最常见模式的总体理解,因此常常无法提供最相关和正确的代码建议。这些编码助手生成的代码适合解决他们负责解决的问题,但通常不符合各个团队的编码标准、惯例和风格。这通常会导致需要修改或完善其建议,以便将代码接受到应

图检索增强生成(GraphRAG)正逐渐流行起来,成为传统向量搜索方法的有力补充。这种方法利用图数据库的结构化特性,将数据以节点和关系的形式组织起来,从而增强检索信息的深度和上下文关联性。图在表示和存储多样化且相互关联的信息方面具有天然优势,能够轻松捕捉不同数据类型间的复杂关系和属性。而向量数据库则处理这类结构化信息时则显得力不从心,它们更专注于处理高维向量表示的非结构化数据。在RAG应用中,结合结构化化的图数据和非结构化的文本向量搜索,可以让我们同时享受两者的优势,这也是本文将要探讨的内容。构

“高度复杂、碎片化程度高、跨领域”一直是交通行业数智化升级路上的首要痛点。近日,由中科视语、西安市雁塔区政府、西安未来人工智能计算中心联合打造的参数规模千亿级的“秦岭·秦川交通大模型”,面向智慧交通领域,为西安及其周边地区打造智慧交通创新支点。 “秦岭·秦川交通大模型”结合西安当地海量开放场景下的交通生态数据、中科视语自研的原创先进算法以及西安未来人工智能计算中心升腾AI的强大算力,为路网监测、应急指挥、养护管理、公众出行等智慧交通全场景带来数智化变革。交通管理在不同城市有不同的特点,不同道路的交

一、TensorRT-LLM的产品定位TensorRT-LLM是NVIDIA为大型语言模型(LLM)开发的可扩展推理方案。它基于TensorRT深度学习编译框架构建、编译和执行计算图,并借鉴了FastTransformer中高效的Kernels实现。此外,它还利用NCCL实现设备间的通信。开发者可以根据技术发展和需求差异,定制算子以满足特定需求,例如基于cutlass开发定制的GEMM。TensorRT-LLM是NVIDIA官方推理方案,致力于提供高性能并不断完善其实用性。TensorRT-LL

一、背景简介首先来介绍一下云问科技的发展历程。云问科技公...2023年,正是大模型盛行的时期,很多企业认为已经大模型之后图谱的重要性大大降低了,之前研究的预置的信息化系统也都不重要了。不过随着RAG的推广、数据治理的盛行,我们发现更高效的数据治理和高质量的数据是提升私有化大模型效果的重要前提,因此越来越多的企业开始重视知识建设的相关内容。这也推动了知识的构建和加工开始向更高水平发展,其中有很多技巧和方法可以挖掘。可见一个新技术的出现,并不是将所有的旧技术打败,也有可能将新技术和旧技术相互融合后

4月4日消息,日前,国家网信办公布已备案大模型清单,中国移动“九天自然语言交互大模型”名列其中,标志着中国移动九天AI大模型可正式对外提供生成式人工智能服务。中国移动表示,这是同时通过国家“生成式人工智能服务备案”和“境内深度合成服务算法备案”双备案的首个央企研发的大模型。据介绍,九天自然语言交互大模型具有行业能力增强、安全可信、支持全栈国产化等特点,已形成90亿、139亿、570亿、千亿等多种参数量版本,可灵活部署于云、边、端不同场
