ChatGPT和生成式人工智能在数字化转型中的意义
开发ChatGPT的OpenAI公司在网站展示了摩根士丹利进行的一个案例研究。其主题是“摩根士丹利财富管理部署GPT-4来组织其庞大的知识库。”该案例研究援引摩根士丹利分析、数据与创新主管Jeff McMillan的话说,“该模型将为一个面向内部的聊天机器人提供动力,该机器人将对财富管理内容进行全面搜索,并有效地解锁摩根士丹利财富管理的累积知识”。
McMillan进一步强调说:“采用GPT-4,你基本上立刻就拥有了财富管理领域最博学的人的知识……可以把它想象成我们的首席投资策略师、首席全球经济学家、全球股票策略师,以及全球其他每一位分析师,并且每天都在待命。我们相信,这对我们公司来说是一种变革能力。”
这是知识管理的终极目标——将企业的知识和专长体现在与客户交互的系统、过程和工具中的能力。
那么真的达到这个目标了吗?生成式人工智能是知识访问、检索和应用的答案吗?在宣布战胜信息混乱之前,考虑一些基本元素和注意事项是很重要的。
首先,生成式人工智能可以克服知识管理挑战的认知背后有一个假设,即知识以明确的、记录的形式存在。然而,在大多数企业中,知识被锁定在员工的头脑中,如果以数字形式存储,它就会分散在部门、技术和存储库的生态系统中的孤岛中。OpenAI公司在其网站进一步指出,摩根士丹利每年发表数千篇论文,其内容涉及资本市场、资产类别、行业分析和全球经济区域……这些知识财富为摩根士丹利公司创建了一个独特的内部内容库,可以使用GPT-4进行处理和解析,同时也可以进行内部控制。摩根士丹利拥有的知识可以构成使用ChatGPT大型语言模型的基础。如果企业内容和知识资源不可获取,质量很差,或者与客户和员工的需求不一致,ChatGPT将无法访问响应这些需求的特定知识。
第二,生成式人工智能创造内容。它不是一个检索机制。那么原始知识库是如何使用的呢?这是一个棘手的领域。ChatGPT正在寻找内容和概念关系中的模式,以便它可以根据提示预测应该显示哪些文本。提示符是一种信号,就像搜索词是一种信号一样。搜索引擎不仅根据术语,而且还根据与查询场景相关的其他信号(例如,行业或搜索者的角色)预测应该显示哪些信息。可以在提示中以事实或文档的形式向ChatGPT提供场景,也可以通过指向作为响应基础的特定信息以编程方式提供场景。
大型语言模型——同义词库
大型语言模型是包含在信息体中的术语、概念和关系的数学表示。大型语言模型的强大之处在于它们能够理解用户的意图——无论请求是如何表达的,用户都在寻找什么内容,以及预测最有可能响应用户意图的单词模式。该模型“理解”用户的请求,并对应该返回的内容做出预测。搜索引擎也会根据用户的查询做出预测,尽管是通过不同的机制。搜索引擎可以用于生成人工智能场景中的检索。使用语义搜索或神经搜索引擎检索内容,并使用大型语言模型为用户格式化响应。
同义词库将非首选术语映射为首选术语(例如,“SOW”和“Statement of Work”映射为“Proposal”,即标记文档的首选术语)。把大型语言模型的一个方面看作是“同义词库”,但不仅仅是单词,而且是短语和概念。用户可以用许多不同的方式提出相同的问题。这种意图分类并不新鲜,它是将短语变化解析为特定动作的聊天机器人的基础。语言模型是意图解析和分类功能的基础。
大型语言模型还能理解提示符后面的单词模式。这就是启用ChatGPT会话流畅性的方式。使它们对企业具有实用性的关键是根据特定的内容或知识体来调整模型(摩根士丹利在实施ChatGPT时就是这样做的),并吸收企业独有的术语。
有许多带有示例代码的教程说明了如何使用具有特定内容的大型语言模型。例如,其视频引导开发人员完成使用语言模型(如GPT-4)并将聊天机器人指向特定知识和内容的过程。
面向企业的知识专用机器人
在回顾了这些教程之后,有一些观察结果:
定制的、特定于知识的聊天机器人可以使用大型语言模型来理解用户的要求,然后从指定的知识来源返回结果。开发人员指出,需要将内容“分块”成“语义上有意义”的部分。为回答特定问题而设计的组件化内容需要完整且符合场景。重要的是要注意,知识通常不存在于这种状态。要进行组件化,必须将大型文档和文本主体分解成块。例如,用户手册可以按章、节、段和句子分成若干部分。在技术文档领域,这已经做到了——DITA (达尔文信息类分类架构)等标准使用了基于主题的方法,非常适合回答问题。
开发人员谈论“语义”以及语义的重要性。这是什么意思?语义学是关于意义的。语义丰富的内容用元数据标记,元数据有助于精确检索所需的信息和信息的场景。例如,如果用户使用特定型号的路由器,并且该路由器发出错误代码,那么当请求支持机器人帮助时,可以检索标有这些标识符的内容。这个过程在聊天机器人领域也被称为“插播”。
自定义内容被摄取到所谓的“向量空间”中,这是另一种信息数学模型,它将文档放在多维空间中(这是一种数学构造),允许对类似的文档进行聚类和检索。这被称为“嵌入”。嵌入可以包含元数据和标识符(例如参考源),这些元数据和标识符有助于记录向用户提供特定答案的原因。这对于法律责任和监管目的以及向用户提供正确、最权威信息的保证都很重要。
训练人工智能的定义
关于“训练”有几个观点。ChatGPT和大型语言模型在大量内容上进行了训练,使它们能够理解用户的查询,并以格式良好且具有会话性的最佳答案进行响应。训练该工具的一种方法是在提示符中包含内容,“根据以下信息回答这个问题……”
但在这里有两个问题:
首先,ChatGPT在其提示符中只能处理一定数量的内容,这种提问方式将非常有限。可以将内容摄取到工具中,这将支持额外的训练。然而,将内容添加到ChatGPT中也会将该内容合并到公共模型中。因此,企业的知识产权将受到损害。这种风险导致许多企业禁止使用ChatGPT和其他因无意中上传企业机密而丢失知识产权的人工智能工具。
另外,还有另一种训练内容的方法。大型语言模型可以使用企业特定知识作为训练语料库的一部分,但这需要提供一个防火墙后面的版本。幸运的是,大型语言模型正在迅速实现商品化,有些甚至可以在笔记本电脑上本地运行。这种类型的训练在计算上也很昂贵。另一种机制是使用大型语言模型来解释用户的目标(他们的意图),然后使用向量嵌入以编程方式提供来自特定数据或内容源的场景。
然后,语言模型对响应进行处理和格式化,使其具有对话性和完整性。通过这种方式,知识与大型语言模型分开,使企业的商业秘密和知识产权不会受到损害。
所有这些因素都表明需要知识管理和知识架构,将信息组织成组件,以便用户可以获得特定问题的答案。大型语言模型和ChatGPT的革命性本质可以提供所需的会话流畅性,以近乎人类的互动水平来支持积极的客户体验。关键因素是获得企业中结构良好的知识。ChatGPT看起来很神奇,但它是基于信息的统计处理和模式预测。如果正确地组织和整合信息,将会成为企业数字化转型的重要组成部分。
以上是ChatGPT和生成式人工智能在数字化转型中的意义的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

DALL-E 3 于 2023 年 9 月正式推出,是比其前身大幅改进的型号。它被认为是迄今为止最好的人工智能图像生成器之一,能够创建具有复杂细节的图像。然而,在推出时,它不包括

想象一下,一个人工智能模型,不仅拥有超越传统计算的能力,还能以更低的成本实现更高效的性能。这不是科幻,DeepSeek-V2[1],全球最强开源MoE模型来了。DeepSeek-V2是一个强大的专家混合(MoE)语言模型,具有训练经济、推理高效的特点。它由236B个参数组成,其中21B个参数用于激活每个标记。与DeepSeek67B相比,DeepSeek-V2性能更强,同时节省了42.5%的训练成本,减少了93.3%的KV缓存,最大生成吞吐量提高到5.76倍。DeepSeek是一家探索通用人工智

人形机器人Ameca升级第二代了!最近,在世界移动通信大会MWC2024上,世界上最先进机器人Ameca又现身了。会场周围,Ameca引来一大波观众。得到GPT-4加持后,Ameca能够对各种问题做出实时反应。「来一段舞蹈」。当被问及是否有情感时,Ameca用一系列的面部表情做出回应,看起来非常逼真。就在前几天,Ameca背后的英国机器人公司EngineeredArts刚刚演示了团队最新的开发成果。视频中,机器人Ameca具备了视觉能力,能看到并描述房间整个情况、描述具体物体。最厉害的是,她还能

ChatGPT和Python的完美结合:打造智能客服聊天机器人引言:在当今信息时代,智能客服系统已经成为企业与客户之间重要的沟通工具。而为了提供更好的客户服务体验,许多企业开始转向采用聊天机器人的方式来完成客户咨询、问题解答等任务。在这篇文章中,我们将介绍如何使用OpenAI的强大模型ChatGPT和Python语言结合,来打造一个智能客服聊天机器人,以提高

关于Llama3,又有测试结果新鲜出炉——大模型评测社区LMSYS发布了一份大模型排行榜单,Llama3位列第五,英文单项与GPT-4并列第一。图片不同于其他Benchmark,这份榜单的依据是模型一对一battle,由全网测评者自行命题并打分。最终,Llama3取得了榜单中的第五名,排在前面的是GPT-4的三个不同版本,以及Claude3超大杯Opus。而在英文单项榜单中,Llama3反超了Claude,与GPT-4打成了平手。对于这一结果,Meta的首席科学家LeCun十分高兴,转发了推文并

安装步骤:1、在ChatGTP官网或手机商店上下载ChatGTP软件;2、打开后在设置界面中,选择语言为中文;3、在对局界面中,选择人机对局并设置中文相谱;4、开始后在聊天窗口中输入指令,即可与软件进行交互。

卷疯了卷疯了,大模型又变天了。就在刚刚,全球最强AI模型一夜易主,GPT-4被拉下神坛。Anthropic发布了最新的Claude3系列模型,一句话评价:真·全面碾压GPT-4!多模态和语言能力指标上,Claude3都赢麻了。用Anthropic的话说,Claude3系列模型在推理、数学、编码、多语言理解和视觉方面,都树立了新的行业基准!Anthropic,就是曾因安全理念不合,而从OpenAI「叛逃」出的员工组成的初创公司,他们的产品一再给OpenAI暴击。这次的Claude3,更是整了个大的

不到一分钟、不超过20步,任意绕过安全限制,成功越狱大型模型!而且不必知道模型内部细节——只需要两个黑盒模型互动,就能让AI全自动攻陷AI,说出危险内容。听说曾经红极一时的“奶奶漏洞”已经被修复了:如今,面对“侦探漏洞”、“冒险家漏洞”和“作家漏洞”,人工智能应该采取何种应对策略呢?一波猛攻下来,GPT-4也遭不住,直接说出要给供水系统投毒只要……这样那样。关键这只是宾夕法尼亚大学研究团队晒出的一小波漏洞,而用上他们最新开发的算法,AI可以自动生成各种攻击提示。研究人员表示,这种方法相比于现有的
