9月8日下午,中国工程院院士、清华大学计算机系教授、海致科技首席科学家郑纬民在北京演示发布了由海致科技与高性能图计算院士工作站共同开发的「Atlas LLM 知识图谱与大模型融合应用平台」,该平台面向广大B端用户,运用知识图谱这项人工智能基础技术,帮助大模型在企业级和工业界应用中克服「幻觉」,实现基于行业与场景的精准推演
该产品目前已经在能源、金融、政务等领域的场景中进行部署和应用,力图打通通用人工智能进入 B 端和工业应用的 “最后一公里”。
中国电子技术标准化研究院、全国信标委等单位发起了一项名为《知识图谱与大模型融合实践报告》的活动,海致科技全程参与其中。该报告已经正式发布,并将分享上述成果以及一些应用案例,以促进更多市场主体和技术力量参与通用人工智能的多技术融合
“当大模型从 C 端走向 B 端,它就像从玩具走向工具,而工具的精确性至关重要。写文章时查询爱因斯坦提出相对论的时间错了不太要紧,但是如果大模型对电网故障的维修提出了错误的选项,结果可能是一场灾难。” 海致科技首席科学家郑纬民院士在接受记者采访时表示:” 短期来看,单纯依靠大模型自身的迭代,‘幻觉’问题难以解决,在这方面,知识图谱作为更加类脑的人工智能工具,其精确的知识推导能力就可以跟大模型构成非常好的相互补充,反过来,大模型的快速学习能力,对于知识图谱的知识生成也产生了很好的促进。“
大语言模型(LLM)的通用性、快速自主学习和自我改进的能力被认为是革命性的,并且已经得到广泛认可。然而,由于LLM的基本工作方式是分析文本中的词汇、句法结构和语义信息,并捕捉它们之间的模式和概率分布,因此它更倾向于基于统计规律生成回答,而不是进行深入的逻辑推理或形成高级的认知能力。此外,在生成文本时,LLM可能会受到训练数据中存在的偏见和误导性信息的限制,在某些情况下可能会产生不准确或不合理的回答。这种基于技术特征产生的缺陷被形象地比喻为“大模型幻觉”。这种意外的“幻觉”正是通用人工智能,尤其是以大模型为代表的通用人工智能进入严谨B端应用面临的最后,也是最大的挑战
在这一背景下,另一种被广泛应用的人工智能基础技术 —— 知识图谱,开始展现出它与大模型天然的互补能力。知识图谱作为公认 “类脑” 的知识表达方式,通过对语义网络进行建模,以结构化的形式描述客观世界中实体及关系,被广泛应用于知识推理。基于知识图谱的知识推理在离散符号表示的基础上,通过推理路径、逻辑规则等辅助手段,对推理过程进行解释,为实现 “可解释人工智能” 提供了重要途径。
由郑纬民院士担任首席科学家的海致科技,创业已有十年历程,是国内目前规模最大、应用客户范围最广的知识图谱和图计算公司。在金融、政务、能源、交通等领域拥有丰富而广阔的知识图谱应用经验,并推出了全球领先的国产分布式云原生图数据库 Atlas Graph,作为中国数据库代表入选 Gartner《全球图数据库管理系统市场指南》,填补了国产分布式图数据库的空白。
2022年10月,郑纬民院士带领年轻科学家在海致科技设立了"高性能图计算院士工作站",开始跟踪全球各种大模型研发动态。他们致力于将知识图谱与大模型技术深度结合,并在金融、能源、政务企事业单位进行部署试用。他们瞄准B端行业客户长期积累的庞大结构化数据体系和计算分析应用体系,郑院士和海致创新地将知识图谱作为中介桥梁,连接既有数据体系与大模型,全面提升大模型在行业落地的可解释性、可交互性和可验证性
"人工智能发展的一个衡量标准是对人脑智能的学习。据我们观察,知识图谱的严密推理类似于人类的左脑,而大型模型的快速学习则与右脑的灵活相似。" 郑纬民表示:“我们的产品旨在通过一套知识映射、校验和优化的架构,实现左右脑之间的互通,推动通用人工智能在企业级场景中的深入应用。”
海致科技的首席技术官杨娟发布了关于知识图谱和大模型应用产品的消息
“我们不生产大模型,我们致力于将大模型应用于生产。” 海致科技 CTO 杨娟博士介绍说,海致 Atlas LLM 大模型融合应用平台有三个非常独特的定位:一是在全过程实现了知识图谱与大模型的交互,有效克服大模型幻觉对工业应用的干扰;二是更好管理了客户已有的丰富的数据资产,将其与大模型成果统一整理,避免重复造轮子,使得计算更高效,应用更精确;三是能够帮助客户切换和灵活应用不同的开源大模型,实现更高性价比的场景应用。
海致科技高级副总裁瞿珂为我们列举了该上述平台已经验证的一个工业场景:在工业制造设备运检领域中,复杂生产系统的故障识别因其故障组合类型复杂、数据异构、以及要求反应速度很快,一直是人们对人工智能寄予厚望的领域。“过去我们通过利用知识图谱技术,可以将设备间关系以及关联设备量测信号构建成故障知识特征子图来帮助机器自动实现故障识别,但是这一过程需要业务专家配合技术人员开展大量的实体构建和配置工作为先决条件,才能实现知识生成。但是今天我们可以通过大模型极大地提高这一知识抽取和融合的过程效率,一方面,通过大模型对故障设备及关联量测值的快速提取,帮助知识图谱完成特征图的快速构建,提高效率;另一方面,也可以通过业务专家对大模型自动生成的特征图进行更为高效的校验,固化和校准故障特征的经验知识,确保质量。”
在大模型时代,行业企业客户关心的另一个重点是,未来的发展是要完全推翻旧的计算分析体系,还是基于已有的计算分析体系进行一次升级?海致科技基于客户已建立的庞大计算分析应用和业务小模型,按照“基础场景识别 + 综合场景编排 + 场景固化发布”的逻辑,实现了大模型应用的“三步走”
第一步:将客户已有计算分析和业务小模型的基础场景服务通过大模型微调,对场景语义进行标注识别,并形成基础服务场景库。
重写内容如下:第二步:通过综合应用高阶场景和对应的Prompt语义,利用大模型推理能力,智能地编排计算调用和计算逻辑
重写后的内容:在第三步中,我们将通过大模型编排来生成场景编排知识图谱。通过利用知识图谱的可观测解释性和可交互操作性,我们可以对复杂场景的大模型编排结果进行观测和人工校验调优。这样可以实现对应语义的场景知识的稳定固化,并具备对外发布的能力
目前,海致已经实现了基于行业客户已有计算分析多能力的基础场景识别,复杂场景编排和基于知识图谱的知识可观测、固化校验及发布能力,使大模型能够在已有计算分析知识和图谱固化场景两个 “准确性控制” 下,达成以大模型推理生成为核心的精准计算问答。
以上是海致科技发布首个知识图谱融合大模型应用平台,助力国内百模大战的详细内容。更多信息请关注PHP中文网其他相关文章!