目录
故事示例
Agent 框架需要具备哪些技能?
揭秘 TaskWeaver 的核心架构
TaskWeaver 的具体流程
首页 科技周边 人工智能 TaskWeaver:开源框架助力数据分析和行业定制,构建卓越的Agent解决方案

TaskWeaver:开源框架助力数据分析和行业定制,构建卓越的Agent解决方案

Jan 17, 2024 am 08:36 AM
数据 训练

数据分析一直是现代社会中的关键工具,帮助我们深入了解本质、发现规律并指导决策。然而,数据分析过程常常复杂且耗时,因此我们期望有一个智能助手可以直接与数据进行交互。随着大语言模型(LLM)的发展,虚拟助手和Copilot等智能代理纷纷出现,它们在自然语言理解和生成方面的表现令人惊叹。然而,遗憾的是,现有的代理框架在处理复杂数据结构(如DataFrame、ndarray等)和引入领域知识时仍然面临困难,而这恰恰是数据分析和专业领域中的核心需求。

为了更好地解决语音助手在执行任务时的瓶颈问题,微软推出了一款名为TaskWeaver的Agent框架。该框架以代码为优先,能够智能地将用户的自然语言请求转化为可执行的代码,同时支持多种数据结构和动态插件选择。此外,TaskWeaver还可以根据不同领域的规划过程进行专业适应,充分发挥了大语言模型的潜力。作为一款开源框架,TaskWeaver提供了可定制的示例和插件,可以融入特定领域的知识,让用户能够轻松打造个性化的虚拟助手。TaskWeaver的推出将有效地提高语音助手的智能化水平,满足用户对于虚拟助手个性化需求的不断增长。

TaskWeaver:开源框架助力数据分析和行业定制,构建卓越的Agent解决方案

  • 论文:TaskWeaver: A Code-First Agent Framework
  • 论文地址:https://export.arxiv.org/abs/2311.17541

TaskWeaver 项目已在 GitHub 上开源,并于发布当日登上 GitHub 趋势榜。目前,该项目已获得 2.9k 个 star,取得了很好的反响。此外,在领英等社交平台上也有一些实用案例,例如用 TaskWeaver 进行 SAP 数据分析。这些案例证明了 TaskWeaver 的实用性和价值。

TaskWeaver:开源框架助力数据分析和行业定制,构建卓越的Agent解决方案


  • 项目主页:https://microsoft.github.io/TaskWeaver/
  • 项目地址:https://github.com/microsoft/TaskWeaver

故事示例

追踪销售数据中的隐藏秘密

小雅是一位商业分析师,她的工作之一是从最近的销售数据中寻找异常情况,并根据这些异常情况指导公司调整销售策略。所有销售数据都被安全地存储在一个SQL数据库中。她希望能够通过与AI助手进行自然语言交流来轻松地提取和分析数据。特别重要的是,在销售领域,异常情况具有独特性,因此她希望AI助手能够采用定制的异常检测算法来解决这个问题。以下是小雅与AI助手的聊天记录(图1),展示了他们之间的互动。 小雅:你好,我需要帮助从数据库中提取销售数据并进行分析。 AI助手:好的,我会马上从数据库中提取相应的数据。稍后我会将提取的数据呈现给您确认。 小雅:非常感谢。 (经过一段时间) AI助手:我已经从数据库中提取了销售数据,以下是数据的概览,请您确认一下。 (AI助手展示数据的概览) 小雅:数据看起来不错,请继续进行异常检测和分析。 AI助手:明白了。我将使用我们定制的异常检测算法进行分析,并尽快向您展示直观的可视化结果。 (经过一段时间) AI助手:分析完成了。请您查看以下可视化结果。 (AI助手展示可视化结果) 小雅:非常感谢你的帮助!这些结果对我来说非常有价值。 AI助手:很高兴能帮到您。如果您还有其他问题或需要进一步的分析,随时告诉我。 小雅:当然,谢谢你的支持。

TaskWeaver:开源框架助力数据分析和行业定制,构建卓越的Agent解决方案

图 1. 故事示例中的对话实录

Agent 框架需要具备哪些技能?

通过上述小雅的故事,我们梳理了 Agent 框架应具备的几大核心能力:

1. 插件支持:在上面的故事中,Agent 需要从数据库中获取数据,然后使用指定的异常检测算法。为了完成这些任务,智能助手需要能够定义和调用自定义插件,如 “query_database” 插件和 “anomaly_detection” 插件。

2. 丰富的数据结构支持:Agent 需要处理复杂的数据结构,如数组、矩阵、表格数据等,从而顺利进行高级数据处理,如预测、聚类等。此外,这些数据应能在不同插件间无缝传递。然而,现有的大多数 Agent 框架会将数据分析的中间结果转换为 Prompt 中的文本,或者先将它们保存为本地文件,然后需要时再读取。然而,这些做法容易出错和超过 Prompt 的字数限制。

3. 有状态执行:Agent 往往需要与用户进行多轮迭代交互,并根据用户输入,生成并执行代码。因此,这些代码的执行状态应在整个会话期间保留,直到会话结束。

4. 先推理后行动(ReAct):Agent 应该拥有 ReAct 的能力,即先观察推理后再采取行动,这在一些存在有不确定性的场景中非常有必要。例如,在上述样例中,由于数据库中的数据模式(schema)通常比较多样,因而 Agent 必须首先获取数据模式信息并了解哪些列是合适的(且与用户确认),然后才可以将相应的列名输入到异常检测算法中。

5. 生成任意代码:有时候,预定义的插件无法满足用户的请求,Agent 应能够生成代码以应对用户的临时需求。在上述示例中,Agent 需要生成代码来可视化检测到的异常,而这个过程是不借助于任何插件来实现的。

6. 融入领域知识:Agent 应提供一种系统性的方案来融入特定领域的知识。这将帮助 LLM 进行更好的规划和准确地调用工具,从而产生可靠的结果,尤其是在行业定制的场景中。

揭秘 TaskWeaver 的核心架构

图 2 展示了 TaskWeaver 的总体架构,包括规划器(Planner),代码解释器(Code Interpreter),以及记忆模块(Memory)。

规划器就像是系统的大脑,它有两个核心职责:1)制定计划,即把用户的需求拆分成子任务,将这些子任务逐个发送给代码解释器,并在整个计划执行过程中根据需要自我调整计划方案;2)回应用户,它会将代码解释器的反馈结果转换成用户容易理解的答案并发送给用户。

代码解释器主要由两个组件组成:代码生成器(Code Generator)会收到规划器发送的子任务,结合现有可用的插件以及领域特有的任务示例,来生成相应的代码块;代码执行器(Code Executor)则负责执行生成的代码,并在整个会话过程中保持执行状态。正因为此,复杂数据结构可以在内存中传递而无需通过 Prompt 或者文件系统。这就像在 Jupyter Notebook 中用 Python 编程,用户在单元格中输入代码片段,程序的内部状态会按顺序执行保留下来并且可被后续过程被引用。在实现上,每个会话中,代码执行器都会有一个独立的 Python 进程来执行代码,从而支持同时服务多用户。

记忆模块主要存储了整个系统运行过程中的有用信息,如执行结果等,可以被不同的模块写入和读取。短期记忆主要包括当前会话中用户和 TaskWeaver 之间的通信记录,以及各模块之间的通信记录。长期记忆则包括了用户可预先定制的领域知识,以及在交互过程中总结出的一些经验等等。

TaskWeaver:开源框架助力数据分析和行业定制,构建卓越的Agent解决方案

图 2. TaskWeaver 整体架构示意图

除了基本架构之外,TaskWeaver 还具有许多独特的设计。例如,会话压缩功能可以减小文本大小,从而允许更多的对话轮数;动态插件选择功能能够根据用户请求自动挑选合适的插件,从而允许集成更多的定制插件。此外,TaskWeaver 还支持经验保存功能,用户在使用过程中通过输入命令即可触发该功能,它将总结用户在当前会话中的经验教训,避免在下次会话中重复错误,实现真正的个性化。在安全性方面,TaskWeaver 也进行了精心设计,例如用户可以指定一个 Python 模块的白名单列表,如果生成的代码中引用了白名单之外的模块,将触发错误,从而降低安全风险。

TaskWeaver 的具体流程

图 3 向我们展示了 TaskWeaver 在完成前述样例任务的部分流程。

首先,规划器接收用户的输入,结合各模块功能描述和规划示例生成具体规划。该规划包含四个子任务,而其中第一个子任务是从数据库中提取数据并描述数据模式。

然后,代码生成器根据其能力描述和所有相关插件的定义生成一段代码。这段代码调用了 sql_pull_data 插件,将数据保存到 DataFrame 中,并提供数据模式的描述。

最后,生成的代码会被发送到代码执行器中执行,完成后的结果将被发送到规划器中以更新规划或者进行下一个子任务。图中执行结果显示 DataFrame 中有两个列,即日期和数值。规划器可以进一步与用户确认这些列是否正确,或者直接进行下一步的 anomaly_detection 插件的调用。

TaskWeaver:开源框架助力数据分析和行业定制,构建卓越的Agent解决方案

图 3. TaskWeaver 内部工作流

TaskWeaver 中如何注入领域知识?

在大模型应用中,整合特定领域知识的主要目的是提高 LLM 在行业定制中的泛化性能。TaskWeaver 提供了三种将领域知识注入模型的方法:

  • 使用插件进行定制:用户可以通过自定义插件的形式整合领域知识。插件可以有多种形式,如调用 API,从特定数据库中抓取数据,或运行特定的机器学习算法或模型等。插件定制相对直观,只需提供插件的基本信息(包括插件名称、功能描述、输入参数和返回值)以及 Python 实现。
  • 使用示例进行定制:TaskWeaver 还为用户提供了一个系统化的接口(以 YAML 格式)来配置示例,从而教导 LLM 如何响应用户请求。具体而言,示例可以分为两种类型,分别用于规划器中的规划制定和代码生成器中的代码编程。
  • 进行经验保存:TaskWeaver 支持用户将当前会话过程总结并存储为长期记忆。用户可以将专业领域知识作为对话内容对 TaskWeaver 进行 “教学”,随后保存对话为经验。在后续的使用过程中就可以通过动态加载经验,更好地完成专业领域问题。

如何使用  TaskWeaver?

TaskWeaver 的完整代码目前已在 GitHub 上开源。目前支持三种方案进行使用,分别是命令行启动,网页服务,以及以 Python 库的形式导入。在简单安装后,用户只需要配置几项关键参数,如 LLM API 地址、密钥和模型名称,即可轻松启动 TaskWeaver 服务。

TaskWeaver:开源框架助力数据分析和行业定制,构建卓越的Agent解决方案

图 4. 命令行启动界面

TaskWeaver:开源框架助力数据分析和行业定制,构建卓越的Agent解决方案

图 5. TaskWeaver 运行样例

TaskWeaver 是一款全新的 Agent 框架方案,其设计符合数据分析和行业定制场景的需要。通过将用户语言转成程序语言,「与数据对话」将不再是梦想,而是现实。

以上是TaskWeaver:开源框架助力数据分析和行业定制,构建卓越的Agent解决方案的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

使用ddrescue在Linux上恢复数据 使用ddrescue在Linux上恢复数据 Mar 20, 2024 pm 01:37 PM

DDREASE是一种用于从文件或块设备(如硬盘、SSD、RAM磁盘、CD、DVD和USB存储设备)恢复数据的工具。它将数据从一个块设备复制到另一个块设备,留下损坏的数据块,只移动好的数据块。ddreasue是一种强大的恢复工具,完全自动化,因为它在恢复操作期间不需要任何干扰。此外,由于有了ddasue地图文件,它可以随时停止和恢复。DDREASE的其他主要功能如下:它不会覆盖恢复的数据,但会在迭代恢复的情况下填补空白。但是,如果指示工具显式执行此操作,则可以将其截断。将数据从多个文件或块恢复到单

开源!超越ZoeDepth! DepthFM:快速且精确的单目深度估计! 开源!超越ZoeDepth! DepthFM:快速且精确的单目深度估计! Apr 03, 2024 pm 12:04 PM

0.这篇文章干了啥?提出了DepthFM:一个多功能且快速的最先进的生成式单目深度估计模型。除了传统的深度估计任务外,DepthFM还展示了在深度修复等下游任务中的最先进能力。DepthFM效率高,可以在少数推理步骤内合成深度图。下面一起来阅读一下这项工作~1.论文信息标题:DepthFM:FastMonocularDepthEstimationwithFlowMatching作者:MingGui,JohannesS.Fischer,UlrichPrestel,PingchuanMa,Dmytr

谷歌狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理训练最快选择 谷歌狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理训练最快选择 Apr 01, 2024 pm 07:46 PM

谷歌力推的JAX在最近的基准测试中性能已经超过Pytorch和TensorFlow,7项指标排名第一。而且测试并不是在JAX性能表现最好的TPU上完成的。虽然现在在开发者中,Pytorch依然比Tensorflow更受欢迎。但未来,也许有更多的大模型会基于JAX平台进行训练和运行。模型最近,Keras团队为三个后端(TensorFlow、JAX、PyTorch)与原生PyTorch实现以及搭配TensorFlow的Keras2进行了基准测试。首先,他们为生成式和非生成式人工智能任务选择了一组主流

你好,电动Atlas!波士顿动力机器人复活,180度诡异动作吓坏马斯克 你好,电动Atlas!波士顿动力机器人复活,180度诡异动作吓坏马斯克 Apr 18, 2024 pm 07:58 PM

波士顿动力Atlas,正式进入电动机器人时代!昨天,液压Atlas刚刚「含泪」退出历史舞台,今天波士顿动力就宣布:电动Atlas上岗。看来,在商用人形机器人领域,波士顿动力是下定决心要和特斯拉硬刚一把了。新视频放出后,短短十几小时内,就已经有一百多万观看。旧人离去,新角色登场,这是历史的必然。毫无疑问,今年是人形机器人的爆发年。网友锐评:机器人的进步,让今年看起来像人类的开幕式动作、自由度远超人类,但这真不是恐怖片?视频一开始,Atlas平静地躺在地上,看起来应该是仰面朝天。接下来,让人惊掉下巴

iPhone上的蜂窝数据互联网速度慢:修复 iPhone上的蜂窝数据互联网速度慢:修复 May 03, 2024 pm 09:01 PM

在iPhone上面临滞后,缓慢的移动数据连接?通常,手机上蜂窝互联网的强度取决于几个因素,例如区域、蜂窝网络类型、漫游类型等。您可以采取一些措施来获得更快、更可靠的蜂窝互联网连接。修复1–强制重启iPhone有时,强制重启设备只会重置许多内容,包括蜂窝网络连接。步骤1–只需按一次音量调高键并松开即可。接下来,按降低音量键并再次释放它。步骤2–该过程的下一部分是按住右侧的按钮。让iPhone完成重启。启用蜂窝数据并检查网络速度。再次检查修复2–更改数据模式虽然5G提供了更好的网络速度,但在信号较弱

超级智能体生命力觉醒!可自我更新的AI来了,妈妈再也不用担心数据瓶颈难题 超级智能体生命力觉醒!可自我更新的AI来了,妈妈再也不用担心数据瓶颈难题 Apr 29, 2024 pm 06:55 PM

哭死啊,全球狂炼大模型,一互联网的数据不够用,根本不够用。训练模型搞得跟《饥饿游戏》似的,全球AI研究者,都在苦恼怎么才能喂饱这群数据大胃王。尤其在多模态任务中,这一问题尤为突出。一筹莫展之际,来自人大系的初创团队,用自家的新模型,率先在国内把“模型生成数据自己喂自己”变成了现实。而且还是理解侧和生成侧双管齐下,两侧都能生成高质量、多模态的新数据,对模型本身进行数据反哺。模型是啥?中关村论坛上刚刚露面的多模态大模型Awaker1.0。团队是谁?智子引擎。由人大高瓴人工智能学院博士生高一钊创立,高

快手版Sora「可灵」开放测试:生成超120s视频,更懂物理,复杂运动也能精准建模 快手版Sora「可灵」开放测试:生成超120s视频,更懂物理,复杂运动也能精准建模 Jun 11, 2024 am 09:51 AM

什么?疯狂动物城被国产AI搬进现实了?与视频一同曝光的,是一款名为「可灵」全新国产视频生成大模型。Sora利用了相似的技术路线,结合多项自研技术创新,生产的视频不仅运动幅度大且合理,还能模拟物理世界特性,具备强大的概念组合能力和想象力。数据上看,可灵支持生成长达2分钟的30fps的超长视频,分辨率高达1080p,且支持多种宽高比。另外再划个重点,可灵不是实验室放出的Demo或者视频结果演示,而是短视频领域头部玩家快手推出的产品级应用。而且主打一个务实,不开空头支票、发布即上线,可灵大模型已在快影

特斯拉机器人进厂打工,马斯克:手的自由度今年将达到22个! 特斯拉机器人进厂打工,马斯克:手的自由度今年将达到22个! May 06, 2024 pm 04:13 PM

特斯拉机器人Optimus最新视频出炉,已经可以在厂子里打工了。正常速度下,它分拣电池(特斯拉的4680电池)是这样的:官方还放出了20倍速下的样子——在小小的“工位”上,拣啊拣啊拣:这次放出的视频亮点之一在于Optimus在厂子里完成这项工作,是完全自主的,全程没有人为的干预。并且在Optimus的视角之下,它还可以把放歪了的电池重新捡起来放置,主打一个自动纠错:对于Optimus的手,英伟达科学家JimFan给出了高度的评价:Optimus的手是全球五指机器人里最灵巧的之一。它的手不仅有触觉

See all articles