首页 > 科技周边 > 人工智能 > 如何使用OpenAI的响应API和Agent SDK? - 分析Vidhya

如何使用OpenAI的响应API和Agent SDK? - 分析Vidhya

Christopher Nolan
发布: 2025-03-21 09:35:10
原创
732 人浏览过

Openai一直是Genai领域的领先解决方案提供商。从传奇的Chatgpt到Sora,它是所有工作专业人员的首选平台。随着Qwen和Claude在开发人员中的知名度越来越高,Openai又回到了其最新更新,使开发人员能够创建更可靠和有能力的AI代理。列表中的主要亮点包括响应API和代理SDK。在此博客中,我们将探讨API和代理SDK的响应,了解如何访问它们,并学习如何使用它们来构建现实世界应用程序!

目录

  • 什么是响应API?
  • 如何使用响应API?
  • 响应API与完成API有何不同?
  • 介绍代理SDK
  • 使用Agent SDK构建多代理系统
  • 为什么开发人员需要响应API&Agents SDK?
  • 结论
  • 常见问题

什么是响应API?

响应API是OpenAI的最新API,旨在简化构建基于AI的应用程序的过程。它将聊天完成API的简单性与助手API的强大工具使用功能结合在一起。这意味着开发人员现在可以创建利用多种工具并更有效地处理复杂的多步骤任务的代理。该API减少了对复杂及时工程和外部集成的依赖。

我们的新API原始:响应API。将聊天完成的简单性与助手的工具使用相结合,这个新的基础为建筑剂提供了更大的灵活性。网络搜索,文件搜索或计算机使用是几行代码!

- 2025年3月11日,OpenAi开发人员(@openaidevs)

响应的关键特征API

  • 内置工具,例如Web搜索,文件搜索和计算机使用,允许代理与现实世界数据进行交互。
  • 简化多态性并提高可用性的统一设计。
  • 更好的可观察性,帮助开发人员跟踪代理行为并优化工作流程。
  • 没有额外的费用,因为它会根据OpenAI标准定价的代币使用费用。

借助这些工具,API的响应改变了构建AI代理的游戏规则。 Infact,Buth,Neft,API的回答将支持OpenAI的所有新模型。让我们看看如何使用它来构建应用程序。

如何使用响应API?

尝试响应API:

  1. 安装OpenAI(如果尚未安装)并使用OpenAI。
  2. 确保您拥有最新的OpenAI库(PIP安装OpenAi - - 杯)。
  3. 导入OpenAI并设置客户端。

设置后,您可以请求响应API。尽管基本的API调用很常见,但其内置功能使其强大。让我们探索三个关键功能:

  • 文件搜索:从文档中检索见解。
  • 网络搜索:实时获取信息。
  • 计算机使用:自动化系统交互。

现在,让我们看看他们的行动!

1。文件搜索

它使模型能够通过语义和关键字搜索在先前上传文件的知识库中检索信息。当前,它不支持CSV文件,您可以在此处检查支持的文件类型的列表。

注意:使用文件搜索之前,请确保将文件存储在矢量数据库中

任务:具有领域作为数据科学的人的名字。 (我使用以下文件。)

代码:

响应= client.respons.create(

型号=“ gpt-4o-mini”,

输入=“具有域名作为数据科学的人的名称”,

工具= [{{

“ type”:“ file_search”,

“ vector_store_ids”:[vector_store_id],

“过滤器”:{

“ type”:“ eq”,

“键”:“域”,

“价值”:“数据科学”

}

]]

)

print(wendmess.output_text)
登录后复制

输出:

具有数据科学领域的人是爱丽丝·约翰逊[0]。<br> [0] names_and_domains.pdf
登录后复制

2。网络搜索

此功能允许模型在生成响应之前搜索Web以获取最新信息,从而确保数据保持最新状态。该模型可以选择基于输入提示符的内容搜索网络。

任务:Vijay Nagar中最好的咖啡馆是什么?

代码:

响应= client.respons.create(

型号=“ gpt-4o”,

工具= [{{

“ type”:“ web_search_preview”,

“ user_location”:{

“ type”:“近似”,

“国家”:“在”,

“城市”:“印多尔”,

“地区”:“中央邦”,

}

}],

输入=“ Vijay Nagar中最好的咖啡馆是什么?”,

)

print(wendmess.output_text)
登录后复制

输出:

如何使用OpenAI的响应API和Agent SDK? - 分析Vidhya

3。计算机使用

它是计算机使用代理(CUA)模型的实际应用,它结合了GPT-4O的视觉功能与高级推理,以模拟控制计算机接口并执行任务。

任务:查看Analytics Vidhya网站上的最新博客。

代码:

响应= client.respons.create(

型号=“计算机使用浏览”,

工具= [{{

“ type”:“ Computer_use_preview”,

“ display_width”:1024,

“ display_height”:768,

“环境”:“浏览器”#其他可能的值:“ Mac”,“ Windows”,“ Ubuntu”

}],

输入= [

{

“角色”:“用户”,

“内容”:“在分析Vidhya网站上查看最新博客。”

}

],,

截断=“自动”

)

打印(响应。输出)
登录后复制

输出:

 ResponseComputerToolCall(ID ='CU_67D147AF346C8192B787878719DD0E22856964FBBBB87C6A42E96',<br> Action = ActionCreenshot(type ='ScreenShot'),<br> call_id ='call_a0w16g1bnek09ayiv25vdkxy',pending_safety_checks = [],<br> status ='已完成',type ='Computer_call')
登录后复制

响应API与完成API有何不同?

既然我们已经看到了响应API的工作原理,那么让我们看看它与先前的完整API有何不同。

响应API与完成API:执行

API 响应API 完成API
代码
来自Openai Import Openai
客户端= OpenAi()
响应= client.respons.create(
    型号=“ gpt-4o”,
    输入= [
        {
            “角色”:“用户”,
            “ content”:“写一个关于独角兽的单句睡前故事。”
        }
    这是给出的
)
print(wendmess.output_text)
登录后复制
来自Openai Import Openai
客户端= OpenAi()
completion = client.chat.completions.create(
    型号=“ gpt-4o”,
    消息= [
        {
            “角色”:“用户”,
            “ content”:“写一个关于独角兽的单句睡前故事。”
        }
    这是给出的
)
打印(完成。选择[0] .message.content)
登录后复制
输出

如何使用OpenAI的响应API和Agent SDK? - 分析Vidhya

如何使用OpenAI的响应API和Agent SDK? - 分析Vidhya

响应API与完成API:功能

这是聊天补充API和响应API的各种功能的简化分解:

功能 响应API 聊天完成API
文字生成
声音的 即将推出
想象
网络搜索
文件搜索
计算机使用
代码解释器 即将推出
响应处理 返回单个结构化输出 返回选择数组
对话状态 preson_response_id用于连续性 必须手动管理
存储行为 默认存储(存储:false到禁用) 默认存储

路线图:将继续什么,贬值是什么?

响应API上线,现在燃烧的问题是,它会影响现有的聊天完成和助理API吗?是的。让我们看一下:

  • 聊天完成API: OpenAI将继续使用新型号对其进行更新,但仅当功能不需要内置工具时。
  • Web搜索和文件搜索工具:这些在响应API中将变得更加精致和强大。
  • 助手API:响应API在提高性能的同时,具有最佳功能。 Openai宣布即将推出完整的功能均等,助手API将在2026年中期弃用。

介绍代理SDK

构建AI代理不仅仅是拥有强大的API,还需要有效的编排。这是OpenAI的代理商SDK发挥作用的地方。代理SDK是一个开源工具包,可简化代理工作流程。该代理构建框架与响应API和聊天完成API无缝集成。此外,它还与来自各个提供商的型号兼容,只要它们提供了像聊天完成一样样式的API端点。

代理SDK的一些关键特征是:

  • 它允许开发人员使用内置工具配置AI代理。
  • 它可以实现多代理编排,从而可以根据需要对不同的代理进行无缝协调。
  • 它使我们能够跟踪代理之间的对话和信息流。
  • 它允许使用护栏以确保安全和合规性。
  • 它确保开发人员可以使用内置可观察性工具来监视和优化代理性能。

SDK特工并不是Openai珠宝的“新补充”。这是“ Swarm”的改进版本,这是OpenAI去年发布的实验性SDK。虽然“群”刚刚出于教育目的而发布,但它在开发人员中变得很流行,也被几家企业采用。为了迎合更多的企业并帮助他们无缝地建立生产级代理商,SDK已发布。现在我们知道了SDK必须提供的代理商,让我们看看如何使用此框架来构建我们的代理系统。

另请阅读:与代码相对于代码中的十大生成AI编码扩展

使用Agent SDK构建多代理系统

我们将建立一个多代理系统,该系统通过利用LLM驱动的代理和Web搜索工具来帮助用户提供汽车建议和转售价格估算,以提供准确,最新的见解。

步骤1:构建简单的AI代理

我们首先创建一个汽车顾问代理,该代理可以帮助用户根据需求选择合适的汽车类型。

代码:

 car_advisor =代理(

名称=“汽车顾问”,

说明=“您是根据他们的要求向人们建议合适的汽车类型的专家。”,

型号=“ gpt-4o”,

)

提示=“我正在寻找一辆我喜欢开车和舒适的汽车,需要4个人。我飞往山丘。我应该买什么类型的汽车?”

异步def main():

结果=等待Runner.run(car_advisor,提示)

打印(result.final_output)

#在Jupyter中运行该功能

等待main()
登录后复制

输出:

如何使用OpenAI的响应API和Agent SDK? - 分析Vidhya

步骤2:构建多代理系统

有了基本代理,我们现在创建了一个多代理系统,该系统结合了专门从事各自域的不同AI代理。这是其工作原理:

多代理系统中的代理

  1. 汽车销售估算代理:根据汽车详细信息,它提供了转售价格估算。
  2. 汽车模型顾问代理:它建议基于预算和位置的合适汽车模型。
  3. 分类代理:它将查询引向适当的代理。

我们将向代理提供两个不同的提示,并观察他们的输出。

代码:

 car_sell_estimate =代理(

名称=“汽车卖出估算”,

说明=“您是根据其制造,型号,购买年份和条件转售汽车的适当价格的专家。”

handoff_description =“汽车转售价格估算专家”,

型号=“ gpt-4o”,

工具= [WebSearchTool()]

)

car_model_advisor = agent(

名称=“汽车模型顾问”,

说明=“您是根据他们的预算和位置向人们建议合适的汽车模型的专家。”

handoff_description =“汽车模型建议专家”,

型号=“ gpt-4o”,

工具= [WebSearchTool()]

)

triage_agent =代理(

name =“分诊代理”,

说明=“您确定任务的适当代理。”,,

型号=“ gpt-4o”,

handoffs = [car_sell_estimate,car_model_advisor]

)

提示1: 

提示=“我想在新德里出售我的EcoSport汽车。它已经3岁了,状况良好。50000公里。我应该多少价格?”

异步def main():

结果=等待runner.run(triage_agent,提示)

打印(result.final_output)

#在Jupyter中运行该功能

等待main()
登录后复制

输出1:

如何使用OpenAI的响应API和Agent SDK? - 分析Vidhya

提示2:

提示=“我想买一辆高加速车,在新德里为200万人容纳4个人,我应该买哪辆车?”

异步def main():

结果=等待runner.run(triage_agent,提示)

打印(result.final_output)

#在Jupyter中运行该功能

等待main()
登录后复制

输出2:

如何使用OpenAI的响应API和Agent SDK? - 分析Vidhya

我们根据要求获得了汽车选择!实现很简单快捷。您可以使用此代理框架来建立旅行支持,财务计划,医疗援助,个性化购物,自动化研究等等的代理商。

特工的SDK:镇上的新代理框架?

Openai的代理SDK代表了其为为AI代理开发提供专门的框架的战略努力。该框架包括通过其Triage代理的类似船员的功能,模仿了机组人员的功能。同样,其交接机制与自动基因的交接机制非常相似,从而有效地委派了多个试剂之间的任务。

此外,Langchain在模块化代理编排中的强度以SDK提供结构化的工作流程的方式反映了,从而确保了平稳的执行和适应性。尽管Adents SDK只提供了现有框架已经做的事情,但它很快就会给他们带来激烈的竞争。

另请阅读:Claude 3.7十四行诗:迄今为止最好的编码模型?

为什么开发人员需要响应API&Agents SDK?

响应API和代理SDK为开发人员提供了构建AI驱动应用程序的工具和平台。通过减少对手动及时工程的依赖和广泛的自定义逻辑,这些工具使开发人员可以专注于用最小的摩擦来创建智能工作流程。

  • 简单集成:开发人员不再需要为不同的工具做多个API;响应API将Web搜索,文件搜索和计算机使用合并为单个接口。
  • 更好的可观察性:使用内置的监视和调试工具,开发人员可以更轻松地优化代理性能。
  • 可伸缩性:代理SDK提供了一种结构化方法来处理多代理工作流程,从而实现了更强大的自动化。
  • 改进的开发周期:通过消除对广泛的及时迭代和外部工具集成的需求,开发人员可以以更快的速度原型和基于代理的应用程序进行原型和部署应用程序。

这是一个视频,旨在了解有关OpenAi的响应API和代理SDK的更多信息。

结论

引入OpenAI响应API和代理SDK是AI驱动自动化的游戏规则改变者。通过利用这些工具,我们仅使用几行代码成功地成功地构建了一个多代理系统。可以进一步扩展此实施,以包括其他工具,集成和代理功能,为在各个行业中更聪明和自主的AI应用程序铺平道路。

这些工具肯定会帮助开发人员和企业降低开发的复杂性,并创建更智能,更可扩展的自动化解决方案。无论是用于客户支持,研究,业务自动化还是针对特定行业的AI应用程序,响应API和代理SDK都提供了一个有力的框架,可轻松构建下一代AI驱动系统。

常见问题

Q1。 Openai的回答是什么?

答:响应API是OpenAI的最新AI框架,它通过集成了内置工具(例如Web搜索,文件搜索和计算机使用)来简化代理开发。

Q2。响应API与完成API有何不同?

答:与完成API不同,响应API支持多工具集成,结构化输出和内置的对话状态管理。

Q3。什么是Openai的代理SDK?

答:Adents SDK是一个开源框架,使开发人员能够以AI驱动的自动化来构建和协调多代理系统。

Q4。代理商SDK如何改善AI开发?

答:它允许无缝的代理协调,增强的可观察性,内置护栏和改进的性能跟踪。

Q5。可以一起使用响应API和代理SDK吗?

答:是的!代理SDK与响应API集成,以创建强大的AI驱动应用程序。

Q6。 Openai的代理SDK是否与其他AI型号兼容?

答:是的,它可以与支持聊天完成API风格集成的第三方模型一起使用。

Q7。哪些行业可以从多代理AI系统中受益?

答:汽车,金融,医疗保健,客户支持和研究等行业可以使用AI驱动的代理来优化运营和决策。

以上是如何使用OpenAI的响应API和Agent SDK? - 分析Vidhya的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板