Openai一直是Genai领域的领先解决方案提供商。从传奇的Chatgpt到Sora,它是所有工作专业人员的首选平台。随着Qwen和Claude在开发人员中的知名度越来越高,Openai又回到了其最新更新,使开发人员能够创建更可靠和有能力的AI代理。列表中的主要亮点包括响应API和代理SDK。在此博客中,我们将探讨API和代理SDK的响应,了解如何访问它们,并学习如何使用它们来构建现实世界应用程序!
响应API是OpenAI的最新API,旨在简化构建基于AI的应用程序的过程。它将聊天完成API的简单性与助手API的强大工具使用功能结合在一起。这意味着开发人员现在可以创建利用多种工具并更有效地处理复杂的多步骤任务的代理。该API减少了对复杂及时工程和外部集成的依赖。
我们的新API原始:响应API。将聊天完成的简单性与助手的工具使用相结合,这个新的基础为建筑剂提供了更大的灵活性。网络搜索,文件搜索或计算机使用是几行代码!
- 2025年3月11日,OpenAi开发人员(@openaidevs)
借助这些工具,API的响应改变了构建AI代理的游戏规则。 Infact,Buth,Neft,API的回答将支持OpenAI的所有新模型。让我们看看如何使用它来构建应用程序。
尝试响应API:
设置后,您可以请求响应API。尽管基本的API调用很常见,但其内置功能使其强大。让我们探索三个关键功能:
现在,让我们看看他们的行动!
它使模型能够通过语义和关键字搜索在先前上传文件的知识库中检索信息。当前,它不支持CSV文件,您可以在此处检查支持的文件类型的列表。
注意:使用文件搜索之前,请确保将文件存储在矢量数据库中
任务:具有领域作为数据科学的人的名字。 (我使用以下文件。)
代码:
响应= client.respons.create( 型号=“ gpt-4o-mini”, 输入=“具有域名作为数据科学的人的名称”, 工具= [{{ “ type”:“ file_search”, “ vector_store_ids”:[vector_store_id], “过滤器”:{ “ type”:“ eq”, “键”:“域”, “价值”:“数据科学” } ]] ) print(wendmess.output_text)
输出:
具有数据科学领域的人是爱丽丝·约翰逊[0]。<br> [0] names_and_domains.pdf
此功能允许模型在生成响应之前搜索Web以获取最新信息,从而确保数据保持最新状态。该模型可以选择基于输入提示符的内容搜索网络。
任务:Vijay Nagar中最好的咖啡馆是什么?
代码:
响应= client.respons.create( 型号=“ gpt-4o”, 工具= [{{ “ type”:“ web_search_preview”, “ user_location”:{ “ type”:“近似”, “国家”:“在”, “城市”:“印多尔”, “地区”:“中央邦”, } }], 输入=“ Vijay Nagar中最好的咖啡馆是什么?”, ) print(wendmess.output_text)
输出:
它是计算机使用代理(CUA)模型的实际应用,它结合了GPT-4O的视觉功能与高级推理,以模拟控制计算机接口并执行任务。
任务:查看Analytics Vidhya网站上的最新博客。
代码:
响应= client.respons.create( 型号=“计算机使用浏览”, 工具= [{{ “ type”:“ Computer_use_preview”, “ display_width”:1024, “ display_height”:768, “环境”:“浏览器”#其他可能的值:“ Mac”,“ Windows”,“ Ubuntu” }], 输入= [ { “角色”:“用户”, “内容”:“在分析Vidhya网站上查看最新博客。” } ],, 截断=“自动” ) 打印(响应。输出)
输出:
ResponseComputerToolCall(ID ='CU_67D147AF346C8192B787878719DD0E22856964FBBBB87C6A42E96',<br> Action = ActionCreenshot(type ='ScreenShot'),<br> call_id ='call_a0w16g1bnek09ayiv25vdkxy',pending_safety_checks = [],<br> status ='已完成',type ='Computer_call')
既然我们已经看到了响应API的工作原理,那么让我们看看它与先前的完整API有何不同。
API | 响应API | 完成API |
代码 | 来自Openai Import Openai 客户端= OpenAi() 响应= client.respons.create( 型号=“ gpt-4o”, 输入= [ { “角色”:“用户”, “ content”:“写一个关于独角兽的单句睡前故事。” } 这是给出的 ) print(wendmess.output_text) 登录后复制 |
来自Openai Import Openai 客户端= OpenAi() completion = client.chat.completions.create( 型号=“ gpt-4o”, 消息= [ { “角色”:“用户”, “ content”:“写一个关于独角兽的单句睡前故事。” } 这是给出的 ) 打印(完成。选择[0] .message.content) 登录后复制 |
输出 |
这是聊天补充API和响应API的各种功能的简化分解:
功能 | 响应API | 聊天完成API |
文字生成 | ✅ | ✅ |
声音的 | 即将推出 | ✅ |
想象 | ✅ | ✅ |
网络搜索 | ✅ | ✅ |
文件搜索 | ✅ | ❌ |
计算机使用 | ✅ | ❌ |
代码解释器 | 即将推出 | ❌ |
响应处理 | 返回单个结构化输出 | 返回选择数组 |
对话状态 | preson_response_id用于连续性 | 必须手动管理 |
存储行为 | 默认存储(存储:false到禁用) | 默认存储 |
响应API上线,现在燃烧的问题是,它会影响现有的聊天完成和助理API吗?是的。让我们看一下:
构建AI代理不仅仅是拥有强大的API,还需要有效的编排。这是OpenAI的代理商SDK发挥作用的地方。代理SDK是一个开源工具包,可简化代理工作流程。该代理构建框架与响应API和聊天完成API无缝集成。此外,它还与来自各个提供商的型号兼容,只要它们提供了像聊天完成一样样式的API端点。
代理SDK的一些关键特征是:
SDK特工并不是Openai珠宝的“新补充”。这是“ Swarm”的改进版本,这是OpenAI去年发布的实验性SDK。虽然“群”刚刚出于教育目的而发布,但它在开发人员中变得很流行,也被几家企业采用。为了迎合更多的企业并帮助他们无缝地建立生产级代理商,SDK已发布。现在我们知道了SDK必须提供的代理商,让我们看看如何使用此框架来构建我们的代理系统。
另请阅读:与代码相对于代码中的十大生成AI编码扩展
我们将建立一个多代理系统,该系统通过利用LLM驱动的代理和Web搜索工具来帮助用户提供汽车建议和转售价格估算,以提供准确,最新的见解。
我们首先创建一个汽车顾问代理,该代理可以帮助用户根据需求选择合适的汽车类型。
代码:
car_advisor =代理( 名称=“汽车顾问”, 说明=“您是根据他们的要求向人们建议合适的汽车类型的专家。”, 型号=“ gpt-4o”, ) 提示=“我正在寻找一辆我喜欢开车和舒适的汽车,需要4个人。我飞往山丘。我应该买什么类型的汽车?” 异步def main(): 结果=等待Runner.run(car_advisor,提示) 打印(result.final_output) #在Jupyter中运行该功能 等待main()
输出:
有了基本代理,我们现在创建了一个多代理系统,该系统结合了专门从事各自域的不同AI代理。这是其工作原理:
多代理系统中的代理
我们将向代理提供两个不同的提示,并观察他们的输出。
car_sell_estimate =代理( 名称=“汽车卖出估算”, 说明=“您是根据其制造,型号,购买年份和条件转售汽车的适当价格的专家。” handoff_description =“汽车转售价格估算专家”, 型号=“ gpt-4o”, 工具= [WebSearchTool()] ) car_model_advisor = agent( 名称=“汽车模型顾问”, 说明=“您是根据他们的预算和位置向人们建议合适的汽车模型的专家。” handoff_description =“汽车模型建议专家”, 型号=“ gpt-4o”, 工具= [WebSearchTool()] ) triage_agent =代理( name =“分诊代理”, 说明=“您确定任务的适当代理。”,, 型号=“ gpt-4o”, handoffs = [car_sell_estimate,car_model_advisor] ) 提示1: 提示=“我想在新德里出售我的EcoSport汽车。它已经3岁了,状况良好。50000公里。我应该多少价格?” 异步def main(): 结果=等待runner.run(triage_agent,提示) 打印(result.final_output) #在Jupyter中运行该功能 等待main()
输出1:
提示2:
提示=“我想买一辆高加速车,在新德里为200万人容纳4个人,我应该买哪辆车?” 异步def main(): 结果=等待runner.run(triage_agent,提示) 打印(result.final_output) #在Jupyter中运行该功能 等待main()
输出2:
我们根据要求获得了汽车选择!实现很简单快捷。您可以使用此代理框架来建立旅行支持,财务计划,医疗援助,个性化购物,自动化研究等等的代理商。
Openai的代理SDK代表了其为为AI代理开发提供专门的框架的战略努力。该框架包括通过其Triage代理的类似船员的功能,模仿了机组人员的功能。同样,其交接机制与自动基因的交接机制非常相似,从而有效地委派了多个试剂之间的任务。
此外,Langchain在模块化代理编排中的强度以SDK提供结构化的工作流程的方式反映了,从而确保了平稳的执行和适应性。尽管Adents SDK只提供了现有框架已经做的事情,但它很快就会给他们带来激烈的竞争。
另请阅读:Claude 3.7十四行诗:迄今为止最好的编码模型?
响应API和代理SDK为开发人员提供了构建AI驱动应用程序的工具和平台。通过减少对手动及时工程的依赖和广泛的自定义逻辑,这些工具使开发人员可以专注于用最小的摩擦来创建智能工作流程。
这是一个视频,旨在了解有关OpenAi的响应API和代理SDK的更多信息。
引入OpenAI响应API和代理SDK是AI驱动自动化的游戏规则改变者。通过利用这些工具,我们仅使用几行代码成功地成功地构建了一个多代理系统。可以进一步扩展此实施,以包括其他工具,集成和代理功能,为在各个行业中更聪明和自主的AI应用程序铺平道路。
这些工具肯定会帮助开发人员和企业降低开发的复杂性,并创建更智能,更可扩展的自动化解决方案。无论是用于客户支持,研究,业务自动化还是针对特定行业的AI应用程序,响应API和代理SDK都提供了一个有力的框架,可轻松构建下一代AI驱动系统。
答:响应API是OpenAI的最新AI框架,它通过集成了内置工具(例如Web搜索,文件搜索和计算机使用)来简化代理开发。
Q2。响应API与完成API有何不同?答:与完成API不同,响应API支持多工具集成,结构化输出和内置的对话状态管理。
Q3。什么是Openai的代理SDK?答:Adents SDK是一个开源框架,使开发人员能够以AI驱动的自动化来构建和协调多代理系统。
Q4。代理商SDK如何改善AI开发?答:它允许无缝的代理协调,增强的可观察性,内置护栏和改进的性能跟踪。
Q5。可以一起使用响应API和代理SDK吗?答:是的!代理SDK与响应API集成,以创建强大的AI驱动应用程序。
Q6。 Openai的代理SDK是否与其他AI型号兼容?答:是的,它可以与支持聊天完成API风格集成的第三方模型一起使用。
Q7。哪些行业可以从多代理AI系统中受益?答:汽车,金融,医疗保健,客户支持和研究等行业可以使用AI驱动的代理来优化运营和决策。
以上是如何使用OpenAI的响应API和Agent SDK? - 分析Vidhya的详细内容。更多信息请关注PHP中文网其他相关文章!