Openaiは、Genaiスペースの大手ソリューションプロバイダーです。伝説的なChatGptからソラまで、それはそこにいるすべての働く専門家にとって頼りになるプラットフォームです。 QwenとClaudeが開発者の間で人気を博しているため、Openaiは最新の更新に再び戻ってきました。リストの主要なハイライトには、回答APIおよびエージェントSDKが含まれます。このブログでは、回答APIとAgents SDKを調査し、それらにアクセスする方法を理解し、それらを使用して実際のアプリケーションを構築する方法を学びます。
回答APIは、AIベースのアプリケーションを構築するプロセスを簡素化するために設計されたOpenAIの最新のAPIです。チャット完了APIのシンプルさと、アシスタントAPIの強力なツール使用機能を組み合わせます。これは、開発者が複数のツールを活用し、複雑でマルチステップのタスクをより効率的に処理するエージェントを作成できるようになりました。このAPIは、複雑な迅速なエンジニアリングと外部統合への依存を減らしました。
私たちの新しいAPIプリミティブ:応答API。チャット完了のシンプルさをアシスタントのツール使用と組み合わせることで、この新しい基盤は、エージェントの建築により柔軟性を高めます。 Web検索、ファイル検索、またはコンピューターの使用はコードの数行です!https://t.co/s5zsy4wvqy pic.twitter.com/parhjhsjgv
- Openai開発者(@openaidevs)2025年3月11日
これらのツールを使用すると、Response APIはAIエージェントの構築に向けたゲームチェンジャーです。今後、APIの回答は、Openaiの新しいモデルと今後のすべてのモデルをすべてサポートします。アプリケーションを構築するためにそれを使用する方法を見てみましょう。
応答を試すには、API:
セットアップしたら、回答APIをリクエストできます。基本的なAPI呼び出しは一般的ですが、組み込みの機能により強力になります。 3つの重要な機能を調べてみましょう。
さて、それらが動作しているのを見てみましょう!
モデルは、セマンティックおよびキーワード検索を介して、以前にアップロードされたファイルの知識ベースで情報を取得できます。現在、CSVファイルをサポートしていません。サポートされているファイルタイプのリストをこちらで確認できます。
注:ファイル検索を使用する前に、ファイルをベクトルデータベースに保存してください
タスク:データサイエンスとしてのドメインを持つ人々の名前。 (次のファイルを使用しました。)
コード:
Response = client.responses.create( Model = "gpt-4o-mini"、 input = "データサイエンスとしてドメインを持つ人の名前"、 ツール= [{ 「タイプ」:「file_search」、 「vector_store_ids」:[vector_store_id]、 「フィルター」:{ 「タイプ」:「eq」、 「キー」:「ドメイン」、 「価値」:「データサイエンス」 } }] )) print(respons.output_text)
出力:
データサイエンスの領域を持つ人はアリス・ジョンソンです[0]。<br> [0] names_and_domains.pdf
この機能により、モデルは応答を生成する前に最新情報をWebで検索し、データが最新の状態を維持することを保証できます。モデルは、入力プロンプトのコンテンツに基づいてWebを検索するかどうかを選択できます。
タスク:Vijay Nagarで最高のカフェは何ですか?
コード:
Response = client.responses.create( Model = "GPT-4O"、 ツール= [{ 「タイプ」:「web_search_preview」、 「user_location」:{ 「タイプ」:「おおよそ」、 「国」:「in」、 「都市」:「インドール」、 「地域」:「マディヤ・プラデシュ」、 } }]、 input = "Vijay Nagarで最高のカフェは何ですか?" )) print(respons.output_text)
出力:
これは、コンピューター使用エージェント(CUA)モデルの実用的なアプリケーションであり、GPT-4oのビジョン機能と、コンピューターインターフェイスを制御してタスクを実行するための高度な推論を組み合わせています。
タスク:Analytics Vidhya Webサイトの最新のブログを確認してください。
コード:
Response = client.responses.create( Model = "Computer-Use-Preview"、 ツール= [{ 「タイプ」:「Computer_use_preview」、 「display_width」:1024、 「display_height」:768、 「環境」:「ブラウザ」#その他の可能な値:「Mac」、「Windows」、「Ubuntu」 }]、 入力= [ { 「役割」:「ユーザー」、 「コンテンツ」:「Analytics Vidhya Webサイトの最新のブログをチェックしてください。」 } ]、、 truncation = "auto" )) print(respons.output)
出力:
ResponseComputertOlCall(ID = 'CU_67D147AF346C8192B78719DD0E22856964FBB87C6A42E96'、<br> action = actionscreenshot(type = 'スクリーンショット')、<br> call_id = 'call_a0w16g1bnek09ayiv25vdkxy'、pending_safety_checks = []、<br> status = '完了'、type = 'computer_call')
応答がどのように機能するかを見たので、既存の完了APIとそれがどれほど違うかを見てみましょう。
API | 応答API | 完了API |
コード | Openai Import Openaiから client = openai() Response = client.responses.create( Model = "GPT-4O"、 入力= [ { 「役割」:「ユーザー」、 「コンテンツ」:「ユニコーンについての1文の就寝時の物語を書く」。 } ] )) print(respons.output_text) ログイン後にコピー |
Openai Import Openaiから client = openai() client = client.chat.completions.create( Model = "GPT-4O"、 メッセージ= [ { 「役割」:「ユーザー」、 「コンテンツ」:「ユニコーンについての1文の就寝時の物語を書く」。 } ] )) print(complete.choices [0] .message.content) ログイン後にコピー |
出力 |
ここに、チャットコンプリオンAPIと応答APIのさまざまな機能の単純化された内訳があります。
機能 | 応答API | チャット完了API |
テキスト生成 | ✅ | ✅ |
オーディオ | 近日公開 | ✅ |
ビジョン | ✅ | ✅ |
Web検索 | ✅ | ✅ |
ファイル検索 | ✅ | ❌ |
コンピューターの使用 | ✅ | ❌ |
コードインタープリター | 近日公開 | ❌ |
応答処理 | 単一の構造化された出力を返します | 選択アレイを返します |
会話状態 | 継続性のfortion_response_id | 手動で管理する必要があります |
ストレージ動作 | デフォルトで保存されている(store:false to disable) | デフォルトで保存されます |
回答APIがライブになると、燃えるような問題は、既存のチャットの完了とアシスタントAPIに影響するでしょうか?はい、そうします。方法を見てみましょう:
AIエージェントの構築は、強力なAPIを持っているだけでなく、効率的なオーケストレーションが必要です。これは、OpenaiのエージェントSDKが出てくる場所です。エージェントSDKは、エージェントワークフローを簡素化するオープンソースツールキットです。このエージェントビルディングフレームワークは、応答APIおよびチャット完了APIとシームレスに統合されています。さらに、チャットの完了のようなスタイルのAPIエンドポイントを提供する場合、さまざまなプロバイダーのモデルと互換性があります。
エージェントSDKの重要な機能のいくつかは次のとおりです。
エージェントSDKは、Openaiの宝石への「新しい追加」ではありません。これは、Openaiが昨年リリースした実験的なSDKである「Swarm」の改良版です。 「Swarm」は教育目的でリリースされたばかりですが、開発者の間で人気があり、いくつかの企業にも採用されました。より多くの企業に対応し、生産グレードのエージェントをシームレスに構築するのを支援するために、エージェントSDKがリリースされました。 SDKが提供するエージェントがどのようなものを提供しているかがわかったので、このフレームワークを使用してエージェントシステムを構築する方法を見てみましょう。
また読む:vsコードのトップ10生成AIコーディング拡張機能
LLMを搭載したエージェントとWeb検索ツールを活用して、正確で最新の洞察を提供することにより、ユーザーが車の推奨事項と再販価格の見積もりを支援するマルチエージェントシステムを構築します。
まず、ユーザーがニーズに基づいて適切な車の種類を選択するのに役立つカーアドバイザーエージェントを作成することから始めます。
コード:
car_advisor = agent( name = "Car Advisor"、 指示= "あなたは、セダン、ハッチバックなどの適切な車の種類に要件に基づいて人々に助言する専門家です。」 Model = "GPT-4O"、 )) PROMP = "私は運転を楽しんでいて、快適に4人を連れて行く車を探しています。私は丘に旅行するために飛行機です。どんな種類の車を買うべきですか?」 async def main(): result = await runner.run(car_advisor、prompt) print(result.final_output) #jupyterで関数を実行します Main()を待っています
出力:
基本エージェントを設置すると、それぞれのドメインに特化したさまざまなAIエージェントを組み込んだマルチエージェントシステムを作成します。これがどのように機能しますか:
マルチエージェントシステムのエージェント
エージェントに2つの異なるプロンプトを提供し、それらの出力を観察します。
car_sell_estimate = agent( name = "車の販売見積もり"、 指示= "あなたは、そのメーカー、モデル、購入年、および条件に基づいて車を再販する適切な価格を提案する専門家です。」 handoff_description = "車の再販価格の見積もりエキスパート"、 Model = "GPT-4O"、 ツール= [websearchtool()] )) car_model_advisor = agent( name = "Car Model Advisor"、 指示= "あなたは、予算と場所に基づいて人々に適切な車モデルを助言する専門家です。」 handoff_description = "カーモデルの推奨エキスパート"、 Model = "GPT-4O"、 ツール= [websearchtool()] )) triage_agent = agent( name = "トリアージエージェント"、 命令= "タスクに適切なエージェントを決定します。"、 Model = "GPT-4O"、 ハンドオフ= [car_sell_estimate、car_model_advisor] )) プロンプト1: PROMP = "私はニューデリーでEcoSport車を販売したい。それは3歳で良好な状態である。50000km。どんな価格を期待すべきか?」 async def main(): result = await runner.run(triage_agent、prompt) print(result.final_output) #jupyterで関数を実行します Main()を待っています
出力1:
プロンプト2:
プロンプト= "ニューデリーで20万ルピーのために4人で快適な高加速車を購入したい。どの車を買うべきだ?」 async def main(): result = await runner.run(triage_agent、prompt) print(result.final_output) #jupyterで関数を実行します Main()を待っています
出力2:
要件に応じて車のオプションを取得しました!実装はシンプルで迅速でした。このエージェントフレームワークを使用して、旅行サポート、財務計画、医療支援、パーソナライズされたショッピング、自動研究などのエージェントを構築できます。
OpenaiのエージェントSDKは、AIエージェント開発のための専用フレームワークを提供するための戦略的な推進を表しています。フレームワークには、トリアージエージェントを介した乗組員のような機能が含まれており、乗組員のAIの機能を模倣しています。同様に、そのハンドオフメカニズムはオートゲンのメカニズムに非常に似ており、複数のエージェント間のタスクの効率的な委任を可能にします。
さらに、モジュラーエージェントオーケストレーションにおけるLangchainの強度は、エージェントSDKが構造化されたワークフローを提供する方法に反映され、スムーズな実行と適応性を確保します。エージェントSDKは、既存のフレームワークがすでに行っていること以上のものを提供しませんが、すぐに彼らに厳しい競争を与えます。
また読む:Claude 3.7 Sonnet:まだ最高のコーディングモデル?
応答APIとエージェントSDKは、AI駆動型アプリケーションを構築するためのツールとプラットフォームを開発者に提供します。これらのツールにより、手動の迅速なエンジニアリングと広範なカスタムロジックへの依存を減らすことにより、開発者は最小限の摩擦でインテリジェントなワークフローの作成に集中できます。
OpenaiのResponses APIとAgents SDKの詳細については、これがビデオです。
OpenAIのResponse APIとAgents SDKの導入は、AI駆動型の自動化のゲームチェンジャーです。これらのツールを活用することにより、わずか数行のコードでマルチエージェントシステムを非常に迅速に構築しました。この実装をさらに拡張して、追加のツール、統合、エージェント機能を含めることができ、さまざまな業界でよりインテリジェントで自律的なAIアプリケーションへの道を開きます。
これらのツールは、開発者と企業が開発の複雑さを減らし、よりスマートでスケーラブルな自動化ソリューションを作成するのに確実に役立ちます。顧客サポート、調査、ビジネスオートメーション、または業界固有のAIアプリケーションのいずれであっても、Responses APIとAgents SDKは、次世代のAI駆動システムを簡単に構築するための強力なフレームワークを提供します。
A.回答APIは、Web検索、ファイル検索、コンピューターの使用などの組み込みツールを統合することにより、エージェントの開発を簡素化するOpenAIの最新のAIフレームワークです。
Q2。回答APIは、完了APIとどのように違いますか?A.完了APIとは異なり、回答APIはマルチツール統合、構造化された出力、および組み込みの会話状態管理をサポートします。
Q3。 OpenaiのエージェントSDKとは何ですか?A.エージェントSDKは、開発者がAI駆動の自動化でマルチエージェントシステムを構築および調整できるようにするオープンソースフレームワークです。
Q4。エージェントSDKはどのようにAI開発を改善しますか?A.シームレスなエージェント調整、観察性の向上、内蔵ガードレール、パフォーマンス追跡の改善が可能になります。
Q5。応答APIとエージェントSDKを一緒に使用できますか?A.はい!エージェントSDKは、Response APIと統合して、強力なAI駆動型アプリケーションを作成します。
Q6。 OpenaiのエージェントSDKは他のAIモデルと互換性がありますか?A.はい、チャットの完了APIスタイルの統合をサポートするサードパーティモデルで動作します。
Q7。マルチエージェントAIシステムからどのような産業が恩恵を受けることができますか?A.自動車、金融、ヘルスケア、カスタマーサポート、研究などの産業は、AI主導のエージェントを使用して、運用と意思決定を最適化することができます。
以上がOpenAIの応答API&エージェントSDKを使用する方法は? - 分析Vidhyaの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。