OpenAIの応答API＆エージェントSDKを使用する方法は？

Openaiは、Genaiスペースの大手ソリューションプロバイダーです。伝説的なChatGptからソラまで、それはそこにいるすべての働く専門家にとって頼りになるプラットフォームです。 QwenとClaudeが開発者の間で人気を博しているため、Openaiは最新の更新に再び戻ってきました。リストの主要なハイライトには、回答APIおよびエージェントSDKが含まれます。このブログでは、回答APIとAgents SDKを調査し、それらにアクセスする方法を理解し、それらを使用して実際のアプリケーションを構築する方法を学びます。

回答APIとは何ですか？
応答APIの使用方法は？
回答APIは、完了APIとどのように違いますか？
エージェントSDKの紹介
エージェントSDKを使用してマルチエージェントシステムを構築します
なぜ開発者はAPI＆Agents SDKに応答する必要があるのですか？
結論
よくある質問

回答APIとは何ですか？

回答APIは、AIベースのアプリケーションを構築するプロセスを簡素化するために設計されたOpenAIの最新のAPIです。チャット完了APIのシンプルさと、アシスタントAPIの強力なツール使用機能を組み合わせます。これは、開発者が複数のツールを活用し、複雑でマルチステップのタスクをより効率的に処理するエージェントを作成できるようになりました。このAPIは、複雑な迅速なエンジニアリングと外部統合への依存を減らしました。

私たちの新しいAPIプリミティブ：応答API。チャット完了のシンプルさをアシスタントのツール使用と組み合わせることで、この新しい基盤は、エージェントの建築により柔軟性を高めます。 Web検索、ファイル検索、またはコンピューターの使用はコードの数行です！https：//t.co/s5zsy4wvqy pic.twitter.com/parhjhsjgv
- Openai開発者（@openaidevs）2025年3月11日

応答APIの重要な機能

Web検索、ファイル検索、コンピューターの使用などの組み込みツールにより、エージェントが実際のデータと対話できるようになります。
多型を簡素化し、使いやすさを向上させる統一された設計。
より良い観察可能性、開発者がエージェントの動作を追跡し、ワークフローを最適化するのに役立ちます。
Openaiの標準価格設定でのトークンの使用に基づいて請求されるため、追加費用はありません。

これらのツールを使用すると、Response APIはAIエージェントの構築に向けたゲームチェンジャーです。今後、APIの回答は、Openaiの新しいモデルと今後のすべてのモデルをすべてサポートします。アプリケーションを構築するためにそれを使用する方法を見てみましょう。

応答APIの使用方法は？

応答を試すには、API：

OpenAI（まだインストールされていない場合）をインストールし、OpenAIを使用します。
最新のOpenaiライブラリ（PIPインストールOpenai - -Upgrade）があることを確認してください。
OpenAIをインポートし、クライアントをセットアップします。

セットアップしたら、回答APIをリクエストできます。基本的なAPI呼び出しは一般的ですが、組み込みの機能により強力になります。 3つの重要な機能を調べてみましょう。

ファイル検索：ドキュメントから洞察を取得します。
Web検索：リアルタイムで引用された情報を取得します。
コンピューターの使用：システムの相互作用を自動化します。

さて、それらが動作しているのを見てみましょう！

1。ファイル検索

モデルは、セマンティックおよびキーワード検索を介して、以前にアップロードされたファイルの知識ベースで情報を取得できます。現在、CSVファイルをサポートしていません。サポートされているファイルタイプのリストをこちらで確認できます。

注：ファイル検索を使用する前に、ファイルをベクトルデータベースに保存してください

タスク：データサイエンスとしてのドメインを持つ人々の名前。（次のファイルを使用しました。）

コード：

 Response = client.responses.create（

Model = "gpt-4o-mini"、

input = "データサイエンスとしてドメインを持つ人の名前"、

ツール= [{

「タイプ」：「file_search」、

「vector_store_ids」：[vector_store_id]、

「フィルター」：{

「タイプ」：「eq」、

「キー」：「ドメイン」、

「価値」：「データサイエンス」

}

}]

））

print（respons.output_text）

ログイン後にコピー

出力：

データサイエンスの領域を持つ人はアリス・ジョンソンです[0]。<br> [0] names_and_domains.pdf

ログイン後にコピー

2。Web検索

この機能により、モデルは応答を生成する前に最新情報をWebで検索し、データが最新の状態を維持することを保証できます。モデルは、入力プロンプトのコンテンツに基づいてWebを検索するかどうかを選択できます。

タスク：Vijay Nagarで最高のカフェは何ですか？

コード：

 Response = client.responses.create（

Model = "GPT-4O"、

ツール= [{

「タイプ」：「web_search_preview」、

「user_location」：{

「タイプ」：「おおよそ」、

「国」：「in」、

「都市」：「インドール」、

「地域」：「マディヤ・プラデシュ」、

}

}]、

input = "Vijay Nagarで最高のカフェは何ですか？"

））

print（respons.output_text）

ログイン後にコピー

出力：

OpenAIの応答API＆エージェントSDKを使用する方法は？ - 分析Vidhya

3。コンピューターの使用

これは、コンピューター使用エージェント（CUA）モデルの実用的なアプリケーションであり、GPT-4oのビジョン機能と、コンピューターインターフェイスを制御してタスクを実行するための高度な推論を組み合わせています。

タスク：Analytics Vidhya Webサイトの最新のブログを確認してください。

コード：

 Response = client.responses.create（

Model = "Computer-Use-Preview"、

ツール= [{

「タイプ」：「Computer_use_preview」、

「display_width」：1024、

「display_height」：768、

「環境」：「ブラウザ」＃その他の可能な値：「Mac」、「Windows」、「Ubuntu」

}]、

入力= [

{

「役割」：「ユーザー」、

「コンテンツ」：「Analytics Vidhya Webサイトの最新のブログをチェックしてください。」

}

]、、

truncation = "auto"

））

print（respons.output）

ログイン後にコピー

出力：

 ResponseComputertOlCall（ID = 'CU_67D147AF346C8192B78719DD0E22856964FBB87C6A42E96'、<br> action = actionscreenshot（type = 'スクリーンショット'）、<br> call_id = 'call_a0w16g1bnek09ayiv25vdkxy'、pending_safety_checks = []、<br> status = '完了'、type = 'computer_call'）

ログイン後にコピー

回答APIは、完了APIとどのように違いますか？

応答がどのように機能するかを見たので、既存の完了APIとそれがどれほど違うかを見てみましょう。

応答API対完了API：実行

API	応答API	完了API
コード	Openai Import Openaiから client = openai（） Response = client.responses.create（ Model = "GPT-4O"、入力= [ { 「役割」：「ユーザー」、「コンテンツ」：「ユニコーンについての1文の就寝時の物語を書く」。 } ] ）） print（respons.output_text）ログイン後にコピー	Openai Import Openaiから client = openai（） client = client.chat.completions.create（ Model = "GPT-4O"、メッセージ= [ { 「役割」：「ユーザー」、「コンテンツ」：「ユニコーンについての1文の就寝時の物語を書く」。 } ] ）） print（complete.choices [0] .message.content）ログイン後にコピー
出力

API

応答API

完了API

コード

Openai Import Openaiから
client = openai（）
Response = client.responses.create（
    Model = "GPT-4O"、
    入力= [
        {
            「役割」：「ユーザー」、
            「コンテンツ」：「ユニコーンについての1文の就寝時の物語を書く」。
        }
    ]
））
print（respons.output_text）

ログイン後にコピー

 Openai Import Openaiから
client = openai（）
client = client.chat.completions.create（
    Model = "GPT-4O"、
    メッセージ= [
        {
            「役割」：「ユーザー」、
            「コンテンツ」：「ユニコーンについての1文の就寝時の物語を書く」。
        }
    ]
））
print（complete.choices [0] .message.content）

ログイン後にコピー

出力

OpenAIの応答API＆エージェントSDKを使用する方法は？ - 分析Vidhya

応答API対完了API：機能

ここに、チャットコンプリオンAPIと応答APIのさまざまな機能の単純化された内訳があります。

機能	応答API	チャット完了API
テキスト生成	✅	✅
オーディオ	近日公開	✅
ビジョン	✅	✅
Web検索	✅	✅
ファイル検索	✅	❌
コンピューターの使用	✅	❌
コードインタープリター	近日公開	❌
応答処理	単一の構造化された出力を返します	選択アレイを返します
会話状態	継続性のfortion_response_id	手動で管理する必要があります
ストレージ動作	デフォルトで保存されている（store：false to disable）	デフォルトで保存されます

ロードマップ：何が続きますか、何が非難されますか？

回答APIがライブになると、燃えるような問題は、既存のチャットの完了とアシスタントAPIに影響するでしょうか？はい、そうします。方法を見てみましょう：

Chat Completions API： OpenAIは、新しいモデルで更新され続けますが、機能が組み込みツールを必要としない場合にのみです。
Web検索およびファイル検索ツール：これらは、応答APIでより洗練され、強力になります。
アシスタントAPI： Responses APIには、パフォーマンスを向上させながら最高の機能が組み込まれています。 Openaiは、フルフィーチャーパリティが間もなく登場することを発表し、アシスタントAPIは2026年半ばまでに非推奨になります。

エージェントSDKの紹介

AIエージェントの構築は、強力なAPIを持っているだけでなく、効率的なオーケストレーションが必要です。これは、OpenaiのエージェントSDKが出てくる場所です。エージェントSDKは、エージェントワークフローを簡素化するオープンソースツールキットです。このエージェントビルディングフレームワークは、応答APIおよびチャット完了APIとシームレスに統合されています。さらに、チャットの完了のようなスタイルのAPIエンドポイントを提供する場合、さまざまなプロバイダーのモデルと互換性があります。

エージェントSDKの重要な機能のいくつかは次のとおりです。

開発者は、組み込みのツールでAIエージェントを構成することができます。
これにより、マルチエージェントオーケストレーションが可能になり、必要に応じてさまざまなエージェントのシームレスな調整が可能になります。
エージェント間の会話と情報の流れを追跡することができます。
安全性とコンプライアンスのためにガードレールを適用する簡単な方法を可能にします。
開発者は、組み込みの観測可能性ツールでエージェントのパフォーマンスを監視および最適化できるようにします。

エージェントSDKは、Openaiの宝石への「新しい追加」ではありません。これは、Openaiが昨年リリースした実験的なSDKである「Swarm」の改良版です。「Swarm」は教育目的でリリースされたばかりですが、開発者の間で人気があり、いくつかの企業にも採用されました。より多くの企業に対応し、生産グレードのエージェントをシームレスに構築するのを支援するために、エージェントSDKがリリースされました。 SDKが提供するエージェントがどのようなものを提供しているかがわかったので、このフレームワークを使用してエージェントシステムを構築する方法を見てみましょう。

また読む：vsコードのトップ10生成AIコーディング拡張機能

エージェントSDKを使用してマルチエージェントシステムを構築します

LLMを搭載したエージェントとWeb検索ツールを活用して、正確で最新の洞察を提供することにより、ユーザーが車の推奨事項と再販価格の見積もりを支援するマルチエージェントシステムを構築します。

ステップ1：シンプルなAIエージェントの構築

まず、ユーザーがニーズに基づいて適切な車の種類を選択するのに役立つカーアドバイザーエージェントを作成することから始めます。

コード：

 car_advisor = agent（

name = "Car Advisor"、

指示= "あなたは、セダン、ハッチバックなどの適切な車の種類に要件に基づいて人々に助言する専門家です。」

Model = "GPT-4O"、

））

PROMP = "私は運転を楽しんでいて、快適に4人を連れて行く車を探しています。私は丘に旅行するために飛行機です。どんな種類の車を買うべきですか？」

async def main（）：

result = await runner.run（car_advisor、prompt）

print（result.final_output）

＃jupyterで関数を実行します

Main（）を待っています

ログイン後にコピー

出力：

OpenAIの応答API＆エージェントSDKを使用する方法は？ - 分析Vidhya

ステップ2：マルチエージェントシステムを構築します

基本エージェントを設置すると、それぞれのドメインに特化したさまざまなAIエージェントを組み込んだマルチエージェントシステムを作成します。これがどのように機能しますか：

マルチエージェントシステムのエージェント

自動車販売見積もりエージェント：車の詳細に基づいて再販価格の見積もりを提供します。
自動車モデルアドバイザーエージェント：予算と場所に基づいて適切な自動車モデルを提案します。
トリアージエージェント：適切なエージェントにクエリを指示します。

エージェントに2つの異なるプロンプトを提供し、それらの出力を観察します。

コード：

 car_sell_estimate = agent（

name = "車の販売見積もり"、

指示= "あなたは、そのメーカー、モデル、購入年、および条件に基づいて車を再販する適切な価格を提案する専門家です。」

handoff_description = "車の再販価格の見積もりエキスパート"、

Model = "GPT-4O"、

ツール= [websearchtool（）]

））

car_model_advisor = agent（

name = "Car Model Advisor"、

指示= "あなたは、予算と場所に基づいて人々に適切な車モデルを助言する専門家です。」

handoff_description = "カーモデルの推奨エキスパート"、

Model = "GPT-4O"、

ツール= [websearchtool（）]

））

triage_agent = agent（

name = "トリアージエージェント"、

命令= "タスクに適切なエージェントを決定します。"、

Model = "GPT-4O"、

ハンドオフ= [car_sell_estimate、car_model_advisor]

））

プロンプト1： 

PROMP = "私はニューデリーでEcoSport車を販売したい。それは3歳で良好な状態である。50000km。どんな価格を期待すべきか？」

async def main（）：

result = await runner.run（triage_agent、prompt）

print（result.final_output）

＃jupyterで関数を実行します

Main（）を待っています

ログイン後にコピー

出力1：

OpenAIの応答API＆エージェントSDKを使用する方法は？ - 分析Vidhya

プロンプト2：

プロンプト= "ニューデリーで20万ルピーのために4人で快適な高加速車を購入したい。どの車を買うべきだ？」

async def main（）：

result = await runner.run（triage_agent、prompt）

print（result.final_output）

＃jupyterで関数を実行します

Main（）を待っています

ログイン後にコピー

出力2：

OpenAIの応答API＆エージェントSDKを使用する方法は？ - 分析Vidhya

要件に応じて車のオプションを取得しました！実装はシンプルで迅速でした。このエージェントフレームワークを使用して、旅行サポート、財務計画、医療支援、パーソナライズされたショッピング、自動研究などのエージェントを構築できます。

エージェントのSDK：町の新しいエージェントフレームワーク？

OpenaiのエージェントSDKは、AIエージェント開発のための専用フレームワークを提供するための戦略的な推進を表しています。フレームワークには、トリアージエージェントを介した乗組員のような機能が含まれており、乗組員のAIの機能を模倣しています。同様に、そのハンドオフメカニズムはオートゲンのメカニズムに非常に似ており、複数のエージェント間のタスクの効率的な委任を可能にします。

さらに、モジュラーエージェントオーケストレーションにおけるLangchainの強度は、エージェントSDKが構造化されたワークフローを提供する方法に反映され、スムーズな実行と適応性を確保します。エージェントSDKは、既存のフレームワークがすでに行っていること以上のものを提供しませんが、すぐに彼らに厳しい競争を与えます。

また読む：Claude 3.7 Sonnet：まだ最高のコーディングモデル？

なぜ開発者はAPI＆Agents SDKに応答する必要があるのですか？

応答APIとエージェントSDKは、AI駆動型アプリケーションを構築するためのツールとプラットフォームを開発者に提供します。これらのツールにより、手動の迅速なエンジニアリングと広範なカスタムロジックへの依存を減らすことにより、開発者は最小限の摩擦でインテリジェントなワークフローの作成に集中できます。

簡単な統合：開発者は、異なるツールについて複数のAPIをジャグリングする必要がなくなりました。回答APIは、Web検索、ファイル検索、およびコンピューターの使用を単一のインターフェイスに統合します。
より優れた観測可能性：監視やデバッグツールが組み込まれているため、開発者はエージェントのパフォーマンスをより簡単に最適化できます。
スケーラビリティ：エージェントSDKは、マルチエージェントワークフローを処理するための構造化されたアプローチを提供し、より堅牢な自動化を可能にします。
改善された開発サイクル：大規模な迅速な反復と外部ツール統合の必要性を排除することにより、開発者はエージェントベースのアプリケーションをはるかに速いペースでプロトタイプおよび展開できます。

OpenaiのResponses APIとAgents SDKの詳細については、これがビデオです。

結論

OpenAIのResponse APIとAgents SDKの導入は、AI駆動型の自動化のゲームチェンジャーです。これらのツールを活用することにより、わずか数行のコードでマルチエージェントシステムを非常に迅速に構築しました。この実装をさらに拡張して、追加のツール、統合、エージェント機能を含めることができ、さまざまな業界でよりインテリジェントで自律的なAIアプリケーションへの道を開きます。

これらのツールは、開発者と企業が開発の複雑さを減らし、よりスマートでスケーラブルな自動化ソリューションを作成するのに確実に役立ちます。顧客サポート、調査、ビジネスオートメーション、または業界固有のAIアプリケーションのいずれであっても、Responses APIとAgents SDKは、次世代のAI駆動システムを簡単に構築するための強力なフレームワークを提供します。