> 기술 주변기기 > 일체 포함 > OpenAI의 응답 API 및 에이전트 SDK를 사용하는 방법은 무엇입니까? - 분석 Vidhya

OpenAI의 응답 API 및 에이전트 SDK를 사용하는 방법은 무엇입니까? - 분석 Vidhya

Christopher Nolan
풀어 주다: 2025-03-21 09:35:10
원래의
746명이 탐색했습니다.

OpenAi는 Genai Space의 주요 솔루션 제공 업체였습니다. 전설적인 chatgpt에서 Sora에 이르기까지 모든 작업 전문가를위한 플랫폼입니다. Qwen과 Claude가 개발자들 사이에서 인기를 얻었으므로 Openai는 최신 업데이트로 다시 돌아 왔으며 개발자가보다 신뢰할 수 있고 유능한 AI 에이전트를 만들 수 있습니다. 이 목록의 주요 하이라이트에는 응답 API 및 에이전트 SDK가 포함됩니다. 이 블로그에서는 응답 API 및 에이전트 SDK를 탐색하고 액세스 방법을 이해하고 실제 응용 프로그램을 구축하는 방법을 배우게됩니다!

목차

  • 응답 API는 무엇입니까?
  • 응답 API를 사용하는 방법?
  • 응답 API는 완료 API와 어떻게 다릅니 까?
  • 에이전트 SDK 소개
  • 에이전트 SDK를 사용하여 다중 대용 시스템을 구축하십시오
  • 개발자가 응답 API 및 에이전트 SDK가 필요한 이유는 무엇입니까?
  • 결론
  • 자주 묻는 질문

응답 API는 무엇입니까?

응답 API는 AI 기반 애플리케이션을 구축하는 프로세스를 단순화하도록 설계된 OpenAI의 최신 API입니다. 채팅 완료 API의 단순성을 Assistant API의 강력한 공구 사용 기능과 결합합니다. 즉, 개발자는 이제 여러 도구를 활용하고 복잡한 다중 단계 작업을보다 효율적으로 처리하는 에이전트를 만들 수 있습니다. 이 API는 복잡한 프롬프트 엔지니어링 및 외부 통합에 대한 의존을 줄였습니다.

우리의 새로운 API 원시 : 응답 API. 채팅 완성의 단순성을 조수의 도구 사용과 결합 하여이 새로운 기초는 건물 에이전트에 더 많은 유연성을 제공합니다. 웹 검색, 파일 검색 또는 컴퓨터 사용은 몇 줄의 코드입니다! https : //t.co/s5zsy4wvqy pic.twitter.com/parhjhsjgv

- Openai 개발자 (@openaidevs) 2025 년 3 월 11 일

응답 API의 주요 기능

  • 웹 검색, 파일 검색 및 컴퓨터 사용과 같은 내장 도구를 통해 에이전트가 실제 데이터와 상호 작용할 수 있습니다.
  • 다형성을 단순화하고 유용성을 향상시키는 통합 설계.
  • 더 나은 관찰 가능성, 개발자가 에이전트 행동을 추적하고 워크 플로우를 최적화하도록 돕습니다.
  • OpenAI의 표준 가격에서 토큰 사용을 기준으로 청구되므로 추가 비용이 없습니다.

이러한 도구를 사용하면 응답 API는 AI 에이전트를 구축하기위한 게임 체인저입니다. 발전에 따르면, 응답 API는 OpenAI의 모든 신규 및 다가오는 모델을 지원할 것입니다. 응용 프로그램을 구축하기 위해 어떻게 사용할 수 있는지 살펴 보겠습니다.

응답 API를 사용하는 방법?

응답 API를 시도하려면 :

  1. OpenAI (아직 설치되지 않은 경우)를 설치하고 OpenAI를 사용하십시오.
  2. 최신 OpenAI 라이브러리 (PIP 설치 OpenAi - -업그레이드)가 있는지 확인하십시오.
  3. OpenAI를 가져오고 클라이언트를 설정하십시오.

설치되면 응답 API를 요청할 수 있습니다. 기본 API 호출은 일반적이지만 내장 기능은 강력합니다. 세 가지 주요 기능을 살펴 보겠습니다.

  • 파일 검색 : 문서에서 통찰력을 검색합니다.
  • 웹 검색 : 실시간, 인용 정보를 얻습니다.
  • 컴퓨터 사용 : 시스템 상호 작용을 자동화합니다.

자, 그들을 실제로 보자!

1. 파일 검색

이를 통해 모델은 시맨틱 및 키워드 검색을 통해 이전에 업로드 된 파일의 지식 기반에서 정보를 검색 할 수 있습니다. 현재 CSV 파일을 지원하지 않으므로 여기에서 지원되는 파일 유형 목록을 확인할 수 있습니다.

참고 : 파일 검색을 사용하기 전에 파일을 벡터 데이터베이스에 저장하십시오.

작업 : 데이터 과학으로 도메인을 가진 사람들의 이름. (다음 파일을 사용했습니다.)

암호:

 응답 = client.responses.create (

model = "gpt-4o-mini",

입력 = "데이터 과학으로 도메인을 가진 사람들의 이름",

도구 = [{

"유형": "file_search",

"vector_store_ids": [vector_store_id],

"필터": {

"유형": "EQ",

"키": "도메인",

"가치": "데이터 과학"

}

}]

))

print (response.output_text)
로그인 후 복사

산출:

 데이터 과학 영역을 가진 사람은 Alice Johnson [0]입니다.<br> [0] names_and_domains.pdf
로그인 후 복사

2. 웹 검색

이 기능을 통해 모델은 응답을 생성하기 전에 최신 정보를 웹에서 검색하여 데이터를 최신 상태로 유지할 수 있습니다. 이 모델은 입력 프롬프트의 내용을 기반으로 웹을 검색하도록 선택할 수 있습니다.

작업 : Vijay Nagar에서 가장 좋은 카페는 무엇입니까?

암호:

 응답 = client.responses.create (

model = "gpt-4o",

도구 = [{

"유형": "web_search_preview",

"user_location": {

"유형": "근사",

"국가": "in",

"City": "Indore",

"지역": "Madhya Pradesh",

}

}],

입력 = "Vijay Nagar에서 최고의 카페는 무엇입니까?",

))

print (response.output_text)
로그인 후 복사

산출:

OpenAI의 응답 API 및 에이전트 SDK를 사용하는 방법은 무엇입니까? - 분석 Vidhya

3. 컴퓨터 사용

CUA (Computer-using Agent) 모델의 실질적인 응용 프로그램으로, GPT-4O의 비전 기능을 컴퓨터 인터페이스 제어를 시뮬레이션하고 작업을 수행하는 고급 추론과 결합합니다.

작업 : Analytics Vidhya 웹 사이트의 최신 블로그를 확인하십시오.

암호:

 응답 = client.responses.create (

Model = "Computer-use-preview",

도구 = [{

"유형": "computer_use_preview",

"display_width": 1024,

"display_height": 768,

"환경": "브라우저" # 기타 가능한 값 : "Mac", "Windows", "Ubuntu"

}],

입력 = [

{

"역할": "사용자",

"Content": "Analytics Vidhya 웹 사이트에서 최신 블로그를 확인하십시오."

}

],,

자르기 = "자동"

))

print (response.output)
로그인 후 복사

산출:

 ResponseComputerToolCall (id = 'CU_67D147AF346C8192B78719DD0E22856964FBB87C6A42E96',<br> Action = ActionScreenshot (type = 'Screenshot'),<br> call_id = 'call_a0w16g1bnek09ayiv25vdkxy', pending_safety_checks = [],<br> 상태 = '완료', type = 'computer_call')
로그인 후 복사

응답 API는 완료 API와 어떻게 다릅니 까?

이제 응답 API의 작동 방식을 보았으므로 기존 완료 API와 얼마나 다른지 보자.

응답 API 대 완성 API : 실행

API 응답 API 완료 API
암호
 OpenAi import OpenAi에서
클라이언트 = OpenAi ()
응답 = client.responses.create (
    model = "gpt-4o",
    입력 = [
        {
            "역할": "사용자",
            "콘텐츠": "유니콘에 관한 한 문장 취침 시간 이야기를 작성하십시오."
        }
    ]]
))
print (response.output_text)
로그인 후 복사
 OpenAi import OpenAi에서
클라이언트 = OpenAi ()
완료 = client.chat.completions.create (
    model = "gpt-4o",
    메시지 = [
        {
            "역할": "사용자",
            "콘텐츠": "유니콘에 관한 한 문장 취침 시간 이야기를 작성하십시오."
        }
    ]]
))
print (wompletion.choices [0] .message.content)
로그인 후 복사
산출

OpenAI의 응답 API 및 에이전트 SDK를 사용하는 방법은 무엇입니까? - 분석 Vidhya

OpenAI의 응답 API 및 에이전트 SDK를 사용하는 방법은 무엇입니까? - 분석 Vidhya

응답 API 대 완성 API : 기능

다음은 Chat Complerions API 및 응답 API의 다양한 기능에 대한 단순화 된 분류입니다.

기능 응답 API 채팅 완료 API
텍스트 생성
오디오 곧 올 것입니다
비전
웹 검색
파일 검색
컴퓨터 사용
코드 통역사 곧 올 것입니다
응답 처리 단일 구조화 된 출력을 반환합니다 선택 배열을 반환합니다
대화 상태 연속성을위한 previous_response_id 수동으로 관리해야합니다
스토리지 동작 기본적으로 저장 기본적으로 저장됩니다

로드맵 : 무엇을 계속하고, 무엇을 사용하지 않습니까?

응답 API가 라이브로 진행되면서, 불타는 질문은 기존 채팅 완료 및 조수 API에 영향을 미칩니 까? 예, 그럴 것입니다. 방법을 살펴 보겠습니다.

  • 채팅 완료 API : OpenAI는 새로운 모델로 계속 업데이트되지만 기능에 내장 도구가 필요하지 않은 경우에만 계속 업데이트됩니다.
  • 웹 검색 및 파일 검색 도구 : 응답 API에서 더 세련되고 강력 해집니다.
  • Assistants API : 응답 API는 성능을 향상시키면서 최상의 기능을 통합합니다. Openai는 전체 기능 패리티가 곧 출시 될 것이라고 발표했으며, Assistants API는 20126 년 중반까지 더 이상 사용되지 않을 것입니다.

에이전트 SDK 소개

AI 에이전트를 구축하는 것은 강력한 API를 갖는 것이 아니라 효율적인 오케스트레이션이 필요합니다. 이것은 OpenAi의 에이전트 SDK가 시작되는 곳입니다. 에이전트 SDK는 에이전트 워크 플로를 단순화하는 오픈 소스 툴킷입니다. 이 에이전트 빌딩 프레임 워크는 응답 API 및 채팅 완료 API와 완벽하게 통합됩니다. 또한 채팅 완료와 같은 스타일의 API 엔드 포인트를 제공하는 경우 다양한 제공 업체의 모델과 호환됩니다.

에이전트 SDK의 주요 기능 중 일부는 다음과 같습니다.

  • 개발자는 내장 도구로 AI 에이전트를 구성 할 수 있습니다.
  • 다중 에이전트 오케스트레이션을 가능하게하여 필요에 따라 다른 에이전트를 원활하게 조정할 수 있습니다.
  • 이를 통해 상담원 간의 대화와 정보 흐름을 추적 할 수 있습니다.
  • 안전 및 규정 준수를 위해 가드 레일을 더 쉽게 적용 할 수 있습니다.
  • 개발자는 내장 관측 성 도구로 에이전트 성능을 모니터링하고 최적화 할 수 있도록합니다.

SDK 요원은 Openai의 보석에 "새로운 추가"가 아닙니다. OpenAi가 작년에 발표 한 실험 SDK 인“Swarm”의 개선 된 버전입니다. “Swarm”은 교육 목적으로 방금 석방되었지만 개발자들 사이에서 인기가 있었고 여러 기업들에 의해서도 채택되었습니다. 더 많은 기업을 수용하고 생산 등급 에이전트를 원활하게 구축하는 데 도움을주기 위해 SDK 에이전트가 출시되었습니다. 이제 우리는 SDK가 무엇을 제공 해야하는지 알았 으므로이 프레임 워크를 사용하여 에이전트 시스템을 구축 할 수있는 방법을 살펴 보겠습니다.

또한 읽기 : VS 코드의 상위 10 개 생성 AI 코딩 확장

에이전트 SDK를 사용하여 다중 대용 시스템을 구축하십시오

우리는 LLM 구동 에이전트 및 웹 검색 도구를 활용하여 정확하고 최신 통찰력을 제공하여 자동차 권장 사항을 사용자에게 제공하고 가격을 재판매하는 다중 에이전트 시스템을 구축 할 것입니다.

1 단계 : 간단한 AI 에이전트 구축

우리는 사용자가 자신의 요구에 따라 적절한 자동차 유형을 선택하는 데 도움이되는 자동차 고문 에이전트를 만드는 것으로 시작합니다.

암호:

 car_advisor = 에이전트 (

이름 = "자동차 고문",

지침 = "당신은 요구 사항에 따라 사람들에게 세단, 해치백 등과 같은 적절한 자동차 유형을 조언하는 전문가입니다.",

model = "gpt-4o",

))

프롬프트 = "나는 운전을 즐기고 4 명을 차지하는 차를 찾고 있습니다. 나는 언덕으로 여행하기 위해 비행기를 타십시오. 어떤 차를 사야합니까?"

Async def main () :

result = await runner.run (car_advisor, 프롬프트)

print (result.final_output)

# Jupyter에서 함수를 실행하십시오

대기 Main ()
로그인 후 복사

산출:

OpenAI의 응답 API 및 에이전트 SDK를 사용하는 방법은 무엇입니까? - 분석 Vidhya

2 단계 : 다중 에이전트 시스템을 구축하십시오

기본 에이전트를 사용하여 이제 각 도메인에 특화된 다른 AI 에이전트를 통합 한 다중 에이전트 시스템을 만듭니다. 작동 방식은 다음과 같습니다.

다중 에이전트 시스템의 에이전트

  1. 자동차 판매 견적 에이전트 : 자동차 세부 사항에 따라 재판매 가격 견적을 제공합니다.
  2. 자동차 모델 고문 에이전트 : 예산 및 위치에 따라 적합한 자동차 모델을 제안합니다.
  3. Triage Agent : 쿼리를 적절한 에이전트로 안내합니다.

우리는 에이전트에게 두 가지 다른 프롬프트를 제공하고 그들의 출력을 관찰 할 것입니다.

암호:

 car_sell_estimate = 에이전트 (

이름 = "자동차 판매 견적",

지침 = "당신은 제조사, 모델, 구매 연도 및 조건에 따라 자동차를 재판매하는 적절한 가격을 제안하는 전문가입니다.",

Handoff_description = "자동차 재판매 가격 추정 전문가",

model = "gpt-4o",

도구 = [WebSearchTool ()]

))

car_model_advisor = 에이전트 (

이름 = "자동차 모델 고문",

지침 = "당신은 예산과 위치에 따라 사람들에게 적합한 자동차 모델을 조언하는 전문가입니다.",

Handoff_description = "자동차 모델 추천 전문가",

model = "gpt-4o",

도구 = [WebSearchTool ()]

))

triage_agent = 에이전트 (

이름 = "심사 에이전트",

지침 = "작업에 적합한 대리인을 결정합니다.",

model = "gpt-4o",

핸드 오프 = [car_sell_estimate, car_model_advisor]

))

프롬프트 1 : 

프롬프트 = "뉴 델리에서 Ecosport 자동차를 판매하고 싶습니다. 3 살이고 상태가 양호합니다. 50000km. 가격은 얼마입니까?"

Async def main () :

result = await runner.run (triage_agent, 프롬프트)

print (result.final_output)

# Jupyter에서 함수를 실행하십시오

대기 Main ()
로그인 후 복사

출력 1 :

OpenAI의 응답 API 및 에이전트 SDK를 사용하는 방법은 무엇입니까? - 분석 Vidhya

프롬프트 2 :

 프롬프트 = "뉴 델리에서 20 라크를 위해 4 명에게 편안한 가속 차량을 사고 싶습니다. 어떤 차를 사야합니까?"

Async def main () :

result = await runner.run (triage_agent, 프롬프트)

print (result.final_output)

# Jupyter에서 함수를 실행하십시오

대기 Main ()
로그인 후 복사

출력 2 :

OpenAI의 응답 API 및 에이전트 SDK를 사용하는 방법은 무엇입니까? - 분석 Vidhya

우리는 요구 사항에 따라 자동차 옵션을 얻었습니다! 구현은 간단하고 빠릅니다. 이 에이전트 프레임 워크를 사용하여 여행 지원, 재무 계획, 의료 지원, 개인화 된 쇼핑, 자동 연구 등을위한 에이전트를 구축 할 수 있습니다.

에이전트의 SDK : 도시의 새로운 에이전트 프레임 워크?

OpenAi의 에이전트 SDK는 AI 에이전트 개발을위한 전용 프레임 워크를 제공하는 전략적 추진을 나타냅니다. 이 프레임 워크에는 심사 에이전트를 통한 승무원과 같은 기능이 포함되어 있으며 승무원 AI의 기능을 모방합니다. 마찬가지로, 핸드 오프 메커니즘은 Autogen의 핸드 오프 메커니즘과 매우 유사하여 여러 에이전트 간의 작업을 효율적으로 할 수 있습니다.

또한 모듈 식 에이전트 오케스트레이션에서 Langchain의 강점은 SDK가 구조화 된 워크 플로우를 제공하는 방식에 반영되어 원활한 실행 및 적응성을 보장합니다. 에이전트 SDK는 기존 프레임 워크가 이미하는 것 이상을 제공하지만 곧 그들에게 치열한 경쟁을 할 것입니다.

또한 읽으십시오 : Claude 3.7 Sonnet : 아직 최고의 코딩 모델?

개발자가 응답 API 및 에이전트 SDK가 필요한 이유는 무엇입니까?

응답 API 및 에이전트 SDK는 개발자에게 AI 중심 애플리케이션을 구축 할 수있는 도구 및 플랫폼을 제공합니다. 수동 프롬프트 엔지니어링 및 광범위한 사용자 정의 로직에 대한 의존성을 줄임으로써 이러한 도구를 사용하면 최소한의 마찰로 지능형 워크 플로우를 만드는 데 집중할 수 있습니다.

  • 쉬운 통합 : 개발자는 더 이상 다양한 도구를 위해 여러 API를 저글링 할 필요가 없습니다. 응답 API는 웹 검색, 파일 검색 및 컴퓨터 사용을 단일 인터페이스로 통합합니다.
  • 더 나은 관찰 가능성 : 내장 모니터링 및 디버깅 도구를 사용하여 개발자는 에이전트 성능을보다 쉽게 ​​최적화 할 수 있습니다.
  • 확장 성 : 에이전트 SDK는 다중 에이전트 워크 플로를 처리하는 구조화 된 접근 방식을 제공하여보다 강력한 자동화를 가능하게합니다.
  • 개발주기 개선 : 광범위한 신속한 반복 및 외부 도구 통합이 필요하지 않으면 개발자는 훨씬 빠른 속도로 에이전트 기반 애플리케이션을 프로토 타입하고 배포 할 수 있습니다.

다음은 OpenAi의 응답 API 및 에이전트 SDK에 대해 자세히 알아 보는 비디오입니다.

결론

OpenAI의 응답 API 및 에이전트 SDK의 도입은 AI 중심 자동화를위한 게임 체인저입니다. 이러한 도구를 활용하여 몇 줄의 코드로 다중 에이전트 시스템을 매우 빠르게 구축했습니다. 이 구현은 추가 도구, 통합 및 에이전트 기능을 포함하여 다양한 산업에서보다 지능적이고 자율적 인 AI 애플리케이션을위한 길을 열어 줄 수 있습니다.

이러한 도구는 개발자와 기업이 개발 복잡성을 줄이고 더 똑똑하고 확장 가능한 자동화 솔루션을 만드는 데 도움이 될 것입니다. 고객 지원, 연구, 비즈니스 자동화 또는 업계 별 AI 애플리케이션에 관계없이 API 및 에이전트 SDK는 차세대 AI 구동 시스템을 쉽게 구축 할 수있는 강력한 프레임 워크를 제공합니다.

자주 묻는 질문

Q1. OpenAi의 응답 API 란 무엇입니까?

A. 응답 API는 웹 검색, 파일 검색 및 컴퓨터 사용과 같은 내장 도구를 통합하여 에이전트 개발을 단순화하는 OpenAI의 최신 AI 프레임 워크입니다.

Q2. 응답 API는 완료 API와 어떻게 다릅니 까?

A. 완료 API와 달리 응답 API는 멀티 툴 통합, 구조화 된 출력 및 내장 대화 상태 관리를 지원합니다.

Q3. OpenAi의 에이전트 SDK는 무엇입니까?

A. 에이전트 SDK는 개발자가 AI 구동 자동화를 사용하여 다중 에이전트 시스템을 구축하고 조정할 수있는 오픈 소스 프레임 워크입니다.

Q4. 에이전트 SDK는 AI 개발을 어떻게 개선합니까?

A. 원활한 에이전트 조정, 향상된 관찰 가능성, 내장 가드 레일 및 개선 된 성능 추적이 가능합니다.

Q5. 응답 API 및 에이전트 SDK를 함께 사용할 수 있습니까?

A. 예! 에이전트 SDK는 응답 API와 통합되어 강력한 AI 중심 애플리케이션을 생성합니다.

Q6. OpenAI의 에이전트 SDK가 다른 AI 모델과 호환됩니까?

A. 예, 채팅 완료 API 스타일 통합을 지원하는 타사 모델과 함께 작동 할 수 있습니다.

Q7. 다중 에이전트 AI 시스템의 혜택을받을 수있는 산업은 무엇입니까?

A. 자동차, 금융, 의료, 고객 지원 및 연구와 같은 산업은 AI 중심 에이전트를 사용하여 운영 및 의사 결정을 최적화 할 수 있습니다.

위 내용은 OpenAI의 응답 API 및 에이전트 SDK를 사용하는 방법은 무엇입니까? - 분석 Vidhya의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿