Heim > Technologie-Peripheriegeräte > KI > Wie benutze ich OpenAIs Antworten API & Agent SDK? - Analytics Vidhya

Wie benutze ich OpenAIs Antworten API & Agent SDK? - Analytics Vidhya

Christopher Nolan
Freigeben: 2025-03-21 09:35:10
Original
746 Leute haben es durchsucht

OpenAI war ein führender Lösungsanbieter im Genai -Raum. Von der legendären Chatgpt bis Sora ist es eine Anlaufstelle für alle Berufstätigen. Mit Qwen und Claude, die bei Entwicklern an Popularität gewonnen werden, ist OpenAI wieder mit seinen neuesten Updates zurück und befähigt Entwickler, zuverlässigere und fähigere KI -Agenten zu schaffen. Zu den wichtigsten Highlights aus der Liste gehören die Antworten API und Agenten SDK. In diesem Blog werden wir die Antworten API und Agenten SDK untersuchen, verstehen, wie man auf sie zugreift, und lernen, wie man sie verwendet, um reale Anwendungen zu erstellen!

Inhaltsverzeichnis

  • Was ist die Antworten -API?
  • Wie benutze ich Antworten API?
  • Wie unterscheidet sich die Antworten -API von der API der Abschlüsse?
  • Einführung der Agenten SDK
  • Erstellen Sie ein multiagentisches System mit Agent SDK
  • Warum brauchen Entwickler Antworten API & Agenten SDK?
  • Abschluss
  • Häufig gestellte Fragen

Was ist die Antworten -API?

Die Antworten API ist OpenAIs neueste API zur Vereinfachung des Aufbaus von AI-basierten Anwendungen. Es kombiniert die Einfachheit der Chat-API-API mit den leistungsstarken Werkzeugen der Assistenten-API. Dies bedeutet, dass Entwickler jetzt Agenten erstellen können, die mehrere Tools nutzen und komplexe, mehrstufige Aufgaben effizienter erledigen. Diese API reduzierte die Abhängigkeit von komplexen schnellen Engineering- und externen Integrationen.

Unsere neue API -Primitive: Die Antworten API. Diese neue Stiftung kombiniert die Einfachheit der CHAT-Abschlüsse mit dem Werkzeugnutzung von Assistenten und bietet mehr Flexibilität bei den Bauagenten. Websuche, Dateisuche oder Computer verwenden einige Codezeilen!

- OpenAI -Entwickler (@openaidevs) 11. März 2025

Schlüsselmerkmale der Antworten -API

  • Integrierte Tools wie Websuche, Dateisuche und Computer verwenden, damit Agenten mit realen Daten interagieren.
  • Einheitliches Design, das den Polymorphismus vereinfacht und die Benutzerfreundlichkeit verbessert.
  • Bessere Beobachtbarkeit und dabei, Entwicklern das Verhalten des Agenten zu verfolgen und Workflows zu optimieren.
  • Keine zusätzlichen Kosten, da sie auf der Grundlage der Token -Nutzung bei OpenAIs Standardpreisen berechnet werden.

Mit diesen Tools ist die Antworten -API ein Spielveränderer zum Aufbau von KI -Agenten. In Zukunft wird die Antworten API alle neuen und kommenden Modelle von OpenAI unterstützen. Mal sehen, wie wir damit Anwendungen erstellen können.

Wie benutze ich Antworten API?

Um Antworten API auszuprobieren:

  1. Installieren Sie OpenAI (falls bereits installiert) und verwenden Sie OpenAI.
  2. Stellen Sie sicher, dass Sie über die neueste OpenAI -Bibliothek verfügen (PIP Install Installation OpenAI --Upgrade).
  3. Importieren Sie Openai und richten Sie den Kunden ein.

Nach der Einrichtung können Sie die Antworten -API anfordern. Während grundlegende API-Aufrufe üblich sind, machen die integrierten Fähigkeiten es leistungsfähig. Erkunden wir drei wichtige Funktionen:

  • Dateisuche: Erkenntnisse aus Dokumenten abrufen.
  • Websuche: Erhalten Sie Echtzeit, zitierte Informationen.
  • Computergebrauch: Systeminteraktionen automatisieren.

Jetzt sehen wir sie in Aktion!

1. Dateisuche

Es ermöglicht Modelle, Informationen in einer Wissensbasis zuvor hochgeladener Dateien über semantische und Schlüsselwortsuche abzurufen. Derzeit unterstützt es keine CSV -Dateien. Sie können die Liste der unterstützten Dateitypen hier überprüfen.

HINWEIS: Stellen Sie vor der Verwendung der Dateisuche Ihre Dateien in einer Vektor -Datenbank auf

Aufgabe: Namen von Personen mit Domain als Datenwissenschaft. (Ich habe die folgende Datei verwendet.)

Code:

 response = client.responses.create (

model = "gpt-4o-mini",

input = "Namen von Personen mit Domain als Datenwissenschaft",

Tools = [{{

"Typ": "File_search",

"vector_store_ids": [vector_store_id],

"Filter": {

"Typ": "EQ",

"Schlüssel": "Domain",

"Wert": "Data Science"

}

}]

)

print (response.output_text)
Nach dem Login kopieren

Ausgabe:

 Die Person mit dem Domain der Datenwissenschaft ist Alice Johnson [0].<br> [0] names_and_domains.pdf
Nach dem Login kopieren

2. Websuche

Mit dieser Funktion können Modelle das Web nach den neuesten Informationen durchsuchen, bevor sie eine Antwort generieren, damit die Daten auf dem neuesten Stand sind. Das Modell kann auswählen, ob Sie das Web suchen oder nicht basierend auf dem Inhalt der Eingabeaufforderung.

Aufgabe: Was sind die besten Cafés in Vijay Nagar?

Code:

 response = client.responses.create (

model = "gpt-4o",

Tools = [{{

"Typ": "web_search_preview",

"user_location": {

"Typ": "ungefähr",

"Land": "in",,

"Stadt": "Indore",

"Region": "Madhya Pradesh",

}

}],

input = "Was sind das beste Café in Vijay Nagar?",

)

print (response.output_text)
Nach dem Login kopieren

Ausgabe:

Wie benutze ich OpenAIs Antworten API & Agent SDK? - Analytics Vidhya

3. Computergebrauch

Es handelt sich um eine praktische Anwendung des CUA-Modells (Computer-Use-Use-Agents), das die Sichtfunktionen von GPT-4O mit erweitertem Argument kombiniert, um die steuerbaren Computeroberflächen zu simulieren und Aufgaben auszuführen.

Aufgabe: Überprüfen Sie den neuesten Blog auf der Analytics Vidhya -Website.

Code:

 response = client.responses.create (

Modell = "Computer-Use-Präview",

Tools = [{{

"Typ": "computer_use_preview",

"display_width": 1024,

"Display_Height": 768,

"Umgebung": "Browser" # Andere mögliche Werte: "Mac", "Windows", "Ubuntu"

}],

Eingabe = [

{

"Rolle": "Benutzer",

"Inhalt": "Überprüfen Sie den neuesten Blog auf der Analytics Vidhya -Website."

}

],

truncation = "auto"

)

print (response.output)
Nach dem Login kopieren

Ausgabe:

 ResponseComputertoolCall (ID = 'CU_67D147AF346C8192B78719DD0E22856964FBBB87C6A42E96',<br> action = actionscreenshot (type = 'screenshot'),<br> CALL_ID = 'CALL_A0W16G1BNEK09AYIV25VDKXY', AUFGELD_SEFETY_CHECKS = [],<br> status = 'abgeschlossen', type = 'computer_call')
Nach dem Login kopieren

Wie unterscheidet sich die Antworten -API von der API der Abschlüsse?

Jetzt, da wir gesehen haben, wie die API der Antworten funktioniert, lassen Sie uns sehen, wie unterschiedlich sie von der bereits vorhandenen API von Fertigstellungen ist.

Antworten API vs Abschlüsse API: Ausführung

API Antworten API Fertigstellungen API
Code
 von Openai Import Openai
client = openai ()
response = client.responses.create (
    model = "gpt-4o",
    Eingänge = [[
        {
            "Rolle": "Benutzer",
            "Inhalt": "Schreiben Sie eine Einstiegs-Gutenachtgeschichte über ein Einhorn."
        }
    ]
)
print (response.output_text)
Nach dem Login kopieren
 von Openai Import Openai
client = openai ()
Completion = client.chat.completions.create (
    model = "gpt-4o",
    Nachrichten = [
        {
            "Rolle": "Benutzer",
            "Inhalt": "Schreiben Sie eine Einstiegs-Gutenachtgeschichte über ein Einhorn."
        }
    ]
)
print (fertigstellung.choices [0] .Message.Content)
Nach dem Login kopieren
Ausgabe

Wie benutze ich OpenAIs Antworten API & Agent SDK? - Analytics Vidhya

Wie benutze ich OpenAIs Antworten API & Agent SDK? - Analytics Vidhya

Antworten API gegen Abschlüsse API: Funktionen

Hier finden Sie eine vereinfachte Aufschlüsselung der verschiedenen Funktionen der API und der API der Chat -Komplerionen und der Antworten:

Fähigkeiten Antworten API CHAT -Abschlüsse API
Textgenerierung
Audio Bald kommen
Vision
Websuche
Dateisuche
Computergebrauch
Code -Interpreter Bald kommen
Antworthandhabung Gibt einen einzelnen strukturierten Ausgang zurück Gibt das Auswahlarray zurück
Gesprächszustand PROBOR_REPRESONE_ID für Kontinuität Muss manuell verwaltet werden
Speicherverhalten Standardmäßig gespeichert (Speicher: Falsch zu Deaktivieren) Standardmäßig gespeichert

Roadmap: Was wird fortgesetzt, was wird sich verabreicht?

Wenn Antworten live live gehen, lautet die brennende Frage nun, würde sie die vorhandenen Chat -Abschlüsse und die Assistenten -API beeinflussen? Ja, das würde. Schauen wir uns an, wie:

  • CHAT-Abschlüsse API: OpenAI wird es weiterhin mit neuen Modellen aktualisieren, jedoch nur, wenn die Funktionen keine integrierten Tools erfordern.
  • Web -Search & Datei -Such -Tools: Diese werden in der Antworten -API raffinierter und leistungsstärker.
  • Assistenten -API: Die API der Antworten enthält ihre besten Funktionen und verbessert die Leistung. OpenAI hat angekündigt, dass eine vollständige Parität in Kürze erfolgt und die Assistenten-API Mitte 2026 veraltet sein wird.

Einführung der Agenten SDK

Beim Aufbau von AI -Agenten geht es nicht nur darum, eine leistungsstarke API zu haben, sondern eine effiziente Orchestrierung. Hier kommt Openais Agents SDK ins Spiel. Das Agenten SDK ist ein Open-Source-Toolkit, das Agenten-Workflows vereinfacht. Dieses Rahmenwerk für Agent -Erstellung integriert nahtlos in die API der Antworten API und Chat -API. Darüber hinaus ist es auch mit Modellen verschiedener Anbieter kompatibel, vorausgesetzt, sie bieten einen API -Endpunkt an, der wie Chat -Fertigstellungen gestaltet ist.

Einige der wichtigsten Merkmale von Agenten SDK sind:

  • Es ermöglicht Entwicklern, KI-Agenten mit integrierten Tools zu konfigurieren.
  • Es ermöglicht eine orchestrierte Multi-Agent, sodass nach Bedarf eine nahtlose Koordination verschiedener Wirkstoffe ermöglicht.
  • Es ermöglicht uns, die Konversation und den Informationsfluss zwischen unseren Agenten zu verfolgen.
  • Es ermöglicht eine einfachere Möglichkeit, Leitplanken für Sicherheit und Einhaltung aufzutragen.
  • Es stellt sicher, dass Entwickler die Agentenleistung mit integrierten Observierbarkeitstools überwachen und optimieren können.

Agent SDK ist kein „Neuzugang“ für Openais Juwelen. Es ist eine verbesserte Version von „Swarm“, dem experimentellen SDK, das Openai im vergangenen Jahr veröffentlicht hatte. Während „Swarm“ gerade zu Bildungszwecken veröffentlicht wurde, wurde es bei Entwicklern populär und wurde auch von mehreren Unternehmen übernommen. Um mehr Unternehmen zu bedienen und ihnen zu helfen, die Agenten SDK nahtlos auf Produktionsgrad-Agenten aufzubauen, wurde die Agenten veröffentlicht. Nachdem wir wissen, welche Agenten SDK zu bieten haben, lassen Sie uns sehen, wie wir dieses Rahmen verwenden können, um unser Agentensystem aufzubauen.

Lesen Sie auch: Top 10 generative KI -Codierungsweiterungen im VS -Code

Erstellen Sie ein multiagentisches System mit Agent SDK

Wir werden ein Multi-Agent-System erstellen, das den Benutzern bei Autoempfehlungen und Wiederverkaufspreisschätzung hilft, indem wir LLM-Betroffenen und Web-Such-Tools nutzen, um genaue und aktuelle Erkenntnisse zu liefern.

Schritt 1: Erstellen eines einfachen KI -Agenten

Wir erstellen mit der Erstellung eines CAR -Advisor -Agenten, der den Benutzern hilft, einen geeigneten Auto -Typ aus ihren Bedürfnissen auszuwählen.

Code:

 car_advisor = Agent (

name = "Car Advisor",

Anweisungen = "Sie sind ein Experte für die Beratung geeigneter Autotyp wie Limousine, Fließheck usw. gegenüber Menschen, die auf ihren Anforderungen basieren."

model = "gpt-4o",

)

prompt = "Ich suche ein Auto, das ich gerne fahre und mit 4 Personen fahre. Ich bin Flugzeug, um nach Hügeln zu reisen. Welche Art von Auto soll ich kaufen?"

Async def Main ():

result = Auseait Runner.run (CAR_ADVISOR, Eingabeaufforderung)

print (result.final_output)

# Führen Sie die Funktion in Jupyter aus

Warten Sie auf Main ()
Nach dem Login kopieren

Ausgabe:

Wie benutze ich OpenAIs Antworten API & Agent SDK? - Analytics Vidhya

Schritt 2: Erstellen Sie das Multi-Agent-System

Mit dem Grundagenten erstellen wir jetzt ein Multi-Agent-System, das verschiedene KI-Agenten enthält, die auf ihre jeweiligen Bereiche spezialisiert sind. So funktioniert es:

Agenten im Multi-Agent-System

  1. Autoverkaufsvorschätzung Agent: Es bietet einen Wiederverkaufspreisschätzung, der auf Autodetails basiert.
  2. CAR MODEL Advisor Agent: Es schlägt geeignete Automodelle auf der Grundlage von Budget und Standort vor.
  3. Triage Agent: Es wird die Abfrage an den entsprechenden Agenten angelegt.

Wir werden den Agenten zwei verschiedene Eingabeaufforderungen zur Verfügung stellen und ihre Ergebnisse beobachten.

Code:

 car_sell_estimate = Agent (Agent (

name = "Autoverkäufe Schätzung",

Anweisungen = "Sie sind ein Experte, um einen geeigneten Preis für das Weiterverkauf eines Autos auf der Grundlage seiner Marke, des Modells, des Kaufjahres und des Zustands vorzuschlagen."

Handoff_Description = "Auto Weiterverkaufspreisschätzer", "

model = "gpt-4o",

Tools = [Websearchtool ()]

)

car_model_advisor = Agent (Agent (

name = "Car Model Advisor",

Anweisungen = "Sie sind ein Experte für die Beratung geeigneter Autododell für Personen, die auf ihrem Budget und Standort basierend aufgenommen werden."

Handoff_Description = "CAR MODEL Empfehlungsexperte",

model = "gpt-4o",

Tools = [Websearchtool ()]

)

Triage_agent = Agent (

name = "Triage Agent",

Anweisungen = "Sie bestimmen den entsprechenden Agenten für die Aufgabe."

model = "gpt-4o",

tops = [car_sell_estimate, car_model_advisor]

)

Eingabeaufforderung 1: 

prompt = "Ich möchte mein EcoSport -Auto in Neu -Delhi verkaufen. Es ist 3 Jahre alt und in gutem Zustand. 50000 km. Welchen Preis soll ich erwarten?"

Async def Main ():

result = Auseait Runner.run (Triage_agent, Eingabeaufforderung)

print (result.final_output)

# Führen Sie die Funktion in Jupyter aus

Warten Sie auf Main ()
Nach dem Login kopieren

Ausgabe 1:

Wie benutze ich OpenAIs Antworten API & Agent SDK? - Analytics Vidhya

Eingabeaufforderung 2:

 prompt = "Ich möchte ein Auto mit hoher Beschleunigung kaufen, das für 4 Personen für 20 Lakhs in Neu -Delhi bequem ist. Welches Auto soll ich kaufen?"

Async def Main ():

result = Auseait Runner.run (Triage_agent, Eingabeaufforderung)

print (result.final_output)

# Führen Sie die Funktion in Jupyter aus

Warten Sie auf Main ()
Nach dem Login kopieren

Ausgabe 2:

Wie benutze ich OpenAIs Antworten API & Agent SDK? - Analytics Vidhya

Wir haben die Autooptionen gemäß unseren Anforderungen erhalten! Die Implementierung war einfach und schnell. Sie können diesen Agentenrahmen verwenden, um Agenten für Reiseunterstützung, Finanzplanung, medizinische Unterstützung, personalisierte Einkäufe, automatisierte Forschung und vieles mehr aufzubauen.

SDK des Agenten: Ein neuer Agentenrahmen in der Stadt?

OpenAIs Agenten SDK repräsentieren seinen strategischen Vorstoß, einen speziellen Rahmen für die Entwicklung von AI -Agenten zu schaffen. Das Rahmen umfasst die Besatzungsmerkmale von Crew-ähnlichen Merkmalen durch den Triage-Agenten, der die Funktionen der Crew AI nachahmte. In ähnlicher Weise ähneln seine Handoff -Mechanismen den von Autogen stark und ermöglichen eine effiziente Delegation von Aufgaben zwischen mehreren Wirkstoffen.

Darüber hinaus spiegelt sich die Stärke von Langchain in der modularen Wirkstofforchestrierung in der Art und Weise wider, wie die Agenten SDK strukturierte Workflows liefert und eine reibungslose Ausführung und Anpassungsfähigkeit gewährleisten. Während Agents SDK nichts anderes bietet als das, was die vorhandenen Frameworks bereits tun, wird es ihnen bald einen harten Wettbewerb verleihen.

Lesen Sie auch: Claude 3.7 Sonett: Das bisher beste Codierungsmodell?

Warum brauchen Entwickler Antworten API & Agenten SDK?

Antworten API und Agenten SDK bieten Entwicklern die Tools und Plattform, um AI-gesteuerte Anwendungen zu erstellen. Durch die Reduzierung des Vertrauens in die manuelle Eingabeaufforderung und umfangreiche benutzerdefinierte Logik ermöglichen diese Tools Entwicklern, sich auf die Erstellung intelligenter Workflows mit minimaler Reibung zu konzentrieren.

  • Einfache Integration: Entwickler müssen nicht mehr mehrere APIs für verschiedene Tools jonglieren. Die Antworten API konsolidiert die Websuche, die Dateisuche und den Computer in einer einzigen Schnittstelle.
  • Bessere Beobachtbarkeit: Mit integrierten Überwachungs- und Debugging-Tools können Entwickler die Leistung der Agenten leichter optimieren.
  • Skalierbarkeit: Die Agenten SDK bietet einen strukturierten Ansatz zum Umgang mit Multi-Agent-Workflows und ermöglicht eine robustere Automatisierung.
  • Verbesserte Entwicklungszyklen: Durch die Beseitigung der Notwendigkeit einer umfassenden Iteration und externen Werkzeugintegration können Entwickler mit viel schnellerem Tempo prototypen und bereitstellen agentenbasierte Anwendungen.

Hier ist ein Video, um mehr über OpenAs Antworten API und Agenten SDK zu erfahren.

Abschluss

Die Einführung der Antworten von OpenAI und Agenten SDK ist ein Game-Changer für eine AI-gesteuerte Automatisierung. Durch die Nutzung dieser Tools haben wir ein Multi-Agent-System sehr schnell mit nur wenigen Codezeilen erfolgreich erstellt. Diese Implementierung kann weiter erweitert werden, um zusätzliche Tools, Integrationen und Agentenfunktionen zu umfassen und den Weg für intelligentere und autonomere KI -Anwendungen in verschiedenen Branchen zu ebnen.

Diese Tools helfen sicher, Entwicklern und Unternehmen zu helfen, die Komplexität der Entwicklung zu reduzieren und intelligentere und skalierbare Automatisierungslösungen zu schaffen. Egal, ob es sich um Kundensupport, Forschung, Unternehmensautomatisierung oder branchenspezifische KI-Anwendungen handelt, die Antworten API und Agenten SDK bieten einen leistungsstarken Rahmen für die Aufbau von KI-betriebenen Systemen der nächsten Generation problemlos.

Häufig gestellte Fragen

Q1. Was ist Openais Antworten API?

A. Die Antworten-API ist das neueste AI-Framework von OpenAI, das die Agentenentwicklung durch Integration integrierter Tools wie Websuche, Dateisuche und Computerverwendung vereinfacht.

Q2. Wie unterscheidet sich die Antworten -API von der API der Abschlüsse?

A. Im Gegensatz zur API von Fertigstellungen unterstützt die Antworten-API die Integration von Multi-Tools, strukturierte Ausgaben und ein integriertes Gesprächszustandsmanagement.

Q3. Was ist Openais Agents SDK?

A. Die Agenten SDK ist ein Open-Source-Framework, mit dem Entwickler Multi-Agent-Systeme mit KI-angetanter Automatisierung erstellen und orchestrieren können.

Q4. Wie verbessert die Agenten SDK die KI -Entwicklung?

A. Es ermöglicht eine nahtlose Agentenkoordination, verbesserte Beobachtbarkeit, eingebaute Leitplanken und eine verbesserte Leistungsverfolgung.

Q5. Können die Antworten API und Agenten SDK zusammen verwendet werden?

A. Ja! Die Agenten SDK integriert sich in die Antworten-API, um leistungsstarke AI-gesteuerte Anwendungen zu erstellen.

Q6. Ist Openai's Agents SDK mit anderen KI -Modellen kompatibel?

A. Ja, es kann mit Modellen von Drittanbietern funktionieren, die die API-Integrationen im Chat-Abschluss unterstützen.

Q7. Welche Branchen können von Multi-Agent-KI-Systemen profitieren?

A. Branchen wie Automobile, Finanzen, Gesundheitswesen, Kundenunterstützung und Forschung können mit AI-gesteuerten Agenten zur Optimierung von Betrieb und Entscheidungsfindung verwenden.

Das obige ist der detaillierte Inhalt vonWie benutze ich OpenAIs Antworten API & Agent SDK? - Analytics Vidhya. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage