Gérer efficacement les coûts de l'API OpenAI: un guide des modèles GPT
Comprendre la structure de tarification des modèles GPT d'OpenAI (GPT-4O, GPT-4O Mini, GPT-3.5 Turbo) est la clé de la gestion du budget. Le suivi de l'utilisation au niveau des tâches fournit des informations sur les coûts granulaires pour vos projets. Ce guide explore des stratégies de surveillance et de gestion efficaces.
Table des matières
Prix de l'API Openai
Le prix est par 1 million de jetons:
Modèle | Jetons d'entrée (par 1 m) | Jetons de sortie (par 1 m) |
GPT-3,5-turbo | 3,00 $ | 6,00 $ |
Gpt-4 | 30,00 $ | 60,00 $ |
GPT-4O | 2,50 $ | 10,00 $ |
GPT-4O-MINI | 0,15 $ | 0,60 $ |
Les économies de coûts sont possibles avec l'API par lots (réduction de 50% sur les jetons d'entrée et de sortie) et les entrées en cache (réduction de 50% des coûts de jeton d'entrée).
Analyse des coûts du monde réel
L'utilisation de la surveillance se fait via le tableau de bord OpenAI. Pour une analyse détaillée au niveau des tâches, considérez l'exemple de code Python suivant:
à partir d'Openai Import Openai Importer des pandas en tant que PD # ... (code pour initialiser les paramètres du client et du modèle OpenAI reste le même) ... # ... (code pour envoyer des invites et collecter les données de réponse reste la même) ... # Afficher les résultats dans un tableau df = pd.dataframe (résultats) Imprimer (DF)
L'exemple démontre des coûts d'environ 0,000093, 0,001050, 0,000425 $ et 0,000030 $ pour GPT-3,5-Turbo, GPT-4, GPT-4O et GPT-4O-MINI respectivement. Notez que les dénombrements de jetons varient même avec des invites identiques en raison de différents tokenzers.
Techniques de réduction des coûts
max_tokens
réduit les coûts de jeton de sortie. Une sélection minutieuse de cette limite est cruciale.complétion = client.chat.completions.create (modèle = 'gpt-4o-mini', messages = [...], max_tokens = 50)
Résumé
La gestion efficace des coûts de l'API OpenAI implique la compréhension de l'utilisation des jetons, de la tarification du modèle et de la mise à profit des fonctionnalités comme l'API par lots et les limites max_tokens
. GPT-4O-MINI offre une rentabilité pour de nombreuses tâches, tandis que GPT-4O offre un équilibre de pouvoir et d'abordabilité pour les besoins à volume élevé.
(Genai Pinnacle Program Mention supprimé car c'est une publicité)
Questions fréquemment posées
max_tokens
, utilisez l'API Batch.Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!