Maison > développement back-end > Tutoriel Python > Soumettre un travail de mise au point : organiser la main d'œuvre

Soumettre un travail de mise au point : organiser la main d'œuvre

DDD
Libérer: 2025-01-06 16:44:40
original
807 Les gens l'ont consulté

Submitting a Fine-Tuning Job: Organising the Workforce

Les Six Triple Eight comptaient sur la discipline et la coordination pour exécuter leur mission. Nous refléterons cela en créant et en soumettant un travail de mise au point, permettant au LLM d'apprendre de notre ensemble de données organisé.

Mise au point avec OpenAI

Lorsque vous créez une tâche de réglage fin via client.fine_tuning.job.create(), vous soumettez votre configuration et votre ensemble de données à OpenAI pour formation. Vous trouverez ci-dessous les paramètres clés et leurs objectifs.


1. Aperçu des paramètres

modèle

  • Description : Le modèle GPT pré-entraîné que vous souhaitez affiner.
  • Exemples : "gpt-3.5-turbo", "davinci", "gpt-4-mini" (hypothétique).

fichier_entraînement

  • Description : ID de fichier d'un fichier JSONL téléchargé contenant vos données d'entraînement.
  • Remarque : obtenez cet identifiant en téléchargeant votre ensemble de données avec l'API Files et en stockant le file_id.

hyperparamètres

  • Description : Un dictionnaire précisant les hyperparamètres de réglage fin.
  • Champs clés :
    • batch_size : Nombre d'exemples par lot (auto par défaut).
    • learning_rate_multiplier : facteur d'échelle pour le taux d'apprentissage (auto par défaut).
    • n_epochs : nombre d'époques (parcourt l'ensemble de l'ensemble de données).

suffixe

  • Description : Une chaîne personnalisée (jusqu'à 18 caractères) ajoutée au nom du modèle affiné.

graine

  • Description : Entier pour la reproductibilité.
  • Utilisation : garantit la même randomisation et des résultats d'entraînement cohérents d'une course à l'autre.

validation_file

  • Description : L'ID de fichier d'un fichier JSONL contenant votre ensemble de validation.
  • Facultatif : Mais recommandé pour suivre le surapprentissage et garantir un modèle bien généralisé.

intégrations

  • Description : une liste d'intégrations (par exemple, poids et biais) que vous souhaitez activer pour le travail.
  • Champs : inclut généralement des configurations spécifiques au type et à l'intégration.

client.fine_tuning.job.create(
    model="gpt-3.5-turbo",
    training_file="train_id",
    hyperparameters={
        "n_epochs": 1
    },
    validation_file="val_id"
)
Copier après la connexion

Gestion des tâches de réglage fin
Récupère jusqu'à 10 tâches de réglage fin.

client.fine_tuning.jobs.list(limit=10)

Copier après la connexion

Récupérer un travail spécifique

client.fine_tuning.retrieve("job_id")


Copier après la connexion

Liste des événements pour un travail

client.fine_tuning.list_events(
    fine_tuning_job_id="xxxx",
    limit=5
)
Copier après la connexion

Résumé

  • Sélection du modèle : choisissez un modèle GPT approprié à affiner.

  • Préparation des données : téléchargez des fichiers JSONL et notez leurs identifiants.

  • Hyperparamètres : ajustez la taille du lot, le taux d'apprentissage et les époques pour des performances optimales.

  • Surveillance : utilisez les fichiers de validation, la récupération des tâches et la journalisation des événements pour garantir l'efficacité de vos trains miniatures.

  • Reproductibilité : définissez une valeur de départ si des résultats cohérents sont importants pour votre flux de travail.

  • En suivant ces étapes, vous disposerez d'un chemin clair pour soumettre et gérer vos tâches de réglage fin dans OpenAI, garantissant ainsi que votre modèle est formé précisément sur vos données personnalisées.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:dev.to
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal