首页 > 后端开发 > Python教程 > 提交微调工作:组织劳动力

提交微调工作:组织劳动力

DDD
发布: 2025-01-06 16:44:40
原创
768 人浏览过

Submitting a Fine-Tuning Job: Organising the Workforce

六三八依靠纪律和协调来执行任务。我们将通过创建和提交微调作业来反映这一点,允许法学硕士从我们策划的数据集中学习。

使用 OpenAI 进行微调

当您通过 client.fine_tuning.job.create() 创建微调作业时,您将配置和数据集提交给 OpenAI 进行训练。以下是关键参数及其用途。


1. 参数概述

模型

  • 描述:您想要微调的预训练 GPT 模型。
  • 示例:“gpt-3.5-turbo”、“davinci”、“gpt-4-mini”(假设)。

训练文件

  • 描述:包含训练数据的已上传 JSONL 文件的文件 ID。
  • 注意:通过使用文件 API 上传数据集并存储 file_id 来获取此 ID。

超参数

  • 描述:指定微调超参数的字典。
  • 关键字段
    • batch_size:每批的示例数(默认为自动)。
    • Learning_rate_multiplier:学习率的比例因子(默认为自动)。
    • n_epochs:纪元数(穿过整个数据集)。

后缀

  • 描述:附加到微调模型名称后的自定义字符串(最多 18 个字符)。

种子

  • 描述:用于再现性的整数。
  • 用法:确保运行中具有相同的随机化和一致的训练结果。

验证文件

  • 描述:包含验证集的 JSONL 文件的文件 ID。
  • 可选:但建议用于跟踪过度拟合并确保良好泛化的模型。

集成

  • 描述:您希望为作业启用的集成列表(例如权重和偏差)。
  • 字段:通常包括类型和特定于集成的配置。

client.fine_tuning.job.create(
    model="gpt-3.5-turbo",
    training_file="train_id",
    hyperparameters={
        "n_epochs": 1
    },
    validation_file="val_id"
)
登录后复制

管理微调作业
检索最多 10 个微调作业。

client.fine_tuning.jobs.list(limit=10)

登录后复制

检索特定工作

client.fine_tuning.retrieve("job_id")


登录后复制

列出作业的事件

client.fine_tuning.list_events(
    fine_tuning_job_id="xxxx",
    limit=5
)
登录后复制

总结

  • 模型选择:选择合适的GPT模型进行微调。

  • 数据准备:上传 JSONL 文件并记下其 ID。

  • 超参数:调整批量大小、学习率和周期以获得最佳性能。

  • 监控:使用验证文件、作业检索和事件记录来确保您的模型有效训练。

  • 再现性:如果一致的结果对您的工作流程很重要,请设置种子。

  • 通过执行这些步骤,您将拥有在 OpenAI 中提交和管理微调作业的清晰路径,确保您的模型根据自定义数据进行精确训练。

以上是提交微调工作:组织劳动力的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:dev.to
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板