目录
自服务微调API的新特性
辅助微调和定制训练模型
首页 科技周边 人工智能 OpenAI提供新的微调和定制选项

OpenAI提供新的微调和定制选项

Apr 19, 2024 pm 03:19 PM
人工智能 openai

微调在构建有价值的人工智能工具中起着至关重要的作用。这种使用更有针对性的数据集精炼预训练模型的过程可使用户大大增加模型对专业内涵的理解,允许用户为特定任务的模型增加现成知识。

OpenAI提供新的微调和定制选项

虽然这个过程可能需要时间,但与从头开始训练模型相比,它的成本效益通常要高三倍。这一数值正如OpenAI最近宣布扩展其自定义模型程序以及为其微调API提供各种新功能所反映的那样。

自服务微调API的新特性

OpenAI于2023年8月首次宣布推出针对GPT-3的自助微调API,并受到了AI社区的热烈响应。据OpenAI报告称,成千上万的团体已经利用API来训练成千上万的模型,比如利用特定的编程语言生成代码,将文本总结为特定的格式,或根据用户行为创建个性化的内容。

自从2023年8月开始,工作匹配和招聘平台Indeed取得了重大成功。为了将求职者与相关的空缺职位相匹配,Indeed向用户发送个性化推荐。通过微调GPT 3.5 Turbo以生成更准确的流程解释,并能够将提醒中的令牌数量减少80%。这使得该公司每月发送给求职者的信息从不足100万条增加到大约2000万条。

新微调API特性建立在这个成功的基础上,希望为未来的用户改进功能:

基于epoch的检查点创建:在每个训练epoch自动生成一个完整的微调模型检查点,这减少了后续再训练的需要,特别是在过度拟合的情况下。

Comparity Playground:一个新的并行Playground UI,用于比较模型质量和性能,允许人工评估多个模型的输出或针对单个提示进行微调快照。

第三方集成:支持与第三方平台的集成(从权限重和偏差开始),使开发人员能够将详细的微调数据共享给堆栈的其余部分。

综合验证指标:能够计算整个验证数据集的损失和准确性等指标,从而更好地了解模型质量。

超级参数配置:能够从仪表板配置可用的超级参数(而不仅仅是通过API或SDK)。

微调仪表板改进:包括配置超级参数、查看更详细的训练指标以及从以前的配置中重新运行作业的能力。

基于过去的成功,OpenAI相信这些新功能将使开发人员对他们的微调工作有更细粒度的控制。

辅助微调和定制训练模型

OpenAI还在2023年11月在DevDay上发布的基础上,改进了自定义模型计划。其中一个主要变化是辅助微调的出现,这是一种利用API微调之外的有价值技术的手段,例如在更大范围内添加额外的超级参数和各种参数有效微调(PEFT)方法。

SK电信就是充分发挥这项服务潜力的一个例子。这家电信运营商在韩国拥有超过3000万用户,因此他们希望定制一种可以充当电信客户服务专家的人工智能模型。

通过与OpenAI合作对GPT-4进行微调,使其专注于韩国电信相关的对话,SK电信的对话摘要质量提高了35%,意图识别准确率提高了33%。当将他们的新微调模型与广义GPT-4进行比较时,他们的满意度得分也从3.6提高到4.5(满分5分)。

OpenAI还引入了为需要深度微调的特定领域知识模型的公司构建定制模型的能力。与法律人工智能公司Harvey的合作证明了这一功能的价值。法律工作需要大量阅读密集的文件,Harvey想用LLMs(大型语言模型)从这些文件中综合信息,并将其提交给律师进行审查。然而,许多法律是复杂的,并且依赖于上下文,Harvey希望与OpenAI合作建立一个定制训练的模型,该模型可以将新的知识和推理方法纳入基本模型。

Harvey与OpenAI合作,添加了相当于100亿令牌的数据来定制训练这个判例法模型。通过增加必要的背景深度来做出明智的法律判断,结果模型的事实性回答提高了83%。

人工智能工具从来都不是“包治百病”的解决方案。可定制性是这项技术有用性的核心,OpenAI在微调和定制训练模型方面的工作将有助于扩展已经从该工具中获得的组织。

以上是OpenAI提供新的微调和定制选项的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

字节跳动剪映推出 SVIP 超级会员:连续包年 499 元,提供多种 AI 功能 字节跳动剪映推出 SVIP 超级会员:连续包年 499 元,提供多种 AI 功能 Jun 28, 2024 am 03:51 AM

本站6月27日消息,剪映是由字节跳动旗下脸萌科技开发的一款视频剪辑软件,依托于抖音平台且基本面向该平台用户制作短视频内容,并兼容iOS、安卓、Windows、MacOS等操作系统。剪映官方宣布会员体系升级,推出全新SVIP,包含多种AI黑科技,例如智能翻译、智能划重点、智能包装、数字人合成等。价格方面,剪映SVIP月费79元,年费599元(本站注:折合每月49.9元),连续包月则为59元每月,连续包年为499元每年(折合每月41.6元)。此外,剪映官方还表示,为提升用户体验,向已订阅了原版VIP

使用Rag和Sem-Rag提供上下文增强AI编码助手 使用Rag和Sem-Rag提供上下文增强AI编码助手 Jun 10, 2024 am 11:08 AM

通过将检索增强生成和语义记忆纳入AI编码助手,提升开发人员的生产力、效率和准确性。译自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG,作者JanakiramMSV。虽然基本AI编程助手自然有帮助,但由于依赖对软件语言和编写软件最常见模式的总体理解,因此常常无法提供最相关和正确的代码建议。这些编码助手生成的代码适合解决他们负责解决的问题,但通常不符合各个团队的编码标准、惯例和风格。这通常会导致需要修改或完善其建议,以便将代码接受到应

微调真的能让LLM学到新东西吗:引入新知识可能让模型产生更多的幻觉 微调真的能让LLM学到新东西吗:引入新知识可能让模型产生更多的幻觉 Jun 11, 2024 pm 03:57 PM

大型语言模型(LLM)是在巨大的文本数据库上训练的,在那里它们获得了大量的实际知识。这些知识嵌入到它们的参数中,然后可以在需要时使用。这些模型的知识在训练结束时被“具体化”。在预训练结束时,模型实际上停止学习。对模型进行对齐或进行指令调优,让模型学习如何充分利用这些知识,以及如何更自然地响应用户的问题。但是有时模型知识是不够的,尽管模型可以通过RAG访问外部内容,但通过微调使用模型适应新的领域被认为是有益的。这种微调是使用人工标注者或其他llm创建的输入进行的,模型会遇到额外的实际知识并将其整合

OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了 OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了 Jul 19, 2024 am 01:29 AM

如果AI模型给的答案一点也看不懂,你敢用吗?随着机器学习系统在更重要的领域得到应用,证明为什么我们可以信任它们的输出,并明确何时不应信任它们,变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是,要求系统对其输出产生一种解释,这种解释对人类或另一个受信任的系统来说是可读的,即可以完全理解以至于任何可能的错误都可以被发现。例如,为了建立对司法系统的信任,我们要求法院提供清晰易读的书面意见,解释并支持其决策。对于大型语言模型来说,我们也可以采用类似的方法。不过,在采用这种方法时,确保语言模型生

为大模型提供全新科学复杂问答基准与测评体系,UNSW、阿贡、芝加哥大学等多家机构联合推出SciQAG框架 为大模型提供全新科学复杂问答基准与测评体系,UNSW、阿贡、芝加哥大学等多家机构联合推出SciQAG框架 Jul 25, 2024 am 06:42 AM

编辑|ScienceAI问答(QA)数据集在推动自然语言处理(NLP)研究发挥着至关重要的作用。高质量QA数据集不仅可以用于微调模型,也可以有效评估大语言模型(LLM)的能力,尤其是针对科学知识的理解和推理能力。尽管当前已有许多科学QA数据集,涵盖了医学、化学、生物等领域,但这些数据集仍存在一些不足。其一,数据形式较为单一,大多数为多项选择题(multiple-choicequestions),它们易于进行评估,但限制了模型的答案选择范围,无法充分测试模型的科学问题解答能力。相比之下,开放式问答

SK 海力士 8 月 6 日将展示 AI 相关新品:12 层 HBM3E、321-high NAND 等 SK 海力士 8 月 6 日将展示 AI 相关新品:12 层 HBM3E、321-high NAND 等 Aug 01, 2024 pm 09:40 PM

本站8月1日消息,SK海力士今天(8月1日)发布博文,宣布将出席8月6日至8日,在美国加利福尼亚州圣克拉拉举行的全球半导体存储器峰会FMS2024,展示诸多新一代产品。未来存储器和存储峰会(FutureMemoryandStorage)简介前身是主要面向NAND供应商的闪存峰会(FlashMemorySummit),在人工智能技术日益受到关注的背景下,今年重新命名为未来存储器和存储峰会(FutureMemoryandStorage),以邀请DRAM和存储供应商等更多参与者。新产品SK海力士去年在

SOTA性能,厦大多模态蛋白质-配体亲和力预测AI方法,首次结合分子表面信息 SOTA性能,厦大多模态蛋白质-配体亲和力预测AI方法,首次结合分子表面信息 Jul 17, 2024 pm 06:37 PM

编辑|KX在药物研发领域,准确有效地预测蛋白质与配体的结合亲和力对于药物筛选和优化至关重要。然而,目前的研究没有考虑到分子表面信息在蛋白质-配体相互作用中的重要作用。基于此,来自厦门大学的研究人员提出了一种新颖的多模态特征提取(MFE)框架,该框架首次结合了蛋白质表面、3D结构和序列的信息,并使用交叉注意机制进行不同模态之间的特征对齐。实验结果表明,该方法在预测蛋白质-配体结合亲和力方面取得了最先进的性能。此外,消融研究证明了该框架内蛋白质表面信息和多模态特征对齐的有效性和必要性。相关研究以「S

布局 AI 等市场,格芯收购泰戈尔科技氮化镓技术和相关团队 布局 AI 等市场,格芯收购泰戈尔科技氮化镓技术和相关团队 Jul 15, 2024 pm 12:21 PM

本站7月5日消息,格芯(GlobalFoundries)于今年7月1日发布新闻稿,宣布收购泰戈尔科技(TagoreTechnology)的功率氮化镓(GaN)技术及知识产权组合,希望在汽车、物联网和人工智能数据中心应用领域探索更高的效率和更好的性能。随着生成式人工智能(GenerativeAI)等技术在数字世界的不断发展,氮化镓(GaN)已成为可持续高效电源管理(尤其是在数据中心)的关键解决方案。本站援引官方公告内容,在本次收购过程中,泰戈尔科技公司工程师团队将加入格芯,进一步开发氮化镓技术。G

See all articles