目录
在人工智能模型中占有一席之地
成长中的大型语言模型家族
首页 科技周边 人工智能 ChatGPT vs. GPT-3 vs. GPT-4只是聊天机器人家族的内部斗争

ChatGPT vs. GPT-3 vs. GPT-4只是聊天机器人家族的内部斗争

Mar 31, 2023 pm 10:39 PM
人工智能 chatgpt 聊天机器人

在解释SoMin公司的广告文案和横幅生成功能时,经常有人会问,是否用ChatGPT取代了GPT-3,或者是否仍然在运行过时的模式。

在解释SoMin公司的广告文案和横幅生成功能时,经常有人会问,是否用ChatGPT取代了GPT-3,或者是否仍然在运行过时的模式。“我们没有,也不打算这样做。”SoMin公司发言人给出这样的回答,尽管OpenAI公司推出的ChatGPT这款聊天机器人正在蓬勃发展。这往往会让客户大吃一惊,以下解释一下他为什么要给出这样的回答。

ChatGPT vs. GPT-3 vs. GPT-4只是聊天机器人家族的内部斗争

在人工智能模型中占有一席之地

GPT-2、GPT-3、ChatGPT以及最近推出的GPT-4都属于同一类人工智能模型——Transformer。这意味着,与上一代机器学习模型不同,它们被训练来完成更统一的任务,因此它们不需要为每个特定的任务重新训练来产生可行的结果。后者解释了它们的巨大规模(在GPT-3的例子中有1750亿个参数),而一个模型可能需要“记住整个互联网”,才能足够灵活地根据用户输入在不同的数据片段之间切换。然后,当用户输入查询的问题,描述任务和几个示例(就像你向图书管理员询问感兴趣的书籍一样)时,模型能够生成结果。这种方法被称为“小样本学习”(Few-Shot Learning),最近在为现代Transformer模型提供输入已成为一种趋势。

但是,为了完成当前的任务,是否总是需要掌握所有的互联网知识呢?当然不是——在很多情况下,就像ChatGPT一样,需要大量 (数以百万计)特定于任务的数据样本,这些样本将允许模型启动“从人类反馈中强化学习(RLHF)”过程。反过来,RLHF将衍生出人工智能和人类之间进行的协作训练过程,以进一步训练人工智能模型,以产生类似人类的对话。因此,ChatGPT不仅在聊天机器人场景中表现出色,而且还帮助人们编写短篇内容(例如诗歌或歌词)或长篇内容(例如论文);当人们需要快速获得答案时,可以采用简单的术语或深入的知识解释复杂的话题;提供头脑风暴、新的话题和想法,这在创作过程中是有帮助的,支持销售部门进行个性化沟通,例如生成电子邮件进行回复。

虽然从技术上来说,大型Transformer模型可以尝试完成这些任务,但不太可能由ChatGPT甚至GPT-4来完成——这是因为ChatGPT和其他OpenAI的Transformer对世界发生的事件了解非常有限,因为它们是预训练的模型,因此由于模型再训练的计算需求非常大,因此它们的数据更新不够频繁。这可能是迄今为止OpenAI(以及其他任何公司)所生成的所有预训练模型中最大的缺点。一个更大的问题是针对ChatGPT的:与GPT-3不同,它是在一个非常集中的对话数据集上进行训练的,因此,只有在对话任务中ChatGPT才能超越它的前辈,而在完成其他人类生产力任务时,它就不那么先进。

成长中的大型语言模型家族

人们现在知道ChatGPT只是GPT-3的一个更小、更具体的版本,但这是否意味着在不久的将来会有更多这样的模型出现:用于营销的MarGPT,用于数字广告的AdGPT,用于回答医疗问题的MedGPT?

这是有可能的,其原因如下:当SoMin公司提交一份申请以获得GPT-3 Beta的访问权限时,尽管填写了一份冗长的申请表,详细解释了将要构建的当前软件,但被要求同意提供关于每天如何使用模型以及所收到的结果的反馈。OpenAI公司这样做是有原因的,主要是因为这是一个研究项目,他们需要对模型的最佳应用进行商业洞察,他们通过众筹来换取参与这场伟大的人工智能革命的机会。聊天机器人应用程序似乎是最受欢迎的应用程序之一,所以ChatGPT首先出现。ChatGPT不仅规模更小(200亿个参数vs.1750亿个参数),而且比GPT-3更快,而且在解决会话任务时比GPT-3更准确——对于低成本/高质量的人工智能产品来说,这是一个完美的商业案例。

那么,对于生成式人工智能来说,规模越大越好吗?其答案是,要视情况而定。当人们正在构建一个能够完成许多任务的通用学习模型时,其答案是肯定的,其规模越大越好,GPT-3比GPT-2和其他前辈的优势证明了这一点。但是,当人们想要很好地完成一项特定的任务时,就像ChatGPT中的聊天机器人一样,那么与模型和数据大小相比,数据焦点和适当的训练过程要重要得多。这就是为什么在SoMin公司没有使用ChatGPT来生成文案和横幅的原因,而是利用特定的数字广告相关数据来指导GPT-3为尚未看到的新广告制作更好的内容。

那么,有人可能会问,生成式人工智能的未来将如何发展?多模态将是人们在即将到来的GPT-4中看到的不可避免的进步之一,正如OpenAI公司首席执行官Sam Altman在他的演讲中提到的那样。与此同时,Altman还打破了该模型拥有100万亿个参数的传言。因此,人们都知道,这种人工智能模型越大并不总是代表着越好。

以上是ChatGPT vs. GPT-3 vs. GPT-4只是聊天机器人家族的内部斗争的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

ChatGPT 现在允许免费用户使用 DALL-E 3 生成每日限制的图像 ChatGPT 现在允许免费用户使用 DALL-E 3 生成每日限制的图像 Aug 09, 2024 pm 09:37 PM

DALL-E 3 于 2023 年 9 月正式推出,是比其前身大幅改进的型号。它被认为是迄今为止最好的人工智能图像生成器之一,能够创建具有复杂细节的图像。然而,在推出时,它不包括

字节跳动剪映推出 SVIP 超级会员:连续包年 499 元,提供多种 AI 功能 字节跳动剪映推出 SVIP 超级会员:连续包年 499 元,提供多种 AI 功能 Jun 28, 2024 am 03:51 AM

本站6月27日消息,剪映是由字节跳动旗下脸萌科技开发的一款视频剪辑软件,依托于抖音平台且基本面向该平台用户制作短视频内容,并兼容iOS、安卓、Windows、MacOS等操作系统。剪映官方宣布会员体系升级,推出全新SVIP,包含多种AI黑科技,例如智能翻译、智能划重点、智能包装、数字人合成等。价格方面,剪映SVIP月费79元,年费599元(本站注:折合每月49.9元),连续包月则为59元每月,连续包年为499元每年(折合每月41.6元)。此外,剪映官方还表示,为提升用户体验,向已订阅了原版VIP

微调真的能让LLM学到新东西吗:引入新知识可能让模型产生更多的幻觉 微调真的能让LLM学到新东西吗:引入新知识可能让模型产生更多的幻觉 Jun 11, 2024 pm 03:57 PM

大型语言模型(LLM)是在巨大的文本数据库上训练的,在那里它们获得了大量的实际知识。这些知识嵌入到它们的参数中,然后可以在需要时使用。这些模型的知识在训练结束时被“具体化”。在预训练结束时,模型实际上停止学习。对模型进行对齐或进行指令调优,让模型学习如何充分利用这些知识,以及如何更自然地响应用户的问题。但是有时模型知识是不够的,尽管模型可以通过RAG访问外部内容,但通过微调使用模型适应新的领域被认为是有益的。这种微调是使用人工标注者或其他llm创建的输入进行的,模型会遇到额外的实际知识并将其整合

为大模型提供全新科学复杂问答基准与测评体系,UNSW、阿贡、芝加哥大学等多家机构联合推出SciQAG框架 为大模型提供全新科学复杂问答基准与测评体系,UNSW、阿贡、芝加哥大学等多家机构联合推出SciQAG框架 Jul 25, 2024 am 06:42 AM

编辑|ScienceAI问答(QA)数据集在推动自然语言处理(NLP)研究发挥着至关重要的作用。高质量QA数据集不仅可以用于微调模型,也可以有效评估大语言模型(LLM)的能力,尤其是针对科学知识的理解和推理能力。尽管当前已有许多科学QA数据集,涵盖了医学、化学、生物等领域,但这些数据集仍存在一些不足。其一,数据形式较为单一,大多数为多项选择题(multiple-choicequestions),它们易于进行评估,但限制了模型的答案选择范围,无法充分测试模型的科学问题解答能力。相比之下,开放式问答

SK 海力士 8 月 6 日将展示 AI 相关新品:12 层 HBM3E、321-high NAND 等 SK 海力士 8 月 6 日将展示 AI 相关新品:12 层 HBM3E、321-high NAND 等 Aug 01, 2024 pm 09:40 PM

本站8月1日消息,SK海力士今天(8月1日)发布博文,宣布将出席8月6日至8日,在美国加利福尼亚州圣克拉拉举行的全球半导体存储器峰会FMS2024,展示诸多新一代产品。未来存储器和存储峰会(FutureMemoryandStorage)简介前身是主要面向NAND供应商的闪存峰会(FlashMemorySummit),在人工智能技术日益受到关注的背景下,今年重新命名为未来存储器和存储峰会(FutureMemoryandStorage),以邀请DRAM和存储供应商等更多参与者。新产品SK海力士去年在

SOTA性能,厦大多模态蛋白质-配体亲和力预测AI方法,首次结合分子表面信息 SOTA性能,厦大多模态蛋白质-配体亲和力预测AI方法,首次结合分子表面信息 Jul 17, 2024 pm 06:37 PM

编辑|KX在药物研发领域,准确有效地预测蛋白质与配体的结合亲和力对于药物筛选和优化至关重要。然而,目前的研究没有考虑到分子表面信息在蛋白质-配体相互作用中的重要作用。基于此,来自厦门大学的研究人员提出了一种新颖的多模态特征提取(MFE)框架,该框架首次结合了蛋白质表面、3D结构和序列的信息,并使用交叉注意机制进行不同模态之间的特征对齐。实验结果表明,该方法在预测蛋白质-配体结合亲和力方面取得了最先进的性能。此外,消融研究证明了该框架内蛋白质表面信息和多模态特征对齐的有效性和必要性。相关研究以「S

布局 AI 等市场,格芯收购泰戈尔科技氮化镓技术和相关团队 布局 AI 等市场,格芯收购泰戈尔科技氮化镓技术和相关团队 Jul 15, 2024 pm 12:21 PM

本站7月5日消息,格芯(GlobalFoundries)于今年7月1日发布新闻稿,宣布收购泰戈尔科技(TagoreTechnology)的功率氮化镓(GaN)技术及知识产权组合,希望在汽车、物联网和人工智能数据中心应用领域探索更高的效率和更好的性能。随着生成式人工智能(GenerativeAI)等技术在数字世界的不断发展,氮化镓(GaN)已成为可持续高效电源管理(尤其是在数据中心)的关键解决方案。本站援引官方公告内容,在本次收购过程中,泰戈尔科技公司工程师团队将加入格芯,进一步开发氮化镓技术。G

SearchGPT:开放人工智能用自己的人工智能搜索引擎挑战谷歌 SearchGPT:开放人工智能用自己的人工智能搜索引擎挑战谷歌 Jul 30, 2024 am 09:58 AM

开放人工智能终于进军搜索领域。这家旧金山公司最近宣布了一款具有搜索功能的新人工智能工具。 The Information 于今年 2 月首次报道,该新工具被恰当地称为 SearchGPT,并具有 c

See all articles