OpenAI总裁：GPT-4并不完美但却绝对与众不同-人工智能-PHP中文网

首页

科技周边

人工智能

OpenAI总裁：GPT-4并不完美但却绝对与众不同

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 10, 2023 pm 04:11 PM

openai 人工智能

OpenAI总裁：GPT-4并不完美但却绝对与众不同

3月16日消息，人工智能研究公司OpenAI于昨日发布了备受期待的文本生成AI模型GPT-4。OpenAI联合创始人兼总裁格雷格·布罗克曼（Greg Brockman）在接受采访时表示，GPT-4并不完美，但却绝对与众不同。

GPT-4在其前身GPT-3的基础上，在许多关键方面进行了改进，例如提供了更多真实的陈述，并允许开发人员更容易控制其风格和行为。从某种意义上说，GPT-4也是多模式的，因为它可以理解图像，能给照片添加注释，甚至详细描述照片中的内容。

但GPT-4也有严重的缺陷。就像GPT-3一样，该模型会产生“幻觉”（即模型聚合的文本与源文本无关或不够准确），并会犯下基本的推理错误。OpenAI在自己的博客上举了一个例子，GPT-4将“猫王”埃尔维斯·普雷斯利（Elvis Presley）描述为“演员的儿子”，但实际上他的父母都不是演员。

当被要求将GPT-4与GPT-3进行比较时，布罗克曼只给出了四个字回答：与众不同。他解释称：“GPT-4绝对与众不同，尽管它还存在很多问题和错误。但你可以看到其在微积分或法律等学科技能方面的跃升。它在某些领域的表现曾很糟糕，现在却已经达到超越普通人的水准。”

测试结果支持了布罗克曼的观点。在高考微积分考试中，GPT-4得4分(满分5分)，GPT-3得1分，介于GPT-3和GPT-4之间的GPT-3.5也得4分。在模拟律师考试中，GPT-4成绩进入了前10%行列，而GPT-3.5的分数在后10%左右徘徊。

与此同时，GPT-4更受人关注的地方在于上面提到的多模式。与GPT-3和GPT-3.5不同，它们只能接受文本提示，例如可以要求“写一篇关于长颈鹿的文章”，而GPT-4可以同时接受图像和文本提示来执行某些操作，比如识别在塞伦盖蒂拍摄的长颈鹿图像，并给出基本的内容描述。

这是因为GPT-4是针对图像和文本数据进行培训的，而它的前身只针对文本进行了培训。OpenAI表示，培训数据来自“各种合法授权的、公开可用的数据源，其中可能包括公开可用的个人信息”，但当被要求提供细节时，布罗克曼表示拒绝。训练数据以前也曾让OpenAI陷入法律纠纷。

GPT-4的图像理解能力给人留下了相当深刻的印象。例如，输入提示“这张图片有什么好笑的？GPT-4会将整张图片分解，并正确地解释了这个笑话的笑点。

目前，只有一个合作伙伴可以使用GPT-4的图像分析功能，这是一款针对视障人士的辅助应用程序，名为Be My Eyes。布罗克曼说，在OpenAI评估风险和利弊的过程中，无论何时，更广泛的推广都将是“缓慢而有意的”。

他还称：“有些政策问题也需要解决，比如面部识别和如何处理人的图像。我们需要找出危险区域在哪里，红线在哪里，然后随着时间的推移找到解决方案。”

OpenAI在其文本到图像转换系统Dall-E 2上也遇到了类似伦理困境。在最初禁用该功能后，OpenAI允许客户上传人脸，以使用AI支持的图像生成系统对其进行编辑。当时，OpenAI声称，其安全系统的升级使面部编辑功能成为可能，因为它将深度造假以及试图创造色情、政治和暴力内容的潜在危害降至最低。

另一个长期问题是防止GPT-4在无意中被用于可能造成伤害的方式使用。该模型发布几小时后，以色列网络安全初创公司Adversa AI发布了一篇博客文章，演示了绕过OpenAI的内容过滤器并让GPT-4生成钓鱼电子邮件、对同性恋者的进攻性描述以及其他令人反感文本的方法。

这在语言模型领域并不是新问题。Facebook母公司Meta的聊天机器人BlenderBot和OpenAI的ChatGPT也曾被诱惑输出不恰当的内容，甚至透露了它们内部工作的敏感细节。但包括记者在内的许多人曾希望，GPT-4可能会在这方面带来重大改进。

当被问及GPT-4的健壮性时，布罗克曼强调，该模型已经经过了六个月的安全培训。在内部测试中，它对OpenAI使用政策不允许的内容请求做出响应的可能性比GPT-3.5低82%，产生“事实”响应的可能性比GPT-3.5高40%。

布罗克曼说：“我们花了很多时间试图了解GPT-4的能力。我们正在不断更新，包括一系列改进，这样该模型就更具可扩展性，以适应人们希望它拥有的个性或模式。”

坦率地说，早期的现实测试结果并不是那么让人满意。除了Adversa AI测试之外，微软的聊天机器人Bing Chat也被证明非常容易越狱。使用精心设计的输入，用户能够让该聊天机器人表达爱意，发出威胁伤害，为大屠杀辩护，并发明阴谋论。

布罗克曼并未否认GPT-4在这方面的不足，但他强调了该模型的新限制工具，包括被称为“系统”消息的API级功能。系统消息本质上是为GPT-4的交互设定基调并建立界限的指令。例如，一条系统消息可能是这样写的：“你是一位总是以苏格拉底风格回答问题的导师。你永远不会给学生答案，而是总是试着问正确的问题，帮助他们学会独立思考。”

其思想是，系统消息充当护栏，防止GPT-4偏离轨道。布罗克曼说：“真正弄清楚GPT-4的语气、风格和实质一直是我们非常关注的问题。我认为我们开始更多地了解如何进行工程设计，如何拥有一个可重复的过程，让你得到对人们真正有用的可预测结果。”

布罗克曼还提到了Evals，这是OpenAI最新的开源软件框架，用于评估其AI模型的性能，这是OpenAI致力于“增强”其模型的标志。Evals允许用户开发和运行评估模型(如GPT-4)的基准测试，同时检查它们的性能，这是一种众包的模型测试方法。

布罗克曼说：“有了Evals，我们可以更好地看到用户关心的用例，并可以对其进行测试。我们之所以开源这个框架，部分原因是我们不再每隔三个月发布一个新模型以不断改进。你不会制造你不能测量的东西，对吧？但随着我们推出新版模型，我们至少可以知道发生了哪些变化。”

布罗克曼还被问道，OpenAI是否会补偿人们用Evals测试它的模型？他不愿就此做出承诺，但他确实指出，在有限的时间内，OpenAI允许提出申请的Eevals用户提前访问GPT-4 API。

布罗克曼还谈到了GPT-4的上下文窗口，该窗口指的是模型在生成额外文本之前可以考虑的文本。OpenAI正在测试一种版本的GPT-4，它可以“记住”大约50页内容，是普通GPT-4“内存”的5倍，是GPT-3的8倍。

布罗克曼认为，扩展的上下文窗口会带来新的、以前从未探索过的用例，特别是在企业中。他设想了一款为公司打造的AI聊天机器人，它可以利用来自不同来源(包括各部门员工)的背景和知识，以一种非常内行但具有对话性的方式回答问题。

这并不是一个新概念。但布罗克曼认为，GPT-4的答案将比目前其他聊天机器人和搜索引擎提供的答案有用得多。他说：“以前，模型根本不知道你是谁，你对什么感兴趣等。而拥有更大的上下文窗口肯定会让它变得更强，从而大大增强它能为人们提供的支持。”（小小）

以上是OpenAI总裁：GPT-4并不完美但却绝对与众不同的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

gmail邮箱登陆入口在哪里

7504

CakePHP 教程

1377

steam的账户名称是什么格式

win11激活密钥永久

NYT连接提示和答案

显示更多

Related knowledge

编程新范式，当Spring Boot遇上OpenAI Feb 01, 2024 pm 09:18 PM

2023年，AI技术已经成为热点话题，对各行业产生了巨大影响，编程领域尤其如此。人们越来越认识到AI技术的重要性，Spring社区也不例外。随着GenAI（GeneralArtificialIntelligence）技术的不断进步，简化具备AI功能的应用程序的创建变得至关重要和迫切。在这个背景下，"SpringAI"应运而生，旨在简化开发AI功能应用程序的过程，使其变得简单直观，避免不必要的复杂性。通过"SpringAI"，开发者可以更轻松地构建具备AI功能的应用程序，将其变得更加易于使用和操作

选择最适合数据的嵌入模型：OpenAI 和开源多语言嵌入的对比测试 Feb 26, 2024 pm 06:10 PM

OpenAI最近宣布推出他们的最新一代嵌入模型embeddingv3，他们声称这是性能最出色的嵌入模型，具备更高的多语言性能。这一批模型被划分为两种类型：规模较小的text-embeddings-3-small和更为强大、体积较大的text-embeddings-3-large。这些模型的设计和训练方式的信息披露得很少,模型只能通过付费API访问。所以就出现了很多开源的嵌入模型但是这些开源的模型与OpenAI闭源模型相比如何呢？本文将对这些新模型与开源模型的性能进行实证比较。我们计划建立一个数据

OpenAI超级对齐团队遗作：两个大模型博弈一番，输出更好懂了 Jul 19, 2024 am 01:29 AM

如果AI模型给的答案一点也看不懂，你敢用吗？随着机器学习系统在更重要的领域得到应用，证明为什么我们可以信任它们的输出，并明确何时不应信任它们，变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是，要求系统对其输出产生一种解释，这种解释对人类或另一个受信任的系统来说是可读的，即可以完全理解以至于任何可能的错误都可以被发现。例如，为了建立对司法系统的信任，我们要求法院提供清晰易读的书面意见，解释并支持其决策。对于大型语言模型来说，我们也可以采用类似的方法。不过，在采用这种方法时，确保语言模型生

基于Rust的Zed编辑器已开源，内置对OpenAI和GitHub Copilot的支持 Feb 01, 2024 pm 02:51 PM

作者丨TimAnderson编译丨诺亚出品|51CTO技术栈（微信号：blog51cto）Zed编辑器项目目前仍处于预发布阶段，已在AGPL、GPL和Apache许可下开源。该编辑器以高性能和多种AI辅助选择为特色，但目前仅适用于Mac平台使用。内森·索博（NathanSobo）在一篇帖子中解释道，Zed项目在GitHub上的代码库中，编辑器部分采用了GPL许可，服务器端组件则使用了AGPL许可证，而GPUI（GPU加速用户界面）部分则采用了Apache2.0许可。GPUI是Zed团队开发的一款

没等来OpenAI，等来了Open-Sora全面开源 Mar 18, 2024 pm 08:40 PM

不久前OpenAISora以其惊人的视频生成效果迅速走红，在一众文生视频模型中突出重围，成为全球瞩目的焦点。继2周前推出成本直降46%的Sora训练推理复现流程后，Colossal-AI团队全面开源全球首个类Sora架构视频生成模型「Open-Sora1.0」，涵盖了整个训练流程，包括数据处理、所有训练细节和模型权重，携手全球AI热爱者共同推进视频创作的新纪元。先睹为快，我们先看一段由Colossal-AI团队发布的「Open-Sora1.0」模型生成的都市繁华掠影视频。Open-Sora1.0

微软、OpenAI 计划 1 亿美元投向人形机器人！网友纷纷喊话马斯克 Feb 01, 2024 am 11:18 AM

微软、OpenAI开年被曝预将大笔资金砸向一家人形机器人初创公司。其中，微软计划掏出9500万美元，OpenAI跟投500万美元。彭博社消息称，这家公司本轮预计共要融资5亿美元，投前估值或将达到19亿美元。是什么吸引了他们？不妨先来看一下这家公司的机器人成果。只见这个机器人通体银黑，外观酷似好莱坞科幻大片中的机器人形象：现在，他正在将一颗咖啡胶囊放进咖啡机里：如果没放正，还会自主调整，无需任何人为远程遥控：不过一会儿，一杯咖啡就可以端走享用：有木有家人们已经认出来了，没错，这款机器人就是前段时间

本地运行性能超越 OpenAI Text-Embedding-Ada-002 的 Embedding 服务，太方便了！ Apr 15, 2024 am 09:01 AM

Ollama是一款超级实用的工具，让你能够在本地轻松运行Llama2、Mistral、Gemma等开源模型。本文我将介绍如何使用Ollama实现对文本的向量化处理。如果你本地还没有安装Ollama，可以阅读这篇文章。本文我们将使用nomic-embed-text[2]模型。它是一种文本编码器，在短的上下文和长的上下文任务上，性能超越了OpenAItext-embedding-ada-002和text-embedding-3-small。启动nomic-embed-text服务当你已经成功安装好o

突发！OpenAI开除Ilya盟友，理由：涉嫌信息泄漏 Apr 15, 2024 am 09:01 AM

突发！OpenAI开人了，理由：涉嫌信息泄露。一位是失踪的首席科学家Ilya盟友，超级对齐（Superalignment）团队核心成员LeopoldAschenbrenner。另一位也不简单，是LLM推理团队研究员PavelIzmailov，曾经也在超级对齐团队干过。目前尚不清楚这俩人到底泄露了啥信息。消息被曝出后，不少网友表示“挺震惊”：不久前我还看过Aschenbrenner的帖子，感觉他正处于事业上升期，没想到会有这样的转变。图片还有网友认为：OpenAI失去Aschenbrenner，I

See all articles

OpenAI总裁：GPT-4并不完美但却绝对与众不同

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题