首页 科技周边 人工智能 「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

Apr 30, 2024 pm 04:40 PM
git ai 模型

前段时间,微软搞了个乌龙:隆重地开源了 WizardLM-2,又在不久后撤回得干干净净。

目前可查询的 WizardLM-2 发布信息,这是一个“真正媲美 GPT-4”的开源大模型,在复杂聊天、多语言、推理和代理方面的性能得到了提高。

该系列包括三个模型:WizardLM-2 8x22B、WizardLM-2 70B 和 WizardLM-2 7B。其中:

  • WizardLM-2 8x22B 是最先进的模型,也是对高度复杂任务进行内部评估后得出的最佳开源 LLM。
  • WizardLM-2 70B 具备顶级推理能力,是同等规模的首选;
  • WizardLM-2 7B 是速度最快的,其性能可与现有的 10 倍大的开源领先模型相媲美。

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

此外,通过人类偏好评估,WizardLM-28x22B 的能力「只是稍微落后于 GPT-4-1106 预览版,但明显强于 CommandRPlus 和 GPT4-0314。」

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

它会和 LLaMa 3 一样,成为又一开源里程碑吗?

当大家忙着下载模型的时候,团队却突然撤回了一切:博客、GitHub、HuggingFace 全部 404。

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

图源:https://wizardlm.github.io/WizardLM2/

团队的解释是:

所有 Huggingface 的朋友们,大家好!很抱歉,我们删除了模型。我们已经有一段时间没有发布几个月前的模型了,所以我们现在不熟悉新的发布流程:我们不小心遗漏了模型发布流程中的一个必要项目 — 毒性测试。这是目前所有新模型都需要完成的一个步骤。

我们目前正在快速完成这项测试,然后将尽快重新发布我们的模型。不用担心,感谢关心和理解。

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

但 AI 社区对 WizardLM-2 的关注和讨论没有停止,疑点有几个:

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

第一,被删掉的开源项目不只是 WizardLM-2,该团队所有的 Wizard 系列工作都不见了,包括此前的 WizardMath 和 WizardCoder。

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

第二,有人质疑,删除模型权重的同时,为何连博客也删除呢?如果是只是缺少测试部分,没必要撤回得干干净净。

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

团队的解释是:「根据相关规定。」具体什么规定?目前没人知道。

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

第三,还有人猜测 WizardLM 背后的团队已经被解雇,撤回 Wizard 系列项目也是被迫的。

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

不过,这种猜测被团队否认了:

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

图源:https://x.com/_Mira___Mira_/status/1783716276944486751

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

图源:https://x.com/DavidFSWD/status/1783682898786152470

而且我们现在搜索作者的名字,也并没有从微软官网中完全消失:

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

图源:https://www.microsoft.com/en-us/research/people/qins/

第四,有人猜测,微软撤回这个开源模型,一是因为性能过于接近 GPT-4,二是因为和 OpenAI 的技术路线「撞车」了。

具体是什么路线呢?我们可以看一下当初博客页面的技术细节。

团队表示,通过 LLM 训练,自然界中人类生成的数据日益枯竭,而 AI 精心创建的数据和 AI Step-by-Step 监督的模型将是通往更强大 AI 的唯一途径。

过去的一年里,微软团队建立了一个完全由人工智能驱动的合成训练系统,如下图所示。

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

大概分为几个版块:

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

数据预处理:

  1. 数据分析:使用这个 pipeline 来获得新源数据的不同属性的分布,这有助于对数据有一个初步的了解。
  2. 加权采样:最佳训练数据的分布往往与人类聊天语料的自然分布不一致,需要根据实验经验调整训练数据中各属性的权重。

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

Evol Lab:

  1. Evol-Instruct:投入了大量精力重新评估了最初 Evol-Instruct 方法中存在的各种问题,并对其进行了初步修改,新方法能让各种智能体自动生成高质量的指令。
  2. Evol-Answer:引导模型多次生成和重写回复,可以提高其逻辑性、正确性和亲和力。

AI Align AI(AAA):

  1. 协同教学:收集 WizardLM 和各种授权开源和专有的最先进模型,然后让它们协同教学并相互提高,教学内容包括模拟聊天、质量评判、改进建议和缩小技能差距等。
  2. Self-Teaching:WizardLM 可以通过激活学习,为监督学习生成新的进化训练数据,为强化学习生成偏好数据。

学习:

  1. 监督学习。
  2. 阶段 - DPO:为了更有效地进行离线强化学习,将优选数据分割成不同的片段,并逐级改进模型。
  3. RLEIF:采用指令质量奖励模型(IRM)与过程监督奖励模型(PRM)相结合的方法,使得在线强化学习中实现更精确的正确性。

最后要说的是,任何猜测都是徒劳的,让我们期待一下 WizardLM-2 的复出吧。

以上是「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
4 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

Laravel的地理空间:互动图和大量数据的优化 Laravel的地理空间:互动图和大量数据的优化 Apr 08, 2025 pm 12:24 PM

利用地理空间技术高效处理700万条记录并创建交互式地图本文探讨如何使用Laravel和MySQL高效处理超过700万条记录,并将其转换为可交互的地图可视化。初始挑战项目需求:利用MySQL数据库中700万条记录,提取有价值的见解。许多人首先考虑编程语言,却忽略了数据库本身:它能否满足需求?是否需要数据迁移或结构调整?MySQL能否承受如此大的数据负载?初步分析:需要确定关键过滤器和属性。经过分析,发现仅少数属性与解决方案相关。我们验证了过滤器的可行性,并设置了一些限制来优化搜索。地图搜索基于城

mysql 无法启动怎么解决 mysql 无法启动怎么解决 Apr 08, 2025 pm 02:21 PM

MySQL启动失败的原因有多种,可以通过检查错误日志进行诊断。常见原因包括端口冲突(检查端口占用情况并修改配置)、权限问题(检查服务运行用户权限)、配置文件错误(检查参数设置)、数据目录损坏(恢复数据或重建表空间)、InnoDB表空间问题(检查ibdata1文件)、插件加载失败(检查错误日志)。解决问题时应根据错误日志进行分析,找到问题的根源,并养成定期备份数据的习惯,以预防和解决问题。

mysql安装后怎么使用 mysql安装后怎么使用 Apr 08, 2025 am 11:48 AM

文章介绍了MySQL数据库的上手操作。首先,需安装MySQL客户端,如MySQLWorkbench或命令行客户端。1.使用mysql-uroot-p命令连接服务器,并使用root账户密码登录;2.使用CREATEDATABASE创建数据库,USE选择数据库;3.使用CREATETABLE创建表,定义字段及数据类型;4.使用INSERTINTO插入数据,SELECT查询数据,UPDATE更新数据,DELETE删除数据。熟练掌握这些步骤,并学习处理常见问题和优化数据库性能,才能高效使用MySQL。

偏远的高级后端工程师(平台)需要圈子 偏远的高级后端工程师(平台)需要圈子 Apr 08, 2025 pm 12:27 PM

远程高级后端工程师职位空缺公司:Circle地点:远程办公职位类型:全职薪资:$130,000-$140,000美元职位描述参与Circle移动应用和公共API相关功能的研究和开发,涵盖整个软件开发生命周期。主要职责独立完成基于RubyonRails的开发工作,并与React/Redux/Relay前端团队协作。为Web应用构建核心功能和改进,并在整个功能设计过程中与设计师和领导层紧密合作。推动积极的开发流程,并确定迭代速度的优先级。要求6年以上复杂Web应用后端

mysql 能返回 json 吗 mysql 能返回 json 吗 Apr 08, 2025 pm 03:09 PM

MySQL 可返回 JSON 数据。JSON_EXTRACT 函数可提取字段值。对于复杂查询,可考虑使用 WHERE 子句过滤 JSON 数据,但需注意其性能影响。MySQL 对 JSON 的支持在不断增强,建议关注最新版本及功能。

了解 ACID 属性:可靠数据库的支柱 了解 ACID 属性:可靠数据库的支柱 Apr 08, 2025 pm 06:33 PM

数据库ACID属性详解ACID属性是确保数据库事务可靠性和一致性的一组规则。它们规定了数据库系统处理事务的方式,即使在系统崩溃、电源中断或多用户并发访问的情况下,也能保证数据的完整性和准确性。ACID属性概述原子性(Atomicity):事务被视为一个不可分割的单元。任何部分失败,整个事务回滚,数据库不保留任何更改。例如,银行转账,如果从一个账户扣款但未向另一个账户加款,则整个操作撤销。begintransaction;updateaccountssetbalance=balance-100wh

掌握SQL LIMIT子句:控制查询中的行数 掌握SQL LIMIT子句:控制查询中的行数 Apr 08, 2025 pm 07:00 PM

SQLLIMIT子句:控制查询结果行数SQL中的LIMIT子句用于限制查询返回的行数,这在处理大型数据集、分页显示和测试数据时非常有用,能有效提升查询效率。语法基本语法:SELECTcolumn1,column2,...FROMtable_nameLIMITnumber_of_rows;number_of_rows:指定返回的行数。带偏移量的语法:SELECTcolumn1,column2,...FROMtable_nameLIMIToffset,number_of_rows;offset:跳过

mysql 主键可以为 null mysql 主键可以为 null Apr 08, 2025 pm 03:03 PM

MySQL 主键不可以为空,因为主键是唯一标识数据库中每一行的关键属性,如果主键可以为空,则无法唯一标识记录,将会导致数据混乱。使用自增整型列或 UUID 作为主键时,应考虑效率和空间占用等因素,选择合适的方案。

See all articles