李开复正式宣布推出「全球最强」的开源大模型：处理40万汉字，中英文均位居榜首-人工智能-PHP中文网

首页

科技周边

人工智能

李开复正式宣布推出「全球最强」的开源大模型：处理40万汉字，中英文均位居榜首

PHPz

Nov 06, 2023 pm 06:13 PM

产业李开复 010,000 件东西

李开复指出：“要使得零一万物跻身全球大模型的第一梯队。”

李开复正式宣布推出「全球最强」的开源大模型：处理40万汉字，中英文均位居榜首

开源大模型宇宙又有了新的重量级成员，这次是创新工场董事长兼 CE0 李开复大模型公司「零一万物」推出的「Yi」系列开源大模型。据悉，零一万物在今年 3 月底官宣成立，六七月开始运营，李开复博士为创始人兼 CEO。

11 月 6 日，零一万物正式发布「Yi」系列预训练开源大模型，包括了 Yi-6B 和 Yi-34B 两个版本，给了开源大模型社区「一点小小的震撼」。

根据 Hugging Face 英文开源社区平台和 C-Eval 中文评测的最新榜单，Yi-34B 预训练模型取得了多项 SOTA 国际最佳性能指标认可，成为全球开源大模型「双料冠军」，击败了 LLaMA2 和 Falcon 等开源竞品。

李开复正式宣布推出「全球最强」的开源大模型：处理40万汉字，中英文均位居榜首

Yi-34B 也成为迄今为止唯一成功登顶 Hugging Face 全球开源模型排行榜的国产模型。

李开复正式宣布推出「全球最强」的开源大模型：处理40万汉字，中英文均位居榜首

以小博大，登顶全球英文及中文权威大模型榜单No 1

我们了解到，在 Hugging Face 英文测试公开榜单 Pretrained 预训练开源模型排名中，Yi-34B 的各项指标表现亮眼，以 70.72 的分数位列全球第一，以小博大，碾压 LLaMA2-70B 和 Falcon-180B 等众多大尺寸模型。

在参数量和性能方面，Yi-34B 相当于只用了不及 LLaMA2-70B 一半、Falcon-180B 五分之一的参数量，取得了在各项测试任务中超越全球领跑者的成绩。凭借出色表现，Yi-34B 跻身目前世界范围内开源最强基础模型之列。

李开复正式宣布推出「全球最强」的开源大模型：处理40万汉字，中英文均位居榜首

^{来源：https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard}

同时作为国产大模型，李开复表示，Yi-34B 更「懂」中文，在 C-Eval 中文权威榜单排行榜上超越了全球所有开源模型。

相较于大模型最强王者 GPT-4，Yi-34B 在 CMMLU、E-Eval、Gaokao 三个主要中文指标上具有绝对优势，凸显中文世界的优异能力，能够更好地满足国内市场需求。

李开复正式宣布推出「全球最强」的开源大模型：处理40万汉字，中英文均位居榜首

从更为全面的评估看，在全球大模型各项评测中最关键的「MMLU」（Massive Multitask Language Understanding，大规模多任务语言理解）、BBH 等反映模型综合能力的评测集上，Yi-34B 表现最为突出，在通用能力、知识推理、阅读理解等多项指标评比中全部胜出，与 Hugging Face 评测高度一致。

李开复正式宣布推出「全球最强」的开源大模型：处理40万汉字，中英文均位居榜首

不过，与 LLaMA2 一样，Yi 系列开源大模型在 GSM8k、MBPP 的数学和代码评测表现略逊 GPT 模型。未来，Yi 系列大模型将推出专攻代码能力和数学能力的继续训练模型。

上下文窗口大小突破 200k，并直接开源

在对大模型实战效果至关重要的上下文窗口方面，此次开源的 Yi-34B 发布了全球最长、支持 200K 超长上下文窗口版本，可以处理约 40 万汉字超长文本输入，大致相当于一本《儒林外史》的长度。相比之下，OpenAI 的 GPT-4 上下文窗口只有 32K，文字处理量约 2.5 万字。

李开复正式宣布推出「全球最强」的开源大模型：处理40万汉字，中英文均位居榜首

如何做到的呢？据了解，零一万物技术团队实施了一系列优化，包括了计算通信重叠、序列并行、通信压缩等。通过这些能力增强，实现了在大规模模型训练中近 100 倍的能力提升。

值得一提的是，零一万物还是第一家将超长上下文窗口开源开放的大模型公司，允许开发者直接使用。

Yi-34B 的 200K 上下文窗口直接开源，不仅能提供更丰富的语义信息，理解超过 1000 页的 PDF 文档，让很多依赖于向量数据库构建外部知识库的场景都可以用上下文窗口来进行替代。Yi-34B 的开源属性也给想要在更长上下文窗口进行微调的开发者提供了更多的可能性。

独有科学训模方法，训练成本下降 40%

Yi-34B 如此强大，这要得益于以下两个关键因素，即 AI Infra 团队、自研规模化训练平台。

李开复介绍称，零一万物内部设立了 AI Infra（AI Infrastructure）团队，主要负责大模型训练和部署提供各种底层技术设施，包括处理器、操作系统、存储系统、网络基础设施、云计算平台等等，成为 Yi 系列模型训练背后极其关键的「保障技术」。

凭借强大的 AI Infra 支撑，零一万物团队实现了超越行业水平的训练效果。Yi-34B 模型训练成本实测下降 40%，实际训练完成达标时间与预测的时间误差不到一小时，进一步模拟上到千亿规模训练成本可下降多达 50%。

与此同时，零一万物实现了从「粗放炼丹」到「科学训模」方法论的转化。

经过几个月的建模和实验，零一万物自研出一套「规模化训练实验平台」，用来指导模型的设计和优化。数据配比、超参搜索、模型结构实验都可以在小规模实验平台上进行，对 34B 模型每个节点的预测误差都可以控制在 0.5% 以内。模型预测能力更强，大大减少了进行对比实验需要的资源，也减少了训练误差对于计算资源的浪费。

数据处理管线和加大规模预测的训练能力建设，把以往的大模型训练碰运气的「炼丹」过程变得极度细致和科学化，不仅保证了目前发布 Yi-34B、Yi-6B 模型的高性能，也为未来更大规模模型的训练压缩了时间和成本，还有能力以领先于行业的速度将模型规模扩大到数倍。

最后，李开复也宣布，在完成 Yi-34B 预训练的同时，已经旋即启动下一个千亿参数模型的训练。

未来几个月，我们预计将看到更多的 Yi 后续大模型亮相。

以上是李开复正式宣布推出「全球最强」的开源大模型：处理40万汉字，中英文均位居榜首的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

gmail邮箱登陆入口在哪里

7319

Java教程

1625

CakePHP 教程

1349

Laravel 教程

1261

PHP教程

1209

显示更多

Related knowledge

DeepMind机器人打乒乓球，正手、反手溜到飞起，全胜人类初学者 Aug 09, 2024 pm 04:01 PM

但可能打不过公园里的老大爷？巴黎奥运会正在如火如荼地进行中，乒乓球项目备受关注。与此同时，机器人打乒乓球也取得了新突破。刚刚，DeepMind提出了第一个在竞技乒乓球比赛中达到人类业余选手水平的学习型机器人智能体。论文地址：https://arxiv.org/pdf/2408.03906DeepMind这个机器人打乒乓球什么水平呢？大概和人类业余选手不相上下：正手反手都会：对手采用多种打法，该机器人也能招架得住：接不同旋转的发球：不过，比赛激烈程度似乎不如公园老大爷对战。对机器人来说，乒乓球运动

Claude也变懒了！网友：学会给自己放假了 Sep 02, 2024 pm 01:56 PM

开学将至，该收心的不止有即将开启新学期的同学，可能还有AI大模型。前段时间，Reddit上挤满了吐槽Claude越来越懒的网友。「它的水平下降了很多，经常停顿，甚至输出也变得很短。在发布的第一周，它可以一次性翻译整整4页文稿，现在连半页都输出不了了！」https://www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/在一个名为「对Claude彻底失望了的帖子里」，满满地

首配机械爪！元萝卜亮相2024世界机器人大会，发布首个走进家庭的国际象棋机器人 Aug 21, 2024 pm 07:33 PM

8月21日，2024世界机器人大会在北京隆重召开。商汤科技旗下家用机器人品牌“元萝卜SenseRobot”家族全系产品集体亮相，并最新发布元萝卜AI下棋机器人——国际象棋专业版（以下简称“元萝卜国象机器人”），成为全球首个走进家庭的国际象棋机器人。作为元萝卜的第三款下棋机器人产品，全新的国象机器人在AI和工程机械方面进行了大量专项技术升级和创新，首次在家用机器人上实现了通过机械爪拾取立体棋子，并进行人机对弈、人人对弈、记谱复盘等功能，

世界机器人大会上，这家承载「未来养老希望」的国产机器人被包围了 Aug 22, 2024 pm 10:35 PM

正在北京举行的世界机器人大会上，人形机器人的展示成为了现场绝对的焦点，在星尘智能的展台上，由于AI机器人助理S1在一个展区上演扬琴、武术、书法三台大戏，能文能武，吸引了大量专业观众和媒体的驻足。在带弹性的琴弦上的优雅演奏，让S1展现出速度、力度、精度兼具的精细操作和绝对掌控。央视新闻对「书法」背后的模仿学习和智能控制进行了专题报道，公司创始人来杰解释到，丝滑动作的背后，是硬件侧追求最好力控和最仿人身体指标（速度、负载等），而是在AI侧则采集人的真实动作数据，让机器人遇强则强，快速学习进化。而敏捷

李飞飞团队提出ReKep，让机器人具备空间智能，还能整合GPT-4o Sep 03, 2024 pm 05:18 PM

视觉与机器人学习的深度融合。当两只机器手丝滑地互相合作叠衣服、倒茶、将鞋子打包时，加上最近老上头条的1X人形机器人NEO，你可能会产生一种感觉：我们似乎开始进入机器人时代了。事实上，这些丝滑动作正是先进机器人技术+精妙框架设计+多模态大模型的产物。我们知道，有用的机器人往往需要与环境进行复杂精妙的交互，而环境则可被表示成空间域和时间域上的约束。举个例子，如果要让机器人倒茶，那么机器人首先需要抓住茶壶手柄并使之保持直立，不泼洒出茶水，然后平稳移动，一直到让壶口与杯口对齐，之后以一定角度倾斜茶壶。这

ACL 2024奖项公布：华科大破译甲骨文最佳论文之一、GloVe时间检验奖 Aug 15, 2024 pm 04:37 PM

本届ACL大会，投稿者「收获满满」。为期六天的ACL2024正在泰国曼谷举办。ACL是计算语言学和自然语言处理领域的顶级国际会议，由国际计算语言学协会组织，每年举办一次。一直以来，ACL在NLP领域的学术影响力都位列第一，它也是CCF-A类推荐会议。今年的ACL大会已是第62届，接收了400余篇NLP领域的前沿工作。昨天下午，大会公布了最佳论文等奖项。此次，最佳论文奖7篇（两篇未公开）、最佳主题论文奖1篇、杰出论文奖35篇。大会还评出了资源论文奖（ResourceAward）3篇、社会影响力奖（

鸿蒙智行享界S9及全场景新品发布会，多款重磅新品齐发 Aug 08, 2024 am 07:02 AM

今天下午，鸿蒙智行正式迎来了新品牌与新车。 8月6日，华为举行鸿蒙智行享界S9及华为全场景新品发布会，带来了全景智慧旗舰轿车享界S9、问界新M7Pro和华为novaFlip、MatePadPro12.2英寸、全新MatePadAir、华为毕升激光打印机X1系列、FreeBuds6i、WATCHFIT3和智慧屏S5Pro等多款全场景智慧新品，从智慧出行、智慧办公到智能穿戴，华为全场景智慧生态持续构建，为消费者带来万物互联的智慧体验。鸿蒙智行：深度赋能，推动智能汽车产业升级华为联合中国汽车产业伙伴，为

国内首个UI大模型出炉！Motiff妙多大模型打造设计师最佳助手、优化UI设计工作流 Aug 19, 2024 pm 04:48 PM

人工智能的发展速度可能超乎你的想象。自GPT-4将多模态技术引入公众视野以来，多模态大模型进入快速发展阶段，逐渐从单纯的模型研发转向垂直领域的探索和应用，与各行各业深度融合。在界面交互领域，谷歌、苹果等国际科技巨头纷纷投入UI多模态大模型研发，这被视为手机AI革命的必经之路。在此背景下，国内首个UI大模型横空出世。8月17日，在IXDC2024国际体验设计大会上，AI时代设计工具Motiff妙多推出了其自主研发的UI多模态大模型——Motiff妙多大模型。这是全球首个由UI设计工具

See all articles

李开复正式宣布推出「全球最强」的开源大模型：处理40万汉字，中英文均位居榜首

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题