澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

王林
发布: 2024-03-21 12:21:40
转载
848 人浏览过

专注、极致、口碑、快、成本。

周明是澜舟科技创始人兼CEO,提出了“大模型落地九字法则”,这是在雷军的互联网“七字诀”基础上,加入了“成本”一词而形成的。

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

他将 2024 年称为大模型落地元年,但同时坚定地表示,这并不意味着遍地是黄金。

而大模型的具体落地姿态,周明用自己带领的大模型创业团队澜舟科技身先士卒地做了个表率——利用澜舟 " 一横 N 纵 " 体系,以孟子大模型为基础,面向场景,发布产品。

简单来说,就是抓技术和应用的双轮驱动,在积极研究和掌握前沿技术的同时,致力于确保这些技术的有效应用。

3 月 18 日的澜舟大模型技术和产品发布会现场,澜舟科技还与零一万物进行了战略合作签约。

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

现场,创新工场董事长、零一万物 CEO 李开复分享,目前世界上最好的大模型智能已经达到人类平均智力水平的 3 倍,也就是说,100 道题普通人只能答对 33 道,而最好的 AI 大模型可以答对 99 道以上。

他展望了 AI 2.0 时代未来的四大趋势:

最革命性的 AI 2.0 应用应该是 AI-First / AI-Native:最终脱颖而出的应用,属于那些敢于全力投入新技术的先驱者。大语言模型的引入为 AI-First 应用带来了巨大的推动力。

大模型始于文本,未来将拓展至 " 全模态 ":跨模态生成技术是实现认知和决策智能的转折点。现实世界的信息是文本、音频、视觉、传感器以及人类各种触觉的综合体系,要更为精准地模拟现实世界,就需要将各种模态能力打通,例如文本 - 图像、文本 - 视频等跨模态甚至全模态的综合能力。

AI 2.0 将超越对话,从聊天工具到智能生产力工具:用户体验以及未来交互界面和商业模式都会发生大的变革。

AI 2.0 将走向实体,大幅提振社会生产力:具身智能可以让机器人制造机器人,进一步实现 AI 2.0+ 生产线智能规划。

专注研发 10B-100B 参数大模型

澜舟科技成立于 2021 年 6 月,是国内最早一批下场,进行大模型创业的团队。

去年 3 月,澜舟发布了孟子 GPT V1(MChat);今年 1 月,孟子大模型 GPT V2(含孟子大模型 - 标准、孟子大模型 - 轻量、孟子大模型 - 金融、孟子大模型 - 编码)对公众开放。

近期,澜舟团队完成了Mengzi3-13B的大模型训练。

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

多说一句,孟子大模型训练背后有个大功臣,即总规模 3T tokens 的 Mengzi-3 数据集,包含了网页、代码、书籍、论文等高质量数据来源。

据介绍,本月底(3 月 30 日),Mengzi3-13B 的模型将在 GitHub、HuggingFace、魔搭和始智 AI 社区开源。

为什么开源的孟子大模型,是 13B 版本的?周明正面回答了这个问题。

首先,澜舟明确以服务 ToB 场景为主,ToC 为辅。

实践发现,ToB 场景使用频率最高的大模型参数量多为 7B、13B、40B、100B,整体集中在 10B-100B 之间。

其次,在这个区间范围内,从 ROI 角度来讲,既满足场景需求,又最具性价比。

所以很长一段时间内,澜舟的目标都是做好 10B-100B 参数规模范围内的行业大模型。这就不能理解为什么开源版本选择 13B。

周明解释道,他自己本身其实也是 Scaling law 的信仰者,但创业不同于科研。

" 第一,这个大小的大模型已经可以解决 80% 的问题;第二,对团队来说也比较稳定,不会因为不断扩大的模型规模竞赛而感到焦躁不安。" 周明补充说,这样冷静的思考,可以保证良好的成本控制,避免无谓的 GPU 算力、数据、人力投入竞赛。

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

" 一横 N 纵 " 体系

发布会上,澜舟公布了自己的一横 N 纵体系。

" 一横 " 是模型层,是孟子大模型技术基础上研发的各个模型;

"N 纵 " 则是基于孟子大模型的面向 ToB 应用最重要的技术和产品。

据了解,澜舟目前重点投入到了金融行业,辅助编程等领域,旨在通过更加全面、专业、优质的领域数据,打造更加贴近行业场景的垂直大模型。

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

以孟子 GPT 通用大模型的 " 一横 " 为基础,澜舟科技合伙人、首席产品官李京梅,介绍了澜舟的应用能力型产品,包括:

AI 文档理解:涵盖专业的 PDF 文档解析能力和信息抽取能力,为 RAG 方案中的文档理解提供了更优的基础能力;

AI 文档问答:根据企业需要,提供私有化企业智能知识库构建的解决方案能力;

AI 文档辅助写作:支持用户上传多个文档作为参考资料,支持自定义多级题目和写作提纲,由大模型赋能自动化按要求生成完整的文章初稿;

机器翻译平台:专注以中文为中心的世界主要语种之间互译和 20 几个领域的专业翻译;

澜舟智会:专注会议内容的智能分析和问答的产品, 是基于大模型打造的大模型原生的智能会议助手;

澜舟 AI 搜索:大语言模型时代的搜索引擎。

 澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣

过去一年,大模型领域日新月异。

OpenAI 在干什么我们就去干什么,短期可以,长期不可取,一定要有自己的创新思路。

如何扬长避短,走出自己的独特的创新之路,周明表达了自己的看法。

最关键的第一步,就是企业要有明确定位。澜舟科技的定位就和国内其它大模型创业公司有明显差异。

他举例,澜舟的定位就是作 " 大模型技术 + 企业场景应用 " 的综合公司," 我们希望能做到站在技术角度最懂应用,站在应用角度最懂技术,同时又希望把技术和应用形成一种生态连接在一起,让两边可以快速迭代。"

同时,依然需要聚焦和抓紧落地——通过落地,创造价值,拉动创新。

而且需要注意,创新和落地是相辅相成的。

不要一味的创新或者一味的落地,要把这两者联系在一起,让它快速的迭代。

最后周明还语重心长地提醒:

今年是大模型落地元年,就遍地是黄金是吗?不是的,我可以负责任地说,很多地方我们都没有开拓出来。

比如大模型如何解决落地的最后一公里?大模型的商业模式是什么?如何加强交付能力?如何提高产品的商业化?

大模型落地的一切,其实才刚刚开始。

— 联系作者 —

以上是澜舟坚持四两拨千斤:ToB 场景落地,10B 参数大模型足矣的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:myzaker.com
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!