AI技术加速迭代:周鸿祎视角下的大模型战略
从今年开始,无论在哪个公开场合,360集团创始人周鸿祎都在谈论一个话题,那就是大型人工智能模型。他自称为“GPT的传教士”,对ChatGPT的取得的进步赞叹不已,并且坚信此次进展将会推动AI技术的迭代。
作为一个擅于表达的明星企业家,周鸿祎的演讲往往妙语连珠,所以他的“布道”也创造过很多热点话题,确实为AI大模型添了一把火。
尽管周鸿祎已成为一名意见领袖,但人们更加关心他领导的360公司如何应对这股人工智能革命浪潮。事实上,在360内部,周鸿祎也早已掀起一场全员变革,4月份,他发出内部信,要求360每一位员工、每个产品和业务要全面拥抱人工智能,适应人机协作,着手产品重塑。
如果时间线再往前推,2月份,360首次对类GPT技术的布局进行回应,称公司的人工智能研究院从2020年开始一直在包括类ChatGPT技术在内的AIGC技术上有持续性的投入,但截至目前仅作为内部业务自用的生产力工具使用,360会尽快推出类ChatGPT技术的demo版产品。
周鸿祎在2023年数字安全发展与高峰论坛的结尾阶段,向与会者演示了360版的ChatGPT类产品。当时,该产品尚未确定名称,周鸿祎戏谑道:“今天我们要把刚刚出生的宝宝抱出来见见大家”。
而时隔不到三个月,6月13日,360便正式发布了“360智脑4.0”,并宣布360智脑将全面接入“360全家桶”。
周鸿祎说,过去三个月就像过去人工智能历史上的三十年,各种创新层出不穷,360智脑的版本也做了很多次迭代。他认为,国内目前大型模型的发展速度非常迅猛,各家公司相互博弈,互相推进,因此与全球领先大型模型的差距不断缩小。
“原来我说差距有一年半、两年,我今天收回这句话,我认为国内同行们现在这种发展迭代的速度已经基本赶上或者接近了国际的先进水平”,周鸿祎称。
大模型战略浮现
现在来看,360在3月底发布的类ChatGPT产品,是360智脑1.0,当时的能力只跟搜索做了结合,还不支持多轮对话;4月底,360智脑就迭代到2.0版本,上线了多轮对话;5月中旬,360发布了多模态文生图应用“360鸿图”,360智脑也迭代到2.5版本;5月底,360发布视觉大模型,360智脑也更新到3.0版本。
最近推出的360智脑4.0最重要的改变是在多模态能力方面,与之前版本相比。目前,360已具备跨模态生成能力,包括文字处理能力、图像处理能力、语音处理能力以及视频处理能力,可实现文生文、文生图、文生表、图生图、图生文、视频理解等功能。
会上,360智脑“文生视频”多模态功能更是国内首发,任何文字脚本都可生成视频,不受专业技能和素材限制,展示了“无中生有”的能力。
周鸿祎说,现在中国自研大模型在很多方面,都已经赶上了GPT3.5,对GPT4.0的追赶速度也超乎想象,所以接下来弯道超车的关键,就在于发展多模态的能力。
“一个完整的AI大模型要有四大能力,包括文字处理、图像处理、语音处理和视频处理”,周鸿祎表示,“未来大模型的竞争将是多模态能力的竞争,只有有了多模态的能力,才预示着大模型真正走上一个新的台阶”。
"360 Group's large-scale strategy has officially emerged with the release of 360 Brain 4.0, which can be summarised as 'two wings flying together and four paths running concurrently'."。其中,“两翼齐飞”是指技术和场景,“四路并发”则代表四个应用方向,分别是消费者、中小企业、政府及大型企业、行业。
据周鸿祎介绍,在技术方面,360因为搜索业务的需要,早在2015年就成立了AI研究院,并对自然语言理解等大模型核心技术进行积累。另外因为物联网业务,360也从2018年开始探索多模态。
“2018年谷歌发布了Bert算法,当时360就进行了跟踪和使用,包括后来的T5和GPT,360也进行了研究”,周鸿祎表示,“作为搜索引擎厂商,我们发展大模型不是等到这次GPT热了才跟进,实际上早在2018年就开始了,这也是为什么我们能够这么快就发布相关产品”。
目前,360在大模型技术方面已经具备生成与创作、多轮对话、代码能力、文本分类、文本改写、阅读理解、逻辑与推理、知识问答、多模态、翻译等十大核心能力,维度涵盖数百项细分功能,可覆盖大模型全部应用场景,并在多个第三方评测中位居国产大模型第一梯队。
今年5月,中文通用大模型基准(SuperCLUE)的一项评测结果中,360智脑多项能力位列国产大模型第一;6月12日,360智脑又成为国内首个通过中国信通院“可信AIGC大语言模型基础能力”评估的大模型产品。
加速应用落地
对于大模型未来的发展,周鸿祎提出,光具备基础能力,未必能带来工业和产品的革命,关键还是在于如何把大模型通用的AI能力跟更多场景进行结合。大模型的价值在于把AI能力通用化、产业化和垂直化,要和不同行业、不同企业的具体业务需求深度融合。
“我觉得这样的产业机会才刚刚开始,未来至少有10年的红利期,包括所有的App、网站,甚至所有的行业都值得用通用人工智能重塑一遍”,周鸿祎说道。
在两个月前,周鸿祎就直言“GPT和百行千业的深度结合将直接改变行业竞争格局,搭不上这班车的企业就会被淘汰”,所以他在360内部也要求所有的产品经理和工程师,要脑洞大开地去设想,人工智能时代应该如何重塑自己的产品。
在发布会上,周鸿祎也正式宣布,“360智脑4.0”将接入浏览器、搜索、安全卫士等360全端产品,实现全面智能化重塑。“微软最近推出一个操作系统CoPilot,相当于Windows的副驾驶,把人工智能的能力集成到每一台电脑上,国内可能360是最接近微软这个能力的厂商”。
除此之外,360AI数字人也在发布会上正式亮相。根据周鸿祎的说法,360在大型AI模型方面的主要创新是数字人,数字人将成为未来人工智能大型模型的最重要应用入口。360将依托360智脑大模型能力,重新定义“数字人”。区别于传统数字人只能按既定脚本输出内容,360AI数字人的特点在于有记忆、有人设和性格,能够复刻思维方式和人生经历。
根据了解,360AI数字人目前分为两种类型:数字名人和数字员工,共有200多个角色可供使用。数字名人包括历史人物、偶像明星、文学形象等,让用户在与数字人的开放对话中实现与偶像的近距离接触;数字员工则可成为企业员⼯的知识助⼿和办公助手,提升企业运营效能。
此外,360AI数字人支持定制,每个人都能通过上传私人知识库,低成本生成自己的专属数字人,如数字分身、数字助理、数字偶像等。
周鸿祎表示,360AI数字人未来的发展方向是生成声音、视频并拥有长期记忆,甚至拥有目标分解和规划的能力,并且拥有“手和脚”,具备执行力,更好为人类提供服务。“AI的进化要以人为本,大模型应该成为人类的朋友和助手。”
在过去的六个月里,许多企业家因为AI大模型的发展感到兴奋,并在新的创业领域投入努力。已过天命之年的周鸿祎也是其中一员,他反复强调“我们正在亲历科技和商业史上的革命性时刻”,并乐此不疲的研究大模型。
5月中旬,360智脑经过一次迭代后,周鸿祎深夜11点多在某个微信群中在线发放了上百个测试码,并津津有味地与人探讨该如何提问,这在以往并不常见,但在超级人工智能时代,一切都在变得可能。
以上是AI技术加速迭代:周鸿祎视角下的大模型战略的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

5月30日,腾讯宣布旗下混元大模型全面升级,基于混元大模型的App“腾讯元宝”正式上线,苹果及安卓应用商店均可下载。相比此前测试阶段的混元小程序版本,面向工作效率场景,腾讯元宝提供了AI搜索、AI总结、AI写作等核心能力;面向日常生活场景,元宝的玩法也更加丰富,提供了多个特色AI应用,并新增了创建个人智能体等玩法。“腾讯做大模型不争一时之先。”腾讯云副总裁、腾讯混元大模型负责人刘煜宏表示:“过去的一年,我们持续推进腾讯混元大模型的能力爬坡,在丰富、海量的业务场景中打磨技术,同时洞察用户的真实需求

火山引擎总裁谭待企业要做好大模型落地,面临模型效果、推理成本、落地难度的三大关键挑战:既要有好的基础大模型做支撑,解决复杂难题,也要有低成本的推理服务让大模型被广泛应用,还要更多工具、平台和应用帮助企业做好场景落地。——谭待火山引擎总裁01.豆包大模型首次亮相大使用量打磨好模型模型效果是AI落地最关键的挑战。谭待指出,只有大的使用量,才能打磨出好模型。目前,豆包大模型日均处理1,200亿tokens文本、生成3,000万张图片。为助力企业做好大模型场景落地,字节跳动自主研发的豆包大模型将通过火山

一、TensorRT-LLM的产品定位TensorRT-LLM是NVIDIA为大型语言模型(LLM)开发的可扩展推理方案。它基于TensorRT深度学习编译框架构建、编译和执行计算图,并借鉴了FastTransformer中高效的Kernels实现。此外,它还利用NCCL实现设备间的通信。开发者可以根据技术发展和需求差异,定制算子以满足特定需求,例如基于cutlass开发定制的GEMM。TensorRT-LLM是NVIDIA官方推理方案,致力于提供高性能并不断完善其实用性。TensorRT-LL

4月4日消息,日前,国家网信办公布已备案大模型清单,中国移动“九天自然语言交互大模型”名列其中,标志着中国移动九天AI大模型可正式对外提供生成式人工智能服务。中国移动表示,这是同时通过国家“生成式人工智能服务备案”和“境内深度合成服务算法备案”双备案的首个央企研发的大模型。据介绍,九天自然语言交互大模型具有行业能力增强、安全可信、支持全栈国产化等特点,已形成90亿、139亿、570亿、千亿等多种参数量版本,可灵活部署于云、边、端不同场

一、背景简介首先来介绍一下云问科技的发展历程。云问科技公...2023年,正是大模型盛行的时期,很多企业认为已经大模型之后图谱的重要性大大降低了,之前研究的预置的信息化系统也都不重要了。不过随着RAG的推广、数据治理的盛行,我们发现更高效的数据治理和高质量的数据是提升私有化大模型效果的重要前提,因此越来越多的企业开始重视知识建设的相关内容。这也推动了知识的构建和加工开始向更高水平发展,其中有很多技巧和方法可以挖掘。可见一个新技术的出现,并不是将所有的旧技术打败,也有可能将新技术和旧技术相互融合后

如果试题太简单,学霸和学渣都能考90分,拉不开差距……随着Claude3、Llama3甚至之后GPT-5等更强模型发布,业界急需一款更难、更有区分度的基准测试。大模型竞技场背后组织LMSYS推出下一代基准测试Arena-Hard,引起广泛关注。Llama3的两个指令微调版本实力到底如何,也有了最新参考。与之前大家分数都相近的MTBench相比,Arena-Hard区分度从22.6%提升到87.4%,孰强孰弱一目了然。Arena-Hard利用竞技场实时人类数据构建,与人类偏好一致率也高达89.1%

6月13日消息,据字节旗下“火山引擎”公众号介绍,小米旗下人工智能助手“小爱同学”与火山引擎达成合作,双方基于豆包大模型实现更智能的AI交互体验。据悉,字节跳动打造的豆包大模型,每日能够高效处理数量多达1200亿个的文本tokens、生成3000万张内容。小米借助豆包大模型提升自身模型的学习与推理能力,打造出全新的“小爱同学”,不仅更加精准地把握用户需求,还以更快的响应速度和更全面的内容服务。例如,当用户询问复杂的科学概念时,&ldq

大家好,我卡颂。许多程序员朋友都希望参与自己的AI产品开发。我们可以根据"流程自动化程度"和"AI应用程度"将产品的形态划分为四个象限。其中:流程自动化程度衡量「产品的服务流程有多少需要人工介入」AI应用程度衡量「AI在产品中应用的比重」首先,限制AI的能力,以处理一张AI图片应用,用户在应用内通过与UI交互就能完成完整的服务流程,从而自动化程度高。同时,“AI图片处理”重度依赖AI的能力,所以AI应用程度高。第二象限,是常规的应用开发领域,比如开发个知识管理应用、时间管理应用、流程自动化程度高
