解读 ChatGPT 背后的研究力量:90 后成主力军,大厂不再是顶尖 AI 人才第一选择
ChatGPT 的火爆,不仅为 OpenAI 带来资本的关注、用户的青睐,在关于“OpenAI 为何能做出 ChatGPT”的讨论中,其人员优势也成为外界瞩目的焦点。
近日,智谱研究联合 AMiner 发布了一份 OpenAI 背后研究团队的统计报告。据报告显示,本次在 ChatGPT 项目中做出贡献的人员共87人,其中包括了“年纪很轻”、“背景豪华”、“聚焦技术”、“积累深厚”、“崇尚创业”和“华人抢眼”等显著特征。
报告链接:https://mp.weixin.qq.com/s/Y_LjjsuoEEmhIg5WO_iQhA
在这样一个不足百人团队中,诞生了现象级的大型语言模型 ChatGPT,这对谷歌、微软、百度、阿里等大厂而言都是不小的压力,纷纷紧随其后,发布、或预发布类 ChatGPT 产品。
作为一家非盈利的人工智能研究机构,一直以来,OpenAI 都被诸多有志于发展 AI 事业的青年人才视为技术天堂。在这里,他们可以直接参与最前沿、最具创造力的 AI 项目, 调用最核心的科研资源,心无旁骛地投身到技术创新中。
而近年来,边缘化、举棋不定使国内大厂中的 AI 研究院和科研人才面临着生存难题,但相信在这次 ChatGPT 的冲击下,AI 人才重新回归大众视野,也将迎来新一轮的争夺和洗牌。
1
技术人员占比近九成
90后是主力军
从 ChatGPT 团队职位分工(图1)来看, 在参与此次项目的87人中,研发人员的数量就达到了77位,占比88%,其中包括了公司联合创始人 Wojciech Zaremba,他在此前被评选为 2023 年度 AI 2000 机器人领域最具影响力学者。
产品人员共4位、占比5%,此外还有6位参与者的职位信息无法获取。
图 1:ChatGPT 团队职位分工
在成员年龄分布(图2)方面,90后是团队的主力军,其中,年龄区间在20-29岁的共28位,占比达到34%;30-39岁的成员数量最多,共50人,占比高达61%;此外,有3人年龄段在40-49岁区间,60岁以上仅1名。
经统计,这支研究团队的平均年龄为32岁。
图 2:ChatGPT 团队年龄分布
“年纪很强”和“聚焦技术”是 ChatGPT 团队成员的两大显著特征。
虽然平均年龄仅在32岁,但团队人员高度聚焦技术研发,基于他们对 AI 创新和研发极大的兴趣和全身心投入,创造出这个引爆全球新一轮技术的现象级模型。由此可见,被认为研发经验不足的年轻人,完全有可能在前沿科技领域取得重大突破。
当前,国内并不缺乏如 OpenAI 一样的年轻优秀人才。
ChatGPT 问世之后,IDEA 研究院讲席科学家张家兴在去年底就迅速讲团队的大模型研发转向了 ChatGPT 的对话任务路线。
据其透露,其团队中的研究主力也皆为90后优秀的年轻人才。当前,他们研发的类 ChatGPT 模型效果与 ChatGPT 相当,且仅有50亿参数,文本生成速度也很快,目前已在内测中,近期将公测。
2
名校学历、华人占9位
大厂不再是顶尖人才第一选择
ChatGPT 团队成员的学历在本、硕、博的人数相对均衡,其中,27人具有本科学历,25人为硕士研究生学历,28人拥有博士研究生学历,占比分别为33%、30%、37%。
他们当中来自斯坦福大学的校友人数最多,共有14位,其次是加州大学伯克利分校10位,麻省理工排名第三,有7人。
图 3:ChatGPT 团队成员毕业高校人数Top10
华人学者是团队中一支重要的科技创新力量,共9人,占比近10%。
其中,有5人曾毕业于中国高校,3人本科毕业于清华大学,分别是翁家翌、赵盛佳、袁启明,当前他们在团队中担任研发工程师的岗位;各有1人本科毕业于华中科技大学、北京大学/香港大学,分别是江旭和翁丽莲。
他们都是在国内顶尖院校毕业后赴美深造,获得硕士或博士学位。
图 4:ChatGPT 团队中的华人成员
从人员流动中可看到,大厂也不再是顶尖人才第一选择,如 OpenAI 这种更纯粹的研究机构反而更受他们青睐。
团队成员当中,共有5位被评为 2023 年度 AI 2000 全球人工智能学者。他们分别是:
1.OpenAI 联合创始人 Wojciech Zaremba(入选领域及名次:机器人,第10名)
2.ChatGPT 研究员 Lukasz Kaiser(入选领域及名次:机器学习,第10名)
3.OpenAI 联合创始人、ChatGPT 研究科学家 John Schulman(入选领域及名次:机器学习,第41名)
4.ChatGPT 研发工程师 Tomer Kaftan(入选领域及名次:数据库,第52名)
5.ChatGPT 研究科学家 Barret Zoph(入选领域及名次:机器学习,第95名)
来自外部公司、高校应届毕业生、科研机构和高校教职人员的占比分别是81%、13%、4%和3%,其中大多来自于谷歌、微软、Meta、英特尔、英伟达、苹果等顶尖或知名的科技公司,共10人就是从谷歌跳槽加入的,1人曾在百度任职过。
图 5:ChatGPT 团队成员流动情况
统计还发现,与 ChatGPT 有关的前七项技术项目研发中,ChatGPT 团队有较多人都曾参与到其研发中。
参与人数最多的是 CodeX 项目,共22人参与,占团队人数的25%;其次是 webGPT 和 instructGPT,共有9人参与;GPT3 共有6人参与过,排名第三;排名第四的是 RLHF,有3人参与过。
图 6:ChatGPT 团队参与此前七大技术研发人数
可以说,ChatGPT 是 OpenAI 在大型语言模型领域多年技术积累、顶尖人才领导和优秀 AI 技术人员聚集的结果,为 ChatGPT 的成功研发打下了坚实基础。
3
AI 人才迎来争夺战
事实上,过去几年里,AI 研究院和 AI 人才在大厂内部长期面临着边缘化、战略摇摆的困境,正如上述提到的谷歌,就已有不少人才流向 OpenAI 这样纯粹的科研圣地。
大厂内部的 AI 人员在企业的组织架构模式内,往往难以发挥其本该有的能力和成果。
但与传统的科技巨头不同,如果 OpenAI 等此类以“发展人工智能”为己任的公司中,AI 的研发和创新才是它们的使命所在,即近距离地参与到最前沿的 AI 项目中,调用最核心的资源做研发,背后更要能承受住长久不出成果的责任。其中 GPT 模型仅首发到完成训练,就长达三年时间,需要团队的一整套资金、技术和人才等体系化保障。
ChatGPT 的出现,将 AI 人才重新拉回了大众视野,重申纯粹科学研究的重要性,势必将掀起一轮新的人才争夺战。同时,也会提高大厂对大模型、计算资源等基础设施的重视,加快底层技术能力的追赶和补齐。
正如前搜狗 CEO 王小川在微博中所说,“OpenAI的成功,首先是技术理想主义的胜利。”ChatGPT 的成功,必然离不开产、学、研合力,其背后是团队成员对人工智能技术的兴趣和予以坚持的信仰。国内并不乏顶尖的科研力量,将目光投注前沿技术创新,稳扎稳打,对促进中国 AI 创新发展具有重要意义。
以上是解读 ChatGPT 背后的研究力量:90 后成主力军,大厂不再是顶尖 AI 人才第一选择的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

大规模语言模型(LLMs)在许多重要任务中展现出了引人注目的能力,包括自然语言理解、语言生成和复杂推理,并对社会产生了深远的影响。然而,这些出色的能力却需要大量的训练资源(如左图所示)和较长的推理时间(如右图所示)。因此,研究人员需要开发有效的技术手段来解决它们的效率问题。此外,从图的右侧还可以看出,一些高效的LLMs(LanguageModels)如Mistral-7B,已经成功应用于LLMs的设计和部署中。这些高效的LLMs在保持与LLaMA1-33B相近的准确性的同时,能够大大减少推理内存

StableDiffusion3的论文终于来了!这个模型于两周前发布,采用了与Sora相同的DiT(DiffusionTransformer)架构,一经发布就引起了不小的轰动。与之前版本相比,StableDiffusion3生成的图质量有了显着提升,现在支持多主题提示,并且文字书写效果也得到了改善,不再出现乱码情况。 StabilityAI指出,StableDiffusion3是一个系列模型,其参数量从800M到8B不等。这一参数范围意味着该模型可以在许多便携设备上直接运行,从而显着降低了使用AI

轨迹预测在自动驾驶中承担着重要的角色,自动驾驶轨迹预测是指通过分析车辆行驶过程中的各种数据,预测车辆未来的行驶轨迹。作为自动驾驶的核心模块,轨迹预测的质量对于下游的规划控制至关重要。轨迹预测任务技术栈丰富,需要熟悉自动驾驶动/静态感知、高精地图、车道线、神经网络架构(CNN&GNN&Transformer)技能等,入门难度很大!很多粉丝期望能够尽快上手轨迹预测,少踩坑,今天就为大家盘点下轨迹预测常见的一些问题和入门学习方法!入门相关知识1.预习的论文有没有切入顺序?A:先看survey,p

这篇论文探讨了在自动驾驶中,从不同视角(如透视图和鸟瞰图)准确检测物体的问题,特别是如何有效地从透视图(PV)到鸟瞰图(BEV)空间转换特征,这一转换是通过视觉转换(VT)模块实施的。现有的方法大致分为两种策略:2D到3D和3D到2D转换。2D到3D的方法通过预测深度概率来提升密集的2D特征,但深度预测的固有不确定性,尤其是在远处区域,可能会引入不准确性。而3D到2D的方法通常使用3D查询来采样2D特征,并通过Transformer学习3D和2D特征之间对应关系的注意力权重,这增加了计算和部署的

笔者的一些个人思考在自动驾驶领域,随着BEV-based子任务/端到端方案的发展,高质量的多视图训练数据和相应的仿真场景构建愈发重要。针对当下任务的痛点,“高质量”可以解耦成三个方面:不同维度上的长尾场景:如障碍物数据中近距离的车辆以及切车过程中精准的朝向角,以及车道线数据中不同曲率的弯道或较难采集的匝道/汇入/合流等场景。这些往往靠大量的数据采集和复杂的数据挖掘策略,成本高昂。3D真值-图像的高度一致:当下的BEV数据获取往往受到传感器安装/标定,高精地图以及重建算法本身的误差影响。这导致了我

请留意,这个方块人正在紧锁眉头,思考着面前几位“不速之客”的身份。原来她陷入了危险境地,意识到这一点后,她迅速展开脑力搜索,寻找解决问题的策略。最终,她决定先逃离现场,然后尽快寻求帮助,并立即采取行动。与此同时,对面的人也在进行着与她相同的思考……在《我的世界》中出现了这样一个场景,所有的角色都由人工智能控制。他们每个人都有着独特的身份设定,比如之前提到的女孩就是一个年仅17岁但聪明勇敢的快递员。他们拥有记忆和思考能力,在这个以《我的世界》为背景的小镇中像人类一样生活。驱动他们的,是一款全新的、

图像到视频生成(I2V)任务是计算机视觉领域的一项挑战,旨在将静态图像转化为动态视频。这个任务的难点在于从单张图像中提取并生成时间维度的动态信息,同时保持图像内容的真实性和视觉上的连贯性。现有的I2V方法通常需要复杂的模型架构和大量的训练数据来实现这一目标。近期,快手主导的一项新研究成果《I2V-Adapter:AGeneralImage-to-VideoAdapterforVideoDiffusionModels》发布。该研究引入了一种创新的图像到视频转换方法,提出了一种轻量级适配器模块,即I

23年9月国防科大、京东和北理工的论文“DeepModelFusion:ASurvey”。深度模型融合/合并是一种新兴技术,它将多个深度学习模型的参数或预测合并为一个模型。它结合了不同模型的能力来弥补单个模型的偏差和错误,以获得更好的性能。而大规模深度学习模型(例如LLM和基础模型)上的深度模型融合面临着一些挑战,包括高计算成本、高维参数空间、不同异构模型之间的干扰等。本文将现有的深度模型融合方法分为四类:(1)“模式连接”,通过一条损失减少的路径将权重空间中的解连接起来,以获得更好的模型融合初
