OpenAI联合创始人Karpathy发布文章:以自动驾驶为例解释AGI!已删除的原文,请立即收藏
对于「通用人工智能」,OpenAI科学家Karpathy下场做出了解释。
前几天,Karpathy在个人blog发表了一篇文章「将自动驾驶作为AGI的一个案例来研究」。
不知是何原因,他却删除了这篇文章,幸而,还有网络备份。
众所周知,Karpathy不仅是OpenAI 的创始成员之一,还曾是特斯拉前AI高级总监、自动驾驶Autopilot负责人。
他将自动驾驶作为案例,研究AGI,这篇文章的观点确实值得一看。
自动驾驶
LLM的爆发引发了众多关于AGI降临的时间,甚至它可能是什么样子的讨论。
有的人对AGI未来充满希望,持有乐观的态度。而有的人却充满恐惧和悲观的情绪。
不幸的是,其中也有很多讨论过于抽象,导致人们的观点互不接轨。
因此,我总是在寻找具体的类比和历史先例,用更具体的术语来探讨这个主题。
特别是,当我被问及「你认为AGI会是什么样子」时,我个人喜欢用自动驾驶举例。在这篇文章中,我想解释一下原因。让我们从AGI的一个常见定义开始:
AGI:一个在大多数有经济价值的工作中超越人类能力的自主系统。
请注意,在这个AGI定义中有两个具体要求。
首先,它是一个完全自主的系统,即自己运作,很少或根本没有人类监督。
其次,它在大多数有经济价值的工作上都是自主运作的。关于这部分数据,我个人喜欢参考美国劳工统计局的职业指数。
一个同时具有这两种性质的系统,我们将其称之为AGI。
我想在这篇文章中建议的是,最近我们自动驾驶能力的发展是一个非常好的早期案例,研究了日益自动化的社会动态,可以拓展到对AGI的总体样貌和感受的研究。
我这样认为的原因是,这个领域具有几个特征。可以简单地说「it is a big deal」:自动驾驶对社会来说非常容易理解,更常见。
它在经济规模上占据了很大一部分,并且雇佣了大量的人类劳动力。驾驶是一个足够复杂的问题,但我们已经实现自动化,并引来社会的高度关注。
当然,也还有其他的行业实现了大规模的自动化,但要么是我个人对它们不太熟悉,要么它们在上述一些属性方面有所欠缺。
L2级自动化
驾驶的自动化被认为是AI领域中一个极具挑战的问题,并非一蹴而就。
它是通过逐步将驾驶任务自动化的过程而成的,这个过程中涉及了许多阶段性的「工具型AI」。
在车辆自动化方面,目前许多汽车已经配备了L2级驾驶辅助系统。即一个能与人类司机协作,共同完成从起点到终点旅程的AI。
虽然它还不能完全自主驾驶,但L2已经能处理许多驾驶中的基础任务。
有时,它甚至能自动完成整个操作流程,比如自动泊车。
在这一过程中,人类主要扮演监督角色,甚至可以随时接手,直接驾驶或下达高级指令(如换道请求)。
在某些方面(比如保持车道居中和快速决策),AI的表现甚至超过了人类,但在一些罕见的情况下还是会有所不足。
这与我们在其他行业看到的许多AI工具非常相似,特别是随LLM最近的技术突破。
例如,作为程序员,当我用GitHub Copilot来自动补全一段代码,或使用GPT-4编写更复杂的函数时,我实际上是将基础任务交给了自动化系统.
但同样,如有需要,我也可以随时介入进行调整。
换句话说,Copilot和GPT-4就像是在编程领域的「二级」自动化工具。
在整个行业中,有许多类似的「二级」自动化解决方案,但并不是所有的都基于大模型,从TurboTax,到亚马逊仓库中机器人,再到翻译、写作、艺术、法律、营销等领域的各种「工具型 AI」。
全自动驾驶
随着时间的推移,一些系统的可靠性达到了新高度,变得就像今天的Waymo那样。
它们正逐步实现「全自动驾驶」。
如今,在旧金山,你只需打开应用,就能叫到一辆Waymo无人驾驶车,它将会来接你,并把你安全送达目的地。
这实在是令人惊叹。你无需懂得驾驶,也无需关注路况,只需舒服地靠后坐,并小憩片刻,系统便会将你从起点带到终点。
与我交谈过的许多人一样,我个人更倾向于选择Waymo而非Uber,我几乎只使用它来进行市内交通。
你会拥有更稳定、可预测的旅程体验,而且驾驶过程平稳,可以听音乐,不用顾及司机在听你说话时在想什么。
「复合经济」
虽然自动驾驶技术已经走入现实,但仍有许多人选择使用Uber。原因何在?
首先,很多人根本不知道他们可以选择Waymo作为出行工具。即便知道,许多人对自动化系统仍缺乏足够的信任,更倾向于由人类司机驾驶。
不过,即使有些人接受自动驾驶,或许他们还是更倾向于人类司机,比如享受与司机的交谈,以及与他人的互动。
不仅仅是个人偏好,从现在应用中不断增长的等待时间可以看出,Waymo面临着供不应求的问题。市场上的车辆数量远远无法满足需求。
这部分原因可能是,Waymo在管理和监测风险和舆论方面非常谨慎。
另一方面,据我所知,Waymo受到监管机构的限制,只能在街道上部署一定数量的车辆。另一个限制因素是,Waymo不能一夜之间就完全取代Uber。
他们需要建立基础设施,生产汽车,扩大运营规模。
我个人认为,其他经济领域的自动化也将面临同样的情况——有些人/公司会立即采用它们,但许多人(1)不了解这些技术,(2)即便了解,也不会信任它们,(3)即使信任,他们仍然更愿意与人类合作。
但除此之外,需求超过供应,AGI也将因为同样的原因受到同样的限制,包括开发商的自我约束、监管限制以及资源短缺,比如需要建立更多的GPU数据中心。
技术全球化
正如我已经在资源限制中暗示的那样,这种技术的全球化部署成本非常高,还需要耗费大量人力,推广速度也慢。
今天,Waymo只能在旧金山和凤凰城驾驶,但这种技术本身是通用的,还可以扩展,因此该公司可能很快就会推广到洛杉矶、奥斯汀等地。
自动驾驶汽车还可能会受到其他环境因素的限制,比如在大雪中驾驶。在一些罕见的情况下,它甚至可能需要操作员的救援。
此外,技术能力的扩展还需要很多资源成本,并非是免费的。
比如,Waymo必须投入资源后才能进入另一个城市,比如绘制街道地图、整体感知路径规划、控制算法以适应某些特殊情况,或当地的法规。
就像我们的工作比喻所示,许多工作可能只在某些特定环境下才能实现自动化,若是扩大范围还需要大量的工作。
无论哪种情况,自动驾驶技术本身都是通用的和可扩展的,其应用前景将随着时间的推移而逐步拓宽。
社会反应:很快成为「过眼云烟」
关于自动驾驶技术逐渐融入社会的过程,我觉得特别有趣的一点是——
就在几年前,人们还在热烈讨论并对其充满了疑虑和担忧,争论着它是否能够成功运作,甚至是否可行,这成了一个广泛关注的议题。而现在,自动驾驶不再是未来的梦想,它真的出现了。
它不仅仅是一个研究原型,而是成为了一种可以用金钱购买的完全自动化交通方式。
在目前的应用范围内,自动驾驶技术已经实现了完全的自主性。
然而,总体来看,这似乎并没有引起太多人的关注。我交流过的大多数人(包括科技领域的!)甚至都不知道这一进展。
当你乘坐Waymo在旧金山的街道上行驶时,你会发现很多人对它投以好奇的目光。他们首先会感到惊讶,然后好奇地凝视。
之后,他们就会继续自己的生活。
当自动驾驶技术在其他行业也实现完全自主时,世界可能并不会因此而动荡不安。
大多数人可能一开始,甚至都没意识到这一变化。当他们注意到时,可能只是好奇地看一眼,然后不以为意,这种反应从否认到接受都有。
有些人可能会因此感到不安,甚至采取一些抗议行动,比如向Waymo汽车前放置交通锥这样的举动。
当然,到目前为止,我们距离见证这一现象完全上演还很遥远。但当它发生时,我期望它在很大程度上具有预测性。
经济影响
当我们讨论就业时,不可否认,Waymo明显地取代了驾驶员的岗位。
但同时,它也催生了许多以前不存在的工作岗位,这些岗位相对不那么显眼——比如为神经网络收集训练数据的标注人员、远程协助遇到问题汽车的客服人员、负责建造和维护车队的工作人员等等。
首先诞生的是一个包含各种传感器和相关基础设施的全新行业,旨在构建这些装备精密的高科技汽车。
正如人们对工作的普遍看法一样,许多岗位都将发生改变,一些岗位会因此消失,但也会出现很多新的岗位。
这其实是工作形态的一种转变,而非简单的岗位减少,尽管岗位减少是最直观的变化。
虽然很难说总体就业人数不会随着时间推移而减少,但这种变化的速度比人们简单预想的要慢得多。
竞争环境
最后,我想谈谈自动驾驶领域的竞争环境。
几年前,自动驾驶汽车公司如雨后春笋般涌现。但今天,随着人们逐渐意识到这项技术的复杂性(我个人认为,基于当前的人工智能和计算技术,实现自动化仍然十分困难),这个领域已经经历了大规模的整合。
其中,Waymo成为了首个完整展示自动驾驶未来的公司。
尽管如此,还有一些公司仍在紧追不舍,比如Cruise、Zoox,以及我个人特别喜欢的Tesla。
这里我要简单提一下,基于我在这个领域的经历和参与。在我看来,自动驾驶行业的终极目标是实现全球范围内的完全自动驾驶。
Waymo选择了先实现自动驾驶再全球扩展的策略,而Tesla则是先全球布局再逐步提升自动驾驶技术。
显然,这两家公司将会面临截然不同的调整:一家主要是软件方面的工作,另一家则是硬件方面的工作。
目前,我对他们的产品都非常满意,个人而言,我更是对技术本身充满了支持。
同样的,很多其他行业也可能经历一个快速增长和扩张的阶段(就像大约在2015年的自动驾驶领域),但最终,可能只有少数几家公司在这场竞争中存活下来。
在这个过程中,将会有许多实用的AI辅助工具(比如现在的L2 ADAS功能)和一些开放平台(比如Comma)得到广泛应用。
通用人工智能(AGI)
以上就是我对通用人工智能(AGI)未来发展的大致设想。
想象一下,这样的变革将以不同的速度遍布整个经济体,并伴随着许多难以预料的相互影响及连锁反应。
虽然这个设想可能不尽完美,但我认为它是一个值得记住并有益参考的模型。
从模因(memetic)的角度来看,AGI与那种逃离我们控制、在网络空间自我递归提升、制造致命病原体或纳米机器人、最终把银河系变为灰色粘质的超级智能相去甚远。
相比之下,它更像是自动驾驶技术的发展——一项正在快速推进且能改变社会的自动化技术。其发展速度会在包括受教育的劳动力资源、信息、材料、能源,以及监管等多个方面受到限制。
在这之中,社会既是观察者也是参与者。
世界不会因此崩溃,而是会适应、变化并重新构建。
就自动驾驶本身而言,交通自动化将大大提升安全性,城市将变得更加清新、通畅,而那些占据道路两旁的停车场和停放的汽车将逐渐消失,从而让出更多的空间。
对于通用人工智能(AGI)带来的所有这些可能的变革,我个人是充满期待的。
网友热议
总而言之,Karpathy将AGI看作更像是自动驾驶的发展,这一具体类比的观点,引发了众多网友的讨论。
「看到那个无法交付FSD的人,决定将FSD与AGI进行类比,实际上确实给了我信心,我们还有几十年的时间」。
是啊,他好像忘记了「G」。我记得Norvig在几十年前的人工智能著作中曾说过,「智能」并不意味着无所不能,一个智能体要想有用,解决一个小问题就足够了。在我看来,这就是G的由来。
而我们现在却突然又回到了以前那个狭隘的定义?我仍然看不到从LLM和自动驾驶到AGI的路径。
当然,AGI 的发展可能是渐进而缓慢的,就像我们看到Waymo打造自动驾驶汽车一样。但这只是众多方式中的一种,你也可以看到AGI通过非常不同的方式突然出现,就像通过扩展大规模LLM那样。
以上是OpenAI联合创始人Karpathy发布文章:以自动驾驶为例解释AGI!已删除的原文,请立即收藏的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

写在前面&笔者的个人理解三维Gaussiansplatting(3DGS)是近年来在显式辐射场和计算机图形学领域出现的一种变革性技术。这种创新方法的特点是使用了数百万个3D高斯,这与神经辐射场(NeRF)方法有很大的不同,后者主要使用隐式的基于坐标的模型将空间坐标映射到像素值。3DGS凭借其明确的场景表示和可微分的渲染算法,不仅保证了实时渲染能力,而且引入了前所未有的控制和场景编辑水平。这将3DGS定位为下一代3D重建和表示的潜在游戏规则改变者。为此我们首次系统地概述了3DGS领域的最新发展和关

昨天面试被问到了是否做过长尾相关的问题,所以就想着简单总结一下。自动驾驶长尾问题是指自动驾驶汽车中的边缘情况,即发生概率较低的可能场景。感知的长尾问题是当前限制单车智能自动驾驶车辆运行设计域的主要原因之一。自动驾驶的底层架构和大部分技术问题已经被解决,剩下的5%的长尾问题,逐渐成了制约自动驾驶发展的关键。这些问题包括各种零碎的场景、极端的情况和无法预测的人类行为。自动驾驶中的边缘场景"长尾"是指自动驾驶汽车(AV)中的边缘情况,边缘情况是发生概率较低的可能场景。这些罕见的事件

0.写在前面&&个人理解自动驾驶系统依赖于先进的感知、决策和控制技术,通过使用各种传感器(如相机、激光雷达、雷达等)来感知周围环境,并利用算法和模型进行实时分析和决策。这使得车辆能够识别道路标志、检测和跟踪其他车辆、预测行人行为等,从而安全地操作和适应复杂的交通环境.这项技术目前引起了广泛的关注,并认为是未来交通领域的重要发展领域之一。但是,让自动驾驶变得困难的是弄清楚如何让汽车了解周围发生的事情。这需要自动驾驶系统中的三维物体检测算法可以准确地感知和描述周围环境中的物体,包括它们的位置、

StableDiffusion3的论文终于来了!这个模型于两周前发布,采用了与Sora相同的DiT(DiffusionTransformer)架构,一经发布就引起了不小的轰动。与之前版本相比,StableDiffusion3生成的图质量有了显着提升,现在支持多主题提示,并且文字书写效果也得到了改善,不再出现乱码情况。 StabilityAI指出,StableDiffusion3是一个系列模型,其参数量从800M到8B不等。这一参数范围意味着该模型可以在许多便携设备上直接运行,从而显着降低了使用AI

轨迹预测在自动驾驶中承担着重要的角色,自动驾驶轨迹预测是指通过分析车辆行驶过程中的各种数据,预测车辆未来的行驶轨迹。作为自动驾驶的核心模块,轨迹预测的质量对于下游的规划控制至关重要。轨迹预测任务技术栈丰富,需要熟悉自动驾驶动/静态感知、高精地图、车道线、神经网络架构(CNN&GNN&Transformer)技能等,入门难度很大!很多粉丝期望能够尽快上手轨迹预测,少踩坑,今天就为大家盘点下轨迹预测常见的一些问题和入门学习方法!入门相关知识1.预习的论文有没有切入顺序?A:先看survey,p

原标题:SIMPL:ASimpleandEfficientMulti-agentMotionPredictionBaselineforAutonomousDriving论文链接:https://arxiv.org/pdf/2402.02519.pdf代码链接:https://github.com/HKUST-Aerial-Robotics/SIMPL作者单位:香港科技大学大疆论文思路:本文提出了一种用于自动驾驶车辆的简单高效的运动预测基线(SIMPL)。与传统的以代理为中心(agent-cent

最近一个月由于众所周知的一些原因,非常密集地和行业内的各种老师同学进行了交流。交流中必不可免的一个话题自然是端到端与火爆的特斯拉FSDV12。想借此机会,整理一下在当下这个时刻的一些想法和观点,供大家参考和讨论。如何定义端到端的自动驾驶系统,应该期望端到端解决什么问题?按照最传统的定义,端到端的系统指的是一套系统,输入传感器的原始信息,直接输出任务关心的变量。例如,在图像识别中,CNN相对于传统的特征提取器+分类器的方法就可以称之为端到端。在自动驾驶任务中,输入各种传感器的数据(相机/LiDAR

写在前面&出发点端到端的范式使用统一的框架在自动驾驶系统中实现多任务。尽管这种范式具有简单性和清晰性,但端到端的自动驾驶方法在子任务上的性能仍然远远落后于单任务方法。同时,先前端到端方法中广泛使用的密集鸟瞰图(BEV)特征使得扩展到更多模态或任务变得困难。这里提出了一种稀疏查找为中心的端到端自动驾驶范式(SparseAD),其中稀疏查找完全代表整个驾驶场景,包括空间、时间和任务,无需任何密集的BEV表示。具体来说,设计了一个统一的稀疏架构,用于包括检测、跟踪和在线地图绘制在内的任务感知。此外,重
