首页 科技周边 人工智能 鉴智机器人x地平线:两年走完五年路,正确路径下的量产加速度

鉴智机器人x地平线:两年走完五年路,正确路径下的量产加速度

Oct 15, 2023 am 11:25 AM
地平线 量产加速度 鉴智机器人x

资本寒冬当中,短短一年多完成5轮融资;

不到2个月推出基于征程5的L2+感知方案,不到5个月推出基于征程5的智驾系统;

在不到3个月的时间里,我们成功获得了OEM定点,并在接下来的2年里累计交付了超过50万台智驾产品

在快鱼吃慢鱼的智能驾驶赛道,鉴智机器人犹如开挂一般,两年时间,走出了很多公司五年走完的路,并以基于强AI的自动驾驶范式和差异化的双目立体视觉产品,成为智驾市场上极具标识和竞争力的新晋明星公司。

但“爽文”一般的创业历程背后,其实并没有什么独门秘籍,只因正确的商业策略、领先的技术建设,以及志同道合的伙伴和团队

理念相通,快速“上道”

2021年8月,一群怀揣着通用机器人梦想的人共同创立了鉴智机器人公司。他们选择以智能驾驶为起点,首先进入了未来10年市场需求最强、市场空间最大的领域

然而,此时国内的智驾行业正处在从蓝海到红海的转折点。一些早在四、五年前就成立的自动驾驶公司,已经开始以供应商的角色,切入高阶智能驾驶前装量产市场,占领了先机。这意味着,对于刚刚成立的鉴智来说,别人能做的,要做得更好;别人做不了的,也要能做;其他公司3年做完的,必须几个月就搞定。

高级智能驾驶需要应对复杂多变的道路环境,不仅需要强大的传感器和芯片算力支持,还需要高效迭代的算法模型,以充分利用硬件性能,实现智能驾驶系统能力的持续升级,从而在性能和成本之间取得最佳平衡

因此,软硬协同是打破僵局的关键,也是实现高效量产部署的最佳途径

然而就在鉴智成立的几乎同一时间,地平线发布了征程5,为智驾行业带来了首款国产百TOPS的高性能、大算力车规级智能驾驶芯片。同时,地平线一直是软硬协同的坚定践行者,构建了以“芯片+工具链”为核心的高效开放技术平台以及完整成熟的开发环境。相当于从硬件参考设计、工具链、基础中间件到丰富的参考算法,给开发者提供一站式的开发支持。

于是,一场不期而遇的相互奔赴就此拉开序幕。鉴智在成立2月内就和地平线建立了紧密的合作关系,并获得了从研发到商业落地的全方位支持。等同于一起步,就在地平线打好的“地基”上,快速“上道”。

为了实现高效协作,我们需要在两个月内提出一个方案

2022年4月,鉴智成为最早获得征程5的公司之一,利用地平线的工具链,团队迅速开始模型的量化部署工作

量化部署是将模型迁移到新平台后的首要步骤。其目标是在保证原始模型预测效果的前提下,使用更低的计算精度来表示算法模型的计算行为,从而减少算法运行过程中的内存和计算资源需求,最终实现在嵌入式设备上的高效运行

鉴智机器人副总裁、软件技术负责人李博是这项工作的负责人之一。早在2007年读研时,他便接触了通用并行计算,如今已成为行业内的资深技术专家。同时,他也有幸见证了征程系列从0到1的整个过程。整个开发环境,无论是友好性、易用性,都有了质的飞跃,已经可以做到开箱即用。“不管是新人还是老员工,拿到之后,都能很快摸索上手。”

针对鉴智自研的动态障碍物检测多任务模型,团队的预期是量化后,在保持模型功能正确性的基础上,性能达到10~20 FPS,精度达到与原始模型相当的水准。

功能的正确性验证通常需要手动导出量化模型和原始模型的数据,再分别进行对比,非常繁琐。而借助工具链的Verifier工具,可以在模型转换后,直接验证两种模型的结果一致性,整个过程做到了高度自动化

FPS是模型性能的关键指标,更高的FPS意味着更快速的感知、更低的延时,相较理论算力,更能反映智驾系统的安全性和行驶效率,是衡量芯片真实计算性能的重要标准。此前,团队使用了与征程5算力相当的计算平台,实际的FPS没有达到10~20预期,而在征程5上最终达成了超预期的30FPS。团队还利用地平线提供的金字塔等模块,让一些原本依赖CPU的处理流程,可以通过征程5的异构计算系统实现硬件加速。

保持量化精度则颇具挑战。起初,有些障碍物检测的精度非常出色,有些还存在差距。“多任务模型的训练本身就有一定难度,因为各任务之间的数据分布和任务特性之间都会有相互影响。其中一个任务的数据加多了,另一个任务的结果可能就会掉精度。”

为了解决精度问题,鉴智和地平线双方团队进行了多轮密集讨论。此时,征程5的工具链也在快速迭代,很快提供了QAT(训练中量化)方案。“QAT提供量化训练能力的同时,也提供了丰富的调试工具和调优建议,面对精度损失问题,可以快速地通过逐Layer比较直接定位到问题所在,结合地平线调优建议可以很高效地解决问题。”

“这些工具如同桥梁助手一样,能够帮助我们更快地定位软件系统中的性能瓶颈,并进行针对性的调整。”李博说,“地平线在支持我们能够把征程5用好这个层面上,下了很大的功夫。我们能够快速把过去的工作移植过来,很大程度上来自双方的紧密配合工具链的成熟度。”

鉴智的开发团队对这种支持的深度感到非常深刻。作为方案提供商,鉴智会接触到许多不同的平台,但是与其他一些平台的企业相比,有时候团队发出的邮件三四个月都得不到回复,这与地平线形成了明显的对比

高效密集的开发协作,让鉴智团队只用不到2个月的时间,就发布了基于征程5的L2+自动驾驶感知系统方案。同年8月初,鉴智进一步推出基于单征程5的L2++自动驾驶量产方案,成为首批基于征程5实现自动驾驶系统解决方案的公司。

无止境优化,连创多项第一

4个月做出的方案,成效如何,到了检验的时候。2022年8月,在一场媒体活动期间,地平线集聚了一众朋友圈,共话智能驾驶的创新范式。鉴智机器人参与其中,还邀请媒体上车体验。

在车流如织的高速上,鉴智车辆顺滑的交通路口辅助、拨杆自动变道、自动超车换道等表现,依然获得了媒体的点赞。9月份,地平线创始人兼CEO余凯也亲自体验了鉴智的方案,对方案效果颇为赞赏。

鉴智团队没有就此停下脚步,随后几个月里,又投身于推进BEV感知的部署实践,挖掘征程5的能力上限

BEV是智能驾驶感知技术的新范式。早在2021年,鉴智就提出了自研的BEVDet范式,推理速度可达同类算法的4到15倍。但BEV需要很大算力的支撑,为了充分利用征程5的BPU性能,这支团队从地平线工具链大量的基础参考算法中“优中优选”。经过一番尝试,参考了地平线自研的VargNet模型结构进行优化,显著提升了网络性能、减少了访存时间,实现了计算量压缩,在保证运行效率和任务表现的前提下,完成了自有算法的快速迁移与二次开发。

最终,BEVDet在征程5上实现了高时效性的BEV感知,模型运行效率达到50+FPS,成为确保量产性能的有力保证。

鉴智机器人x地平线:两年走完五年路,正确路径下的量产加速度

搞定BEV感知后,鉴智研发团队还对预测规划也开展了深度优化,以实现极致的NOA体验。

然而,预测、规划任务想要利用BPU的算力极具挑战。经过多番的思想碰撞,双方确立了“开源节流”的整体优化思路,尽可能利用到所有算力,比如将意图分类这种适合做AI化的操作用learning-based方法替代rule-based方法以将其部署至BPU。最后,鉴智交出了预测性能优化5倍+,规划性能优化5倍+的答卷。

团队还把征程5中的其他异构资源也充分利用起来,将一些原本跑在CPU上的算法移植到了DSP上。虽然DSP编程比CPU难度更大,且需要一定积累,但在地平线团队的支持下,依然实现了异构计算,进一步提升了算力利用率。

对此,鉴智的研发人员还回忆到,“早在地平线第一代芯片发布会上,地平线联合创始人兼CTO黄畅博士就讲过,通过软硬结合优化可以不断地挖掘芯片潜力,这其实也是地平线芯片上,能够高效支撑各种先进的高等级智能驾驶算法的核心。”

这些软硬协同优化和工程实践,帮助鉴智又创下了多个“第一”。

今年6月底到7月之间,鉴智先后推出了地平线生态内首个基于单颗征程5的全自研标准感知产品PhiVision,以及首个基于征程5+TC397的高速NOA系统方案PhiGo Pro,该方案无需外挂CPU,将高速NOA的整体成本降至3000元以内,具备极强的性价比优势。

鉴智机器人x地平线:两年走完五年路,正确路径下的量产加速度

【鉴智机器人发布地平线生态内首个基于单颗征程5的全自研标准感知产品PhiVision(左起:地平线首席生态官徐健,鉴智机器人联合创始人兼CTO都大龙,天准科技副总裁刘军传,鉴智机器人副总裁兼感知产品线负责人梁柱锦 )】

鉴智机器人x地平线:两年走完五年路,正确路径下的量产加速度

【鉴智机器人邀请行业领袖共话标准感知包的价值:(武文光 美行科技执行总裁 / 美行(上海)总裁、刘军传 天准科技副总裁、张宏志 地平线副总裁兼智能汽车事业部业务拓展负责人、都大龙 鉴智机器人联合创始人&CTO、梁柱锦 鉴智机器人副总裁&感知产品线负责人】

凭借全新的方案,鉴智已经获得了多家头部OEM定点。

“我们能拿出这些方案,也印证了征程5是有很多潜力可以挖掘的,通过软件、硬件、算法协同优化,把高速NOA跑出非常不错的效果。”鉴智机器人CTO都大龙博士提到,“优化是永无止境的,关键在于相互讨论、碰撞,把复杂的问题简单化,借助大家的力量一起解决掉。

一群人走路,可以让参天大树生长

多年的从业历程让鉴智的核心团队深知,一套芯片平台能否成为主流,硬件是基础,软件工具链和生态是长出参天大树的关键

强大的硬件架构能够吸引开发者。当然也不能单纯追求峰值算力,还要提高有效算力,切实满足具体应用的算力需求。

好用的软件工具链能够留住开发者。简单易用可以降低学习门槛,而良好的可拓展性,更能快速适应不断变化的开发需求,充分调动开发者的积极性。

健康的生态体系可以与开发者互惠互助。真正走进企业、校园,在为开发者、合作伙伴解答疑难问题的同时,也能听取他们的意见和反馈,不断反哺软硬件的迭代和优化。

在鉴智核心团队的眼中,地平线作为中国AI芯片的新一代领军者,潜心和开发者与合作伙伴一点一滴地共建和打磨,短短几年时间,无论是硬件架构的成熟度,还是工具链的友好度,亦或是生态体系的繁荣度,都已经达到了行业顶尖的水平

这种合作共创的经历,无论是对于产品迭代和生态建设,还是做方案拿定点,都是不可或缺的重要过程。在国内的智驾圈子中,每个人都想跑得比别人快。鉴智作为供应商,更要比主机厂跑得更快、想得更远。虽然自己会因此经受巨大的压力和考验,但只要有合作伙伴和团队的支持,就能打好每一场战役。

鉴智的速度,正是与地平线相互支持、相互信任的结果,如同两个道相同、心相通、力相聚的伙伴。地平线坚持贯彻的开放协作的生态合作模式,可以说也为中国智驾产业的发展,创造了更具凝聚力的土壤环境

现如今,鉴智机器人已经与海外车企客户建立了研发合作,“In China For Global”的战略踏出了坚实步伐。鉴智机器人与地平线作为中国硬科技崛起的代表企业,将进一步加深合作,在国际市场上收获更多成果。

“一个人的路可以走得很快,但一群人的路可以走得更远。伙伴和团队的力量是在市场上走得更久,在行业激烈竞争的浪潮下,屹立不倒、迈向成功的重要财富。

以上是鉴智机器人x地平线:两年走完五年路,正确路径下的量产加速度的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
3 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

我尝试了使用光标AI编码的Vibe编码,这太神奇了! 我尝试了使用光标AI编码的Vibe编码,这太神奇了! Mar 20, 2025 pm 03:34 PM

Vibe编码通过让我们使用自然语言而不是无尽的代码行创建应用程序来重塑软件开发的世界。受Andrej Karpathy等有远见的人的启发,这种创新的方法使Dev

2025年2月的Genai推出前5名:GPT-4.5,Grok-3等! 2025年2月的Genai推出前5名:GPT-4.5,Grok-3等! Mar 22, 2025 am 10:58 AM

2025年2月,Generative AI又是一个改变游戏规则的月份,为我们带来了一些最令人期待的模型升级和开创性的新功能。从Xai的Grok 3和Anthropic的Claude 3.7十四行诗到Openai的G

如何使用Yolo V12进行对象检测? 如何使用Yolo V12进行对象检测? Mar 22, 2025 am 11:07 AM

Yolo(您只看一次)一直是领先的实时对象检测框架,每次迭代都在以前的版本上改善。最新版本Yolo V12引入了进步,可显着提高准确性

Google的Gencast:Gencast Mini Demo的天气预报 Google的Gencast:Gencast Mini Demo的天气预报 Mar 16, 2025 pm 01:46 PM

Google DeepMind的Gencast:天气预报的革命性AI 天气预报经历了巨大的转变,从基本观察到复杂的AI驱动预测。 Google DeepMind的Gencast,开创性

Chatgpt 4 o可用吗? Chatgpt 4 o可用吗? Mar 28, 2025 pm 05:29 PM

Chatgpt 4当前可用并广泛使用,与诸如ChatGpt 3.5(例如ChatGpt 3.5)相比,在理解上下文和产生连贯的响应方面取得了重大改进。未来的发展可能包括更多个性化的间

哪个AI比Chatgpt更好? 哪个AI比Chatgpt更好? Mar 18, 2025 pm 06:05 PM

本文讨论了AI模型超过Chatgpt,例如Lamda,Llama和Grok,突出了它们在准确性,理解和行业影响方面的优势。(159个字符)

O1 vs GPT-4O:OpenAI的新型号比GPT-4O好吗? O1 vs GPT-4O:OpenAI的新型号比GPT-4O好吗? Mar 16, 2025 am 11:47 AM

Openai的O1:为期12天的礼物狂欢始于他们迄今为止最强大的模型 12月的到来带来了全球放缓,世界某些地区的雪花放缓,但Openai才刚刚开始。 山姆·奥特曼(Sam Altman)和他的团队正在推出12天的礼物前

如何将Mistral OCR用于下一个抹布模型 如何将Mistral OCR用于下一个抹布模型 Mar 21, 2025 am 11:11 AM

MISTRAL OCR:通过多模式文档理解彻底改变检索效果 检索增强的生成(RAG)系统具有明显高级的AI功能,从而可以访问大量的数据存储,以获得更明智的响应

See all articles