您当前的位置:资讯 > >正文
淘汰赛开启,如何破解城市NOA量产难题

时间:2023-07-27 16:43:58   来源:汽车之家

由智能化、电动化带来的全球汽车产业的大变革已经取得成效。在这一轮变革中,技术快速迭代,消费者需求也发生了明显改变,甚至在我国形成了“无智能,不电动”的特有现象。若将智能、电动这两个标签拆分来看,后者相对较低的门槛本就是我国绕过传统壁垒实现竞争的根源所在,前者则是“换道超车”的差异化竞争的重要倚仗。

也就是说在随后的进一步变革中,智能化能力的强弱,将直接决定车企的竞争上限。如今的智能座舱发展可谓日新月异,巨屏、车外语音、手势操控等新配置/功能不断涌现,而在智能驾驶领域,大家越来越卷。

其实想实现真正的自动驾驶,无非是两条路径:第一条是自上而下,直接定位到L4\\\\L5级别无人驾驶,再将配置、能力逐步下放,从而实现低成本解决绝大部分无人场景;第二条则是如今主机厂们惯用的形式,自下而上,量产低级别智能驾驶,并通过其环节中产生的大量数据不断迭代技术,向更高级别演进。在这条路线中,能否量产是最关键一环。


【资料图】

据汽车之家研究院公布的《中国智能汽车发展趋势洞察》报告中显示,2022年,主动刹车、车道保持辅助系统、自适应巡航系统等L2级智能驾驶代表性功能的市场渗透率高速增长,哪怕此前略显保守的海外品牌,也将上述部分功能当成了新车标配。

但在真正考验“L2+”智能驾驶能力的领域,比如城市NOA(面向城市域的高阶智能驾驶辅助系统,不同车企间叫法不同),能实现向上突破者寥寥。大部分公布了城市NOA功能的企业,要么属于“期货”尚未兑现,要么是采用内测、早鸟等形式推送,距离真正的量产尚有距离。而自动驾驶领域的下半场竞争的开端,也就藏在上述量产难题之中。

★路线之争:从【重】地图到【轻】地图

从目前来看,有能力涉足城市NOA领域的玩家并不在少数。走从下到上路线的企业有毫末智行、蔚来、理想、小鹏、集度等;走从上到下路线的企业有百度、轻舟智航、小马智行等。不过从推出时间和推广规模来看,这些车企的城市NOA大多集中在广州、深圳、上海这三个城市。

比如小鹏,2022年9月,小鹏城市NGP智能导航辅助驾驶在广州正式开启试点,首批被推送的用户是从广州提交过智能辅助驾驶建议的P5车主中随机选取,且初期必须得经历“新手模式”——即在部分条件适宜路段使用城市NGP超过100公里,时长超过7天后才可解锁全部路段。自此一段时间后,该功能才逐渐面在深圳、上海开放。

曾在某次上海车展前夕凭借“自动驾驶”视频火遍全网的极狐,虽然在2022年5月就交付了极狐阿尔法S HI版,但到9月才于深圳开启城市NCA功能测试,并于随后延伸至上海。

之所以早期城市NOA集中在广州、深圳、上海,是因为上述三大城市是国内最早一批颁发高精地图城市试点的许可的城市。与高速域不同,面向城市域的高阶智能驾驶要面对的复杂路况呈指数级增长,信号灯变化、潮汐车道变化、路面行人轨迹预测、非机动车轨迹预测……这一切场景对于企业软硬件综合能力要求极高。曾有数据显示,小鹏城市NGP感知模型的数量已经达到高速NGP的4倍,预测/规划/控制相关代码量则提升至88倍,其复杂程度由此可见一斑。

面对上述复杂场景,在软硬件综合能力没那么强大时绝对精度和相对精度均在 1 米以内的,蕴含道路类型、曲率、车道线位置等道路信息,以及路边基础设施、障碍物、交通标志等环境对象信息,同时包括交通流量、红绿灯状态信息等实时动态信息的,高精度、高新鲜度、高丰富度的高精地图高精地图就成为了车企快速上马城市NOA的“捷径”。

但事物都有两面性,高精地图的局限性,以及其资质难获取等特性也成为局限住车企NOA快速量产的关键原因。在2023中国汽车论坛上,重庆长安汽车股份有限公司首席专家李伟曾剖析过“重地图”模式的弊端。他认为该模式属于递增式投入,虽然前期高速+少量城市数据采购成本不高,但后期随城市扩展,采购成本激增,不仅如此,还面临地图鲜度不足、覆盖不足的长期问题,这必然导致智驾系统鲁棒性差。

『高精地图示意图』

至于其长期成本有多高,华为常务董事、终端BG CEO、智能汽车解决方案BU CEO余承东曾举过一个例子:“仅仅采集上海市高精地图,采集了一两年、9000公里,都没有把上海完全覆盖。并且从国家安全的角度,几个月才允许刷新,但是中国的道路天天在改,所以说依赖于高精地图真的没法广泛使用。”正因为此,业内也逐渐达成共识——想让城市NGP快速实现量产,去图化可能是唯一途径。

在业内,毫末智行无疑是第一批打出“重感知”派招牌的企业。早在2022年,毫末智行便官宣了搭载HPilot 3.0系统,可实现城市NOH领航辅助功能的量产车型;今年4月,在第八届毫末AI DAY上,该企业又宣布上述功能的新“载体”——魏牌的新摩卡DHT-PHEV和魏牌蓝山(参数|询价)。根据现有规划,毫末智行旗下的城市NOH功能将率先在北京、上海、保定等城市落地。

『请点击图片查看清晰内容』

除毫末外,小鹏、华为等此前依赖高精地图的企业也开始进行“重感知”进化。其中小鹏的XNGP已经进行无图化测试,预计在年底扩展到50个城市;余承东则宣布华为不依赖于高精地图的城区NCA将在第三季度内实现15城落地,到四季度将增加到 45城。就连地图巨头百度都已经在向重感知方案靠拢,其ANP3.0系统已经将“BEV 环视三维感知”技术作为安全冗余。

★技术之争:【数据能力】才是门槛

根据西部证券公布的预测显示,未来城市NOA将是一块大蛋糕,其车型数量规模可能会在2023-2025年分别达到11.9万辆、67.6万辆和243.6万辆。但想在这块蛋糕中多吃多占,可不仅仅是确定路线这么简单。

在没有或不依赖高精地图时,如将传感器识别到的数据进行处理,并通过其做到更大规模的城市泛化,适应不同城市“乱七八糟”的路况、场景。以最基本的识别红绿灯控车、别红绿灯这一在部分人看来可能很基础的功能为例。我国不同城市的红绿灯规格都不甚相同,有三排灯、有五排灯,有横着的、有竖着的……先不提算法,为了满足上述场景,收集来的数据规模就会和以前实现指数级增长。

在这种数据规模下,像以前一样依靠CNN卷积神经网络训练模型似乎就不再适用了。在这方面,率先提出摆脱高精地图,甚至取消激光雷达,采用纯视觉方案的特斯拉给大家开了个好头,开始用Transformer大模型替代CNN,利用其结构简洁、可无限堆叠基本单元得到巨大参数量的特性来提升。

相比于CNN,Transformer在的数据量越大,其效果就越好。有研究表明,当训练数据集增大到包含 1亿张图像时,Transformer的性能开始超过CNN。而当图像数量增加到10亿张时,两者的性能差距变得更大。

在国内,毫末智行则是率先引入Transformer大模型的自动驾驶公司。虽然时间上没有特斯拉早,但毫末智行的创新在于用Transformer做时间和空间上的前融合。

比如面临一段在正常不过的路,人眼看到的是双向四车道,是连续的视觉图像,而摄像头的识别却并非连贯的,而是一帧一帧的图片。假设车往左偏5厘米,人识别出来的信息很正常,掰直即可,原有方案下摄像头识别的可就复杂了,也许以为路本身就是“歪的”,这种时间上的“断点”再加上前后左右、侧前侧后等方向摄像头识别出的空间上的“乱象”,若没有高精地图进行纠正,则很可能成把系统“干懵”,无法进行有效拼接。

而毫末的方法是用Transformer 做时间和空间上的前融合,也就是通过该大模型的注意力特征,提取不同图片像素之间的相关性,用其特征向量进行前融合,再通过神经网络进行目标预测。这样不仅能解决多角度摄像头无法拼接出“上帝视角”的问题,甚至还能融合激光雷达数据,来给视觉效果进行补充。

对此,毫末智行技术总监潘兴曾用城市领域最容易出现的车道线场景作为范例。他表示,和高速场景不同,城区道路车道线极为复杂,有的地方被磨没了,有的地方可能重新粉刷,但旧的车道线还没完全铲除。这种场景下,Transformer大模型的注意力机制可以很好的解决问题。

值得注意的是,城市域NOA所面临的类似场景还有很多。比如复杂十字路口处有多个红灯,到底哪个灯亮了车辆才应该走?想解决诸如此类的千千万万个场景,就得识别大量的数据、做大量的标注、模拟大量的场景、进行大量的学习、加以大量的调整、写大量的规则……

上述“大量”要怎么解决?用毫末智行CEO顾维灏的话说,行业里搞了20年,把预测、规划、决策、控制,每一项都分成一个个小任务,20 年也没搞成。直到类GPT(Generative Pre-trained Transformer)技术开始应用。

今年4月11日,毫末智行正式发布自动驾驶生成式大模型DriveGPT,中文名为“雪湖·海若”和爆火的ChatGPT类似,只不过ChatGPT采用自然语言进行输入与输出,DriveGPT则面向自动驾驶场景,用感知融合后的文本序列输入,以自动驾驶场景文本序列作为输出,将自动驾驶场景Token化,形成“Drive Language”,最终完成自车的决策规控、障碍物预测以及决策逻辑链的输出等任务。通俗来说就是,把上述所有小任务缩减为两个大任务,一个是感知,一个是认知。

另外,毫末智行也开始和生态伙伴探索四大应用能力,包括智能驾驶、驾驶场景识别、驾驶行为验证、困难场景脱困。比如,在场景识别中,毫末DriveGPT单针图片的整体标注成本,仅相当于行业的1/10。而这项技术向行业的开放使用,将会大幅降低行业使用数据的成本,从而提升自动驾驶技术的发展。

毫末可以逐步将DriveGPT应用在城市NOH、捷径推荐、智能陪练以及脱困场景中。DriveGPT的加入,能够让车辆行驶会更安全,规控动作更人性、更丝滑,并有合理的逻辑告诉驾驶者,车辆为何选择这样的决策动作。

而这就是毫末给出来的去图方案,极为考验数据处理能力。而这种处理能力,加上自动驾驶数据量——也就是谁先量产,通过量产出来的车收集更多的数据并加以处理,最终实现滚雪球式的技术迭代,这才是城市NOA功能的门槛所在。

写在最后:

高精地图成本高、采集难、鲜活度差,而依赖大量基建的车路协同方案的实现难度要更高于高精地图,在此前提下,想量产城市NOA,实现正向循环,着实不是一件容易的事。

据毫末智行董事长张凯表示,该企业之所以能快速实现量产,无非是做好了一下几个闭环:用户需求闭环——对驾驶场景数据持续分析完善策略,并进行新功能体验反馈;研发效能闭环——将数据驱动理念深入到产品需求定义、感知与认知算法开发等产品开发流程,整体开发效率提升;数据积累闭环——在车端部署诊断服务数据场景标签覆盖92%的驾驶场景;数据价值闭环——大模型持续挖掘数据价值解决关键问题;产品自完善闭环——实现售后问题处理速度较传统方式的十倍效率提升,实现最快10分钟定位售后问题;业务工程化闭环——进一步完善了从采集回流、标注训练、系统标定、仿真验证等环节到最终 OTA 释放环节的产品研发全流程工程化闭环。上述闭环光是看起来就已经颇为复杂,实现起来就更不容易,这种门槛实则已经筛选掉了很多玩家

对此,即便体量(单指智能汽车)庞大如特斯拉,也要通过开放FSD给其余车企的形式进一步扩大数据收集能力。在这方面,背靠长城并逐渐扩大朋友圈的毫末智行、给众多主机厂提供方案的华为似乎也有一定的规模优势。相信在这种挑战下,纠结“灵魂论”的主机厂会越来越少,毕竟在自动驾驶下半场竞争的急迫环境中,如此数据体量、技术能力,已经不是靠自研和收购能解决的了。(文/汽车之家 陈灿 )

查看同类文章:行业视角更多精彩内容:CES生产研发汽车之家行业-大数据 全领域 新视点

标签:

精心推荐