“影子驾驶”构建用户数据闭环是解决自动驾驶长尾问题的最佳方案

发布日期：2023-02-10浏览量：3165

导读：在汽车电动化革命之后，自动驾驶技术将掀起新的一场革命。然而，部分零碎的场景、极端的情况和无法预测的人类行为等长尾难题仍是制约自动驾驶发展的关键难题。在此背景下，有业内人士提出，以“影子驾驶”的方式构建用户数据闭环，是解决长尾问题的最佳方案。乍看之下，“影子驾驶”似乎是解决长尾效应的不二之选，但是“影子驾驶”带来的芯片运算力大涨、成本上涨，无效数据的定义、筛除、利用，驾驶员和算法同时出错的情况如何甄别，数据如何打通等问题，也让“影子驾驶”看上去美好而现实骨感，而这一切构成了“影子驾驶”的AB面。

一、“影子驾驶”或成关键武器

“影子驾驶”离消费者并不远，特斯拉率先提出并已经利用。“影子驾驶”，指的是在车辆主大脑之外的另一个“分身大脑”，它同样能获取车辆的各种传感器数据，并对行驶路况作出预测，还能输出驾驶决策指令。在有人驾驶状态下，系统包括传感器仍然运行但并不参与车辆控制，只是对决策算法进行验证——系统的算法在“影子驾驶”下做出持续模拟决策，并且将决策与驾驶员的行为进行对比，一旦两者出现不一致，该场景便被判定为“极端工况”，进而触发数据回传。

不同的是，“影子驾驶”下的预测和指令不会真的被执行下去，只用来和驾驶员决策的实际效果做对比，并以此评价和改进测试版神经网络，通过不断收集数据，丰富数据库，完善算法模型，逐步实现自动驾驶向更高等级进阶。

如今自动驾驶企业百舸争流，但主流技术路线无外乎两条，一是直接瞄准4级自动驾驶，通过验证绝对安全性实现跨越式进化；二是从低级别的辅助驾驶系统入手，基于已经落地量产的辅助驾驶车辆，通过收集数据、逐步完善，渐进式向4级自动驾驶进化升级。其中，Robotaxi是阶跃式路线最有代表的尝试，而“影子驾驶”则可以理解为是渐进式路线的产物，也有一些企业选择两条路线结合发展。

由于“影子驾驶”发展采取自动化程度的渐变，市场更容易接受。除了特斯拉，国内其他“渐进式”路线的主机厂和科技公司也在积极探索。广汽传祺全新第二代GS8搭载的AVDC影子车手就是一次大胆的尝试。广州汽车集团股份有限公司汽车工程研究院首席专业总师吴旭亭介绍，作为一套自适应车辆动态控制系统，影子车手实际上更像是一个朋友或者助手，在暗中帮助用户更好地操控车辆，通过四驱前后扭矩分配，改善转向性能，配合驾驶员意图识别，通过纵、侧向的自适应改变，实现车辆系统在线响应的实时修正。

作为主打4级自动驾驶的科技公司，北京主线科技有限公司也曾在测试过程采用“影子驾驶”。2021年，主线科技基于“L4自动驾驶卡车＋全功能影子驾驶”，在干线物流场景，与德邦物流、福佑卡车展开真实的货运业务合作，实现运营里程超100万公里，共计1000次单边循环，为自动驾驶软硬件迭代升级及商业模式验证提供了海量数据支持。

相较于广汽和主线科技的“浅尝辄止”，毫末智行科技有限公司对“影子驾驶”的继承和开拓似乎更为“虔诚”。通过对海量数据的处理和学习，毫末智行整理出了一套智能驾驶解决方案，并在原有的分场景为模型方法的基础上，引入大模型的处理思路。毫末重磅发布搭载HPilot3.0的“毫末城市NOH”，已搭载于量产车型——全新摩卡HT-PHEV，也是中国第一个大规模量产的城市辅助驾驶产品。

二、数据闭环有助克服长尾难题

为什么“影子驾驶”可以解决自动驾驶的长尾难题？未来自动驾驶汽车不再是“信息孤岛”，而是一个移动的感知终端，将与路、云端互联，通过人工智能等技术实现智慧出行，数据是连接这一切的核心因素。在数据使用上，有两个维度的能力十分重要，一是数据闭环，没有闭环，自动驾驶数据的有效性就无法得到验证。二是在数据闭环的基础上，如何实现数据的高效挖掘和运转。

当前业内普遍形成共识，在技术方面，自动驾驶的底层架构和大部分技术问题已经被解决，但由于现实道路场景复杂，即使现有技术已经实现90％以上场景的自动驾驶，剩下10％的长尾场景始终无法覆盖。数据无法闭环，成了制约自动驾驶发展的最大难题。因此采集最后10％“极端工况”数据，获得数据闭环能力也就成为自动驾驶公司成败的关键点之一。

为了克服这些长尾难题，自动驾驶系统需要不断进行规模测试、数据采集以及进行基于海量数据的算法训练，为车辆感知、定位和规划路线提供重要依据。为了训练出可靠的模型，企业会尽可能给自动驾驶系统“投喂”大量数据，以便让自动驾驶汽车掌握更多处理交通路况的能力，并将驾驶失误严格控制在可控范围之内，目前很多公司都在进行大量路测实验，试图找到并解决这些边界化的难题。一般来说，自动驾驶公司收集数据的模式不外乎三类：重资产模式、虚拟仿真和“影子驾驶”。

此前，大多数自动驾驶公司采用重资产模式，通过购置车辆并改装成自动驾驶测试车辆，雇佣安全员进行道路测试，积累必要的里程数以进行算法训练。但同济大学汽车学院教授朱西产指出，采集100万公里、300万公里的数据也许是可执行的，但要获得1亿公里、3亿公里的数据，依靠这样的方式是不现实的，不仅将花费巨额经济成本，还有不可预估的时间成本和人力成本，即使如Waymo、百度这样的自动驾驶先行者，到今天也只积累了上千万公里的测试里程，距离闭环仍有巨大差距。

于是，在针对训练自动驾驶的场景数据不足，尤其是多元化及特殊场景数据稀缺的情况，部分自动驾驶公司开始转向“影子驾驶”。在清华大学苏州汽车研究院院长助理戴一凡看来，“影子驾驶”是一种高效率、低成本的实现数据闭环的方法，通过在量产车型上加装传感器，将用户驾驶的车辆作为现实数据的捕捉器，通过捕捉、收集用户在实际驾驶过程中遇到的路况信息，将相关数据回传以进行算法训练。

“影子驾驶”将汽车销量、车端数据、车周边环境数据和神经网络算法形成一个闭环，最终形成一种滚雪球的效应，汽车销量越高，可采集到的所需场景就越多，神经网络端接收到的数据越充分。对于神经网络算法来说，数据就是它的养料，“影子驾驶”可以说为它提供了源源不断的养料，去帮助其不断成长与成熟。算法越成熟，用户体验越好，这样又带来销量的提升，最终形成一种互哺互荣的良性循环。

这一模式的先行者特斯拉，由于所有量产车型都支持“影子驾驶”，几乎每个用户都自动成为了特斯拉免费的测试员，用户越多，能采集到的数据越多。由此朱西产认为，目前全球只有特斯拉完成了“用户数据闭环”，而国内的企业最多完成了“数据闭环”，还没有实现“用户数据闭环”。

三、“影子驾驶”面临三重挑战

毫末智行首席执行官顾维灏表示，自动驾驶已经从硬件驱动1.0、软件驱动2.0，正式进入以数据驱动下的多模态感知和可解释场景化认知为代表的3.0时代。在他看来，数据驱动时代是完全不一样的时代，在大模型加海量数据的基础上，数据可以开启自训练模式。在感知技术上，多模态传感器联合输出结果。在认知技术上，以可解释的场景化驾驶常识为主，自动驾驶里程由硬件驱动、软件驱动时代的百万公里、上千万公里，直接飙升到了1亿公里以上。

尽管毫末智行方面并未对这一模式做明确的定位，但就相关资料分析，毫末智行与特斯拉的技术路线可以说是一脉相承，都是基于数据迭代的算法架构，驱动自动驾驶进化，在车上使用影子驾驶和特征触发器来收集供自动驾驶训练的数据，并且都将数据处理的效率与成本当成是技术进化的第一性原理。

对于自动驾驶的技术进化，数据的标注、系统的仿真以及数据处理是至关重要的，戴一凡直言，影子驾驶最终的目标就是要实现在成本和效率下的“数据自由”。作为解决驾驶场景数据瓶颈的一种方式，尽管“影子驾驶”看起来非常美好，但也不得不说，现实十分骨感，“影子驾驶”在发展中仍面临三方面挑战。

首先，这一模式需要足够的硬件支撑。最早提出“影子驾驶”的特斯拉，基于领先的技术理念，在每辆车上都对摄像头、算力芯片以及传感器等硬件做了预埋，为形成数据闭环做了充足的硬件基础。国内对于这些设备的安装随着智能网联车辆功能的提升以及自动驾驶等级的提高，才逐步增加，并且不同于特斯拉全栈自研，国内主机厂与供应商的合作模式，无法完全掌握主动权，在做软硬件升级上受到掣肘。

其次，算法机制能力是最关键的问题，从有效数据的识别和筛选到神经网络的训练，企业是否已经形成了一套足够完整的正向开发流程仍要打个问号。凯联资本产业研究院院长由天宇指出，“影子驾驶”的核心在于如何最大限度发掘回收数据的价值。用户的数据无法全部回收，如何高效、快速在海量数据中有效调取标准化数据是第一步，更关键的还在于企业处理数据的水平和算法模型的成熟度。

企业自动驾驶研发水平的成熟度决定了“影子驾驶”本身的使用和利用率，由天宇认为，如果自动驾驶研发还处于较低水平，那么“影子驾驶”利用意义有限，如果整个数据收集、调取、回传以及反馈的流程都已经较为成熟，“影子驾驶”才能发挥其最大价值。

最后，当前最为严峻的问题即对于数据收集、使用、传输的合规性标准仍需探讨。朱西产指出，数据保护相关法规日趋严格，尤其重视保护用户行为等隐私数据，日前，网信办出台一系列数据安全相关政策，对于自动驾驶数据合规、敏感地理信息以及数据离境等问题做了严格要求和规范。相关要求显示，汽车数据处理者在开展汽车数据处理活动中坚持“车内处理”、“默认不收集”、“精度范围适用”、“脱敏处理”等数据处理原则，减少对汽车数据的无序收集和违规滥用。这使得国内大部分企业在对自动驾驶的开发测试中受到一定限制，难以大规模推广。

此外，“影子驾驶”有效的前提是汽车保有量足够大。在利用数据训练完善算法前，加装的各类传感器价格不菲，但用户无法感知价值，如果将成本转移给用户可能导致产品缺乏竞争力，难以扩大规模。

四、“影子驾驶”亟需完善发展

其实业内对于“影子驾驶”至今没有清晰的定义，但也并不妨碍对它的畅想。如今“影子驾驶”仍与驾驶员并存，作为一种后台应用功能，为实现更高等级的自动驾驶服务。如果将L4自动驾驶作为发展的终极目标，当所有车辆已经实现这一功能后，“影子驾驶”是否还有存在的必要？

“我们认为第一阶段的学习是对标人的驾驶行为，所以是人的‘影子’，当决策行为慢慢接近真实，或者在某些场景超过人的驾驶判断，那么它可能就需要学习别的‘影子’了。”戴一凡认为，“影子驾驶”可能会长期存在，随着汽车的研发迭代，即使整个自动驾驶已经形成闭环发展，“影子驾驶”依旧有价值，只是到那时“影子”将不再是人的“影子”，可能是远程安全员的“影子”，能够在极限情况下操控车辆；也可能是周围车辆甚至是交通体系中其他端的“影子”，通过学习其他终端的行为，完善整个系统的相互配合，为构建新的车路协同生态圈提供有力支撑。

在他的展望中，“影子驾驶”的终极形态将会是一套能够自主学习、自我分析、不断迭代进化的算法系统，能够更好地提高自动驾驶的效率。

未来，“影子驾驶”可能会一直存在，只是作用会发生改变，由天宇提出了另一种相似看法。随着整个自动驾驶模式训练越来越成熟，“影子驾驶”可能在某一阶段作用会比较大，当模型完善度越来越高，“影子驾驶”所能提供的价值数据会逐渐降低。未来自动驾驶的数据收集可能不再依赖“影子驾驶”，而是基于一些特定场景的训练或者高强度仿真。

但由天宇也强调，尽管“影子驾驶”可以解决部分极端工况数据，但也无法满足全部数据，所以总体来看，“影子驾驶”确实有用，但效果有限。

此外，有行业专家指出，如果算法在“影子”中持续做模拟决策，并且把决策与驾驶员的行为进行对比。会出现两种情况。在完全一致的情况下，则表示此次学习没什么效果。在显著不同的情况下，又会产生两种可能的结果，一是驾驶员出了问题，对驾驶员提出警报；二是算法不够完善，需要从当前的情况学习新的控制策略。但此时可能涉及一个新的问题，即对于驾驶员和算法决策的判断，要基于怎样的依据，要由谁来判断二者的优先级，这一问题可能也需要企业在不断发展中给出答案。

来源：中国汽车报作者：张雅慧

版权说明：“华夏EV网”转载作品均注明出处，本网未注明出处和转载的，是出于传递更多信息之目的，并不意味着赞同其观点或证实其内容的真实性。如转作品侵犯署名权，或有其他诸如版权、肖像权、知识产权等方面的伤害，并非本网故意为之，在接到相关权利人通知后将立即加以更正。

文章标签：

本文网址：http://www.evinchina.com/articleshow-482.html

上一篇：集度点到点领航辅助PPA即将与大家见面
下一篇：L3级自动驾驶还有多远？

分享到：

近期活动

2023年中国主流智驾公司业务进展梳理
导读：2023年智驾赛道，几家欢喜，几家难。本文梳理了37家国内主流智能驾驶公司2023年业务进展，覆盖L2+量产智驾、Robotaxi、无人干线物流、无人港...
浏览量：41402024-02-02
文远知行获新加坡T1、M1自动驾驶牌照
导读：12月11日，文远知行宣布获得新加坡Milestone1无人驾驶车辆第一级别公共道路测试牌照（简称“M1牌照”）及T1Assessment无人驾驶车辆第一...
浏览量：21012023-12-13
滴滴自动驾驶展现未来出行新趋势
导读：一辆辆白色的自动驾驶网约车在城市街道中灵活穿梭，派单、接驾、行程中、到站、回港、充电，自动化运营一气呵成。这是2023广州国际车展上，...
浏览量：20742023-11-22
文远小巴和文远环卫车在大连正式投入运营
导读：近日，我们从文远知行官方处获悉，其在大连高新区的车联网无人驾驶示范项目经过180天的测试后，于日前首发运营。其中，文远知行无人驾驶小巴...
浏览量：29192023-07-17