绑定手机

获取验证码

注册、登录代表你已阅读并同意《用户协议》

取消
当前位置: 首页 > 详情

毫末智行:做「数据智能」的忠实信徒,2022 年中量产城市导航辅助驾驶

陈念航 2021-12-24 10:32:00 10072

1、毫末智行:做「数据智能」的忠实信徒

数据是新的「石油」,这在自动驾驶领域尤为如此。如何收集数据、存储数据、处理数据,并最终用数据来驱动自动驾驶系统迭代,成为众多行业企业的必修功课。

新晋的中国自动驾驶独角兽公司毫末智行(HAOMO.AI),将以下观点奉为圭臬:

「数据智能」是自动驾驶的核心,谁能可持续的低成本且高效获取有价值数据,谁就有机会活到最后胜利的那一天。

那么,「数据智能」是什么?

现在的自动驾驶已经走过系统原型的搭建阶段,走向了规模化量产,这个阶段,基础的感知、规划、决策、控制等系统模块已相对成熟,但现在最大的问题就是如何大规模普及,适应不同地区、环境、场景的挑战,以及应对各类 Corner Cases,最大限度提高系统的泛化能力。

这时候,大规模的数据是必需的,百万级、千万级、亿级实测和仿真测试里程在很多自动驾驶企业那里都是家常便饭,如何用好这些数据,智能化处理数据,且让有用的数据驱动自动驾驶系统向更智能进化,就是「数据智能」。

「数据智能」能推动自动驾驶系统从简单的环境感知、机器人开车到具备如人类一般复杂的认知能力以及像人一样自如地驾驶汽车。这是所有自动驾驶企业所追求的目标,也是自动驾驶技术发展的终极梦想。

毫末智行是「数据智能」的忠实信徒,毫末智行 CEO 顾维灏表示:「我们会用数据智能的“思想钢印”,用更低的成本和更快的迭代速度,提供更安全、更好用的产品给用户。」

甚至还将它写进了公司的发展战略里。毫末奉行「风车战略」。该战略以「数据智能」为核心,驱动 3 条业务线,包括乘用车辅助驾驶产品、低速无人配送车生态平台、智能硬件。

3 大业务作为 3 个叶片,不断转动,不断收集场景数据,从而生产出更好的产品,实现正向发展的飞轮。

而国际上最大的「数据智能」支持者,当属特斯拉。

为实现自动驾驶,特斯拉的基本逻辑是,建立类似于人类的纯视觉感知技术,建立接近于人类算力的计算平台(车载 FSD 芯片和云端超算平台),用大量的数据训练大脑,使得汽车越来越擅长驾驶——让汽车具有自我(ego),特斯拉全球几百万台消费级车型,每天都在源源不断为特斯拉输送「数据石油」。

*毫末智行 CEO 顾维灏在 AI Day 上演讲

12 月 23 日,毫末智行学习其前辈特斯拉,举办了公司首届 AI Day,推出了号称是「中国首个数据智能体系」的产品——MANA,中文名为「雪湖」。

取义自科幻小说《三体》第二部《黑暗森林》,主人公罗辑在星空、雪山、森林、草地和湖畔之间徜徉思考,直到有一天在湖中寻找到了破解「三体危机」、拯救地球的方法。

「MANA 雪湖」就是毫末智行破解自动驾驶量产落地、大规模推广难题的终极武器。

在「MANA 雪湖」推出的同时,毫末智行也准备了充足的资金和人才:最新融到近 10 亿人民币 A 轮融资,估值超 10 亿美金成为独角兽;而且人才体系迅速壮大,已有近 600 人的规模。

2、「MANA 雪湖」MANA是毫末智行能力进化的核心动力

MANA 到底什么?

其实是毫末智行在自动驾驶系统研发中以海量数据为基础的一整套数据处理工具、算法模型、测试验证系统、仿真模拟工具以及计算硬件等。

MANA 体系包括了 4 个子系统,这 4 个子系统是过去 2 年毫末智行研发的成果积累,现在这些系统集成起来,形成了一个完整运转的自动驾驶数据智能体系。

4 个子系统分别是:

· BASE,包括了数据的获取、传输、存储、计算,以及新的数据分析和数据服务;

· TARS,是一些关于计算的核心算法原型,用于感知、认知、车端建图、和验证的实践;

· LUCAS,是对算法在应用场景上的实践,包括高性能计算、诊断、验证、转化等核心能力;

· VENUS,是数据可视化系统,包括软件和算法的执行情况,对场景的还原,以及数据洞察等能力。

MANA 成为了毫末智行自动驾驶算法迭代的最核心的底层系统,将推动其系统在低成本的状态下,高效迭代。

要知道,自动驾驶要应对的是纷繁复杂的现实世界,包括了不一样的天气、道路、交通参与者、交通流密度、行驶习惯,所产生的的数据也是规模大、类型多,这也让数据的收集、储存、标注、传输、计算等的成本非常高。

MANA 系统就是为了降低数据应用的成本,让其自动驾驶系统在低能量消耗的情况下维持不断进化。

MANA 数据智能体系到底有哪些核心能力呢?

首先是感知智能。

目前毫末智行使用的核心感知设备是摄像头和激光雷达。

在面对摄像头产生的影像的处理上,毫末的算法主要用于对车道、车道边缘、交通灯、车辆等的目标识别以及可行驶区域等的场景识别。

而在面对激光雷达点云的处理上,毫末的算法是先对点云数据进行伪二维化处理,然后使用一般图像的方法来进行 3D Box 的检测和障碍物检测。

以上的感知模式是分别识别结果,然后作结果融合的方法,这是行业企业比较标准的做法上,毫末智行目前也在用。

但是,这样的感知模式会遇到传感器目标被截断而不能有效使用的问题,所以毫末又设计了更高效的方法,新方法是做影像和点云两种数据的过程融合,具体而言就是通过多模态融合然后再加入时序的特征,实现多数据源的时空融合,更为真实准确的刻画现实世界,给到自动驾驶系统进行驾驶决策最准确的依据。

这里不得不提到毫末智行是国内首个引入了 Transformer 人工智能深度学习模型的自动驾驶公司,这个模型的特点是训练速度快、训练样本兼容性高、训练规模大,非常适于在自动驾驶领域应用。

当 Transformer 与毫末智行的多数据源时空融合结合在一起时,MANA 的感知智能就更为强大。

毫末智行相关技术负责人表示,公司现有一个完整的成建制的感知团队,从模型到数据到工程化到后处理的相关人才都有,百人的规模,其目标是瞄准 2022 年量产基于小魔盒 3.0 这一代计算平台(基于高通 Snapdragon Ride)的算法。

除了感知智能,MANA 体系更进一步,强调认知智能。

因为感知仅仅是从传感器信号中重建客观世界,仅仅是车辆看到了什么,是基于规则的,比如红灯停、绿灯行。

而认知智能则是要学习人类驾驶的灵活模式,在面对不同红绿灯路口时,会有不一样的驾驶选择,比如自动驶入前车少的车道。

这样的认知智能建立在对其他交通参与者行为的理解和超时空的历史经验上,而不是那种机械式的基于规则的驾驶。

毫末智行通过 MANA 体系,会对特定场景下的驾驶行为进行研究,比如影响人类驾驶行为的细节很多,宏观上包括了天气情况、道路结构、交通参与者、彼此方位、主车路线、碰撞风险和碰撞时距等等。

基于这些研究,毫末智行会从已有的数据中挖掘和表达这些属性,然后再进行聚类和分类,最后找到一个安全、舒适、高效的驾驶解决方案,真正做到像人类司机一样驾驶,甚至比人类驾驶的选择更优。

是不是理解起来有些困难?举一个简单的驾驶场景为例。

跟车启停是我们开车时最常见的场景,如果我们把这个简单的场景拆开来看,其实我们有这样的心理变化:

比如在正常跟车的时候,我们只关注和前车的车距,并不担心;

当前车减速时,我们关注和前车的车距,也关心减速过程中的体感怎么样;

当前车刹停的时候,我们关心刹停后与前车的车距以及刹停时的体感;

当前车起步时,我们会关注启动的时机以及起步的体感。

面对这个简单场景,有些激进的司机制动和加速都很猛,体验很不好;有些温和的司机则在启停的时候平缓一些。

当我们的自动驾驶系统同时学习到这两类人的跟车启停的驾驶操作后,再生成一种更为优秀的驾驶操作,既保证通行效率有兼顾乘坐体感。

在 MANA 体系中,这些在相似场景中不同的驾驶行为都会被数字化,毫末智行的自动驾驶算法通过不断的学习和训练,能形成面对不同驾驶场景时、做出最合理驾驶操作的能力。

这就是 MANA 认知智能的神奇之处,真正做到像人类驾驶甚至超越人类驾驶,而不是木讷的机器人驾驶。

前文我们已经提及 MANA 数据智能体系可以帮助自动驾驶的迭代能以低成本、高效率的方式进行。

而要做到低成本、高效率,最核心的还是要归功于数据的自动筛选和标注。

这里就要提到 MANA 体系的另一大能力:自动化数据处理

按照毫末智行的说法,如果 3 年后其自动辅助驾驶系统的装车量达到 100 万,那么其要收集的数据将是海量的。

如果要靠着人工来进行数据标注,而且还要保证标注的元素足够丰富和不错的精度,那就意味着极高的成本。对于一家创业公司来说,显然是不经济和不现实的。

所以毫末智行和做用户产品一样,建立了一整套高效的自动化标注系统。毫末智行相关技术负责人透露,其大部分车道线都是自动标注完成的。

而且,自动驾驶数据也不是越多越好,核心的是要从这些数据中找到真正高价值的东西,而不是盲目地去标注和训练。

比如,在 MANA 体系中,毫末智行团队花了大量时间做了一个数据筛选系统 LUCASView,而且有专门的算法团队维护。

LUCASView 要做的工作就是自动化地从每天海量的数据里找到高价值的那批数据,这个降维的比例在几千级别。

比如今天拿到一个亿的数据,可能只找出两万,其他数据当前阶段没有价值。但是这些数据会存着,可能下一次又有价值。

找出了有价值的数据之后,再进行自动化的数据标准,这样,整体的成本会降低,效率会提高。

类似的数据处理自动化能力,在 MANA 体系里还有很多。

除了在现实世界中进行测试,并且推动量产乘用车上路,以此来收集行驶数据,毫末智行在自动驾驶算法的验证方面,也引入了仿真测试系统,对很多的测试场景进行 1:1 的完全还原,形成自动驾驶仿真「元宇宙」,对算法进行快速迭代。

除了感知智能、认知智能、数据自动化处理能力、仿真系统,此次毫末智行 AI Day 还宣布,将筹建他们自己的超算中心。

因为智能汽车的发展,让人类存储的数据类型发生了结构性转变,对计算的要求将发生改变,更看重深度学习的计算能力,更看重数据传输的带宽,会更看重数据搬运的效率。

而且,毫末智行现在所使用的 Transformer 深度学习大模型会随着数据的增加,消耗越来越多的计算资源。

所以,一个强有力的计算中心不可或缺,其实这与特斯拉自研 Dojo 超算中心是一个目的。

那就是形成更强大的数据处理能力,以此来推动自动驾驶算法的高效迭代。

3、毫末智行城市版 NOH 呼之欲出

依靠着「数据智能」的驱动,毫末智行 2021 年已经取得了不俗的自动驾驶技术研发进展以及量产落地成果。

毫末智行的高速场景导航辅助驾驶系统 NOH 在今年 10 月发布,今年广州车展已经在长城魏牌摩卡上量产上市,成为燃油车具备该类功能的「全球第一车」,比新势力三强的理想汽车的导航辅助驾驶系统发布还要早。

而其城市场景的 NOH 也已经准备就绪。最近,毫末智行放出了一段城市 NOH 系统测试车一镜到底行驶的视频。

这段放出的视频中,一辆基于长城魏牌车型打造的自动驾驶原型车,在北京顺义的公开测试道路,进行了一段 11 公里的路跑,全程用时 34 分钟,途经了 24 个路口、27 个人行横道、5 个无保护人行横道、22 个红绿灯、2 个四岔环岛,行驶环境很复杂,而且做到了全程无接管。

这辆测试车进行的操作包括了驶过红绿灯路口、路口无保护左转、进出环岛路口、避让路口加塞车辆、避让调头车辆、自动通过待转区、导航变道、避让横穿行人等城市典型场景,表现很是亮眼,让外界对其的期待值暴增。

根据毫末智行的规划,这套系统将在 2022 年 5 月正式搭载上市,基于高通的自动驾驶计算平台 Snapdragon Ride 打造的域控制器——小魔盒 3.0,配有两颗激光雷达、12 颗摄像头。

按照这个时间节点,毫末智行的城市级导航辅助驾驶系统很可能比小鹏汽车城市 NGP 的推出还要早。

这也意味着中国辅助驾驶的格局已经发生改变,「长城汽车+毫末智行」这对车企和自动驾驶技术公司的组合将是不可忽视的重要力量。

在城市版 NOH 系统量产后,毫末智行还将马不停蹄在 2022 年下半年交付全场景的 NOH 系统,打通高速场景+城市场景+泊车场景的自动驾驶能力,可能会成为中国市场第一家达成该成就的自动驾驶企业。

2022 年对于毫末智行来说至关重要。毫末智行董事长张凯表示,毫末智行将在 2022 年打响三场关键且意义重大的战役,分别是「数据智能的王者之战」、「辅助驾驶的场景决胜之战」和「末端无人配送解决方案的规模化之战」。张凯相信,2022 年毫末智行一定会打赢这三场战役,成为自动驾驶行业的领军者。

往后,毫末还有更大野心,在 2023 年,毫末智行的新产品 HSD(Haomo Self Driving),以及搭载 HSD 的车辆将开始服务用户。

从 HSD 这个命名来看,很明显就是对标特斯拉的 FSD。

这是一场自动驾驶系统量产的对决,一场中美两家企业的对决,也是一家估值 10 亿美金自动驾驶独角兽和市值万亿美金新车企的对决。

不论胜负,毫末智行走在了一条充满前景的道路上。

本文为汽车之心原创文章,作者:陈念航,如需转载,请联系授权。违规转载法律必究。
0

0

分享

好文章,需要你的鼓励

参与评论

相关评论(共0条)

Copyright ©2019-2024 深圳市卡尔之心信息科技有限公司 版权所有

备案号:粤ICP备19151757号