原标题 马斯克:自动驾驶依靠激光雷达注定失利,专家表明不服
编译 Liam
8月13日报导在许多生产商着手研制自动驾驶轿车的大环境下,简直一切的轿车都运用了激光雷达,并用以打造一种传感器。这种传感器能够凭借雷达展现三维地图中车辆周围的状况。
可是特斯拉的首席执行官埃隆·马斯克却表明,这样的做法是过错的。
先有特斯拉于本年4月份举行展现活动,介绍其自动驾驶技能。马斯克在这次展会中表明,这些生产商终将抛弃激光雷达,由于任何运用激光雷达研制自动驾驶轿车的人都注定失利。
后有特斯拉人工智能专家Andrej Karpathy表明,激光雷达确实为研制供给了一条捷径,可是这种办法并没有考虑到一个基本问题,那便是视觉辨认在这傍边的重要性。这个办法带给他们一种前进的幻觉。
许多专家对该说法发出了质疑。
首要来自密歇根大学自动驾驶轿车试验场MCity的研讨员Greg McGuire就指出:从某种意义上来说,这些传感器都是一种依靠。作为工程师,他们便是这么做的,即发明依靠性。
McGuire还表明,只有当自动驾驶轿车真的十分安全牢靠时,它才干被社会所承受。想要到达高度的牢靠,就要坚持一个重要的准则——冗余。任何传感器终究都会失灵,但假如运用几种不同类型的传感器,那就能够下降由于某一个传感器发作毛病导致事端发作的或许性。
这以后,又有职业分析师(及前轿车工程师)Sam Abuelsamid表明,一旦你将这些理论技能用于实践,有许多未知数你是无法防止的。理论上,你或许能够仅凭相机来收集数据,但若要百分百信任体系的判别是正确的,最好是有其他正交传感方式的辅佐,例如像激光雷达这样的传感方式。
4月22日,就在特斯拉展现自动驾驶技能的同一天,康奈尔大学的三位研讨人员宣布了一篇研讨论文,部分支撑了马斯克关于激光雷达的说法。计算机科学家们只用了立体相机,终究在KITTI(一种抢手的自动驾驶体系图画辨认基准)上取得了突破性的效果。该项新技能功能远远优于之前的纯相机技能,而且和“相机+激光雷达”的调配比较也相差无几。
惋惜,媒体对该论文的报导混杂了研讨人员的实践发现。例如Gizmodo在报导中表明,这三名研讨人员的论文是关于轿车上摄像头的装置方位的,但实践上该论文并没有说到这一点,而Gizmodo也在研讨人员联络他之后,修改了他这篇报导。
想要恰当地了解这篇论文,咱们就需要了解软件是如何将原始的相机图画转换成有标识的三维模型,在地图上生动地展现轿车周边状况。在KITTI的测验中,假如该算法能够精准地辨认轿车周边的每一个方针,并用三维的框框将其标明出来,那么该算法就被认为是成功的。
一般软件处理这种测验分为以下两个过程。首要,软件经过某一算法运转图画,为图画的每个像素定一个间隔估计值。这能够经过一对相机和视差效应的原理来完成。研讨人员还研制了其他技能,运用单个相机来预算像素间隔。在这两种状况下,第二步便是经过高度估计值将像素分组,组成不同的方针(比方轿车、行人或自行车)。
康奈尔大学的研讨人员将每个立体图画对应的像素转换成由激光雷达传感器生成的三维点云(点云数据指的是:扫描材料以点的方式记载,每一个点包括有三维坐标,有些或许含有色彩信息或反射强度信息)。然后,研讨人员将点云数据输入到现有的方针辨认算法中。
三位研讨人员在其论文中表明,他们的办法在图画辨认才能上取得了巨大前进。例如,在KITTI测验的一个版别中,曾经纯相机收集数据的准确率最高为30%,而现在凭借他们的技能,准确率现已进步到66%。
换句话说,“相机+激光雷达”的方式比纯相机运用愈加精准,这和激光雷达丈量间隔时精度更高无关,其主要是由于激光雷达生成的“原生”数据格式刚好更简单让机器学习算法运用。
这篇论文的作者之一Kilian Weinberger指出,他们的论文写的是经过将根据相机的数据转换成激光雷达的点云数据,明显缩小两者之间的距离。
不过,Weinberger也清晰表明,激光雷达和非激光雷达之间仍有相当大的距离。在KITTI测验中,康奈尔大学的研讨人员将数据的准确率进步到了66%,但在运用相同算法的条件下,直接运用激光雷达生成的点云数据准确率高达86%。