机器视觉算法怎样精准地实现对障碍物的识别

人类的交通环境非常复杂,机器必须学会「看懂」障碍物,才能做出有效的规避指令,保障驾驶过程安全顺利,算法想要良好的运转,当然离不开底层硬件的支持。
SLAM(同时定位与地图构建)作为基础技术之一,在自动驾驶、机器人、无人机等方面均有广泛应用,SLAM 中常用的有单目相机、双目相机、RGB-D 深度相机、激光雷达等等。
想要实现 SLAM 的「定位」和「地图构建」,需要机器对环境有三维感知,因此深度信息非常重要。而上文提到的众多类型的相机传感器就成为了机器的「眼睛」。
机器视觉算法怎样精准地实现对障碍物的识别

激光雷达通过发射和接受反射回来的激光束,获得距离、速度等信息;
机器视觉算法怎样精准地实现对障碍物的识别

单目摄像头需要对比机器在移动过程中拍摄到的图像变化,来判断与物体之间的距离;
机器视觉算法怎样精准地实现对障碍物的识别

双目摄像头更像人眼,可以通过两只眼睛看到图像的不同,直接获取深度信息;
机器视觉算法怎样精准地实现对障碍物的识别

RGB-D 由于配备了红外发射器和接收器,利用结构光方法就能直接获得周围环境的深度信息,我们也将它称为深度相机。
有了这些不同种类的「眼睛」,机器可以感知到周围的信息了,但如何「更精准的」实现对障碍物的识别呢?
答案是更多的传感器和更好的算法。
但一辆车需要考虑车辆整体设计的需要,使用场景、成本、车辆整体性等问题都要考虑,这时人们就需要多传感器融合技术(Sensor fusion)来解决问题。
传感器数据融合的定义可以概括为把分布在不同位置的多个同类或不同类传感器所提供的局部数据资源加以综合,采用计算机技术对其进行分析,消除多传感器信息之间可能存在的冗余和矛盾,加以互补,降低其不确实性,获得被测对象的一致性解释与描述,从而提高系统决策、规划、反应的快速性和正确性,使系统获得更充分的信息。 【机器视觉算法怎样精准地实现对障碍物的识别】 通过多传感器数据融合技术,将车辆中来自激光雷达、相机等不同传感器的数据进行融合,提高整体的识别效率和准确率。
例如特斯拉的 Autopilot 系统,搭配了 8 个摄像头,12 个超声波传感器以及前置雷达来提升车辆的感知能力,将这些传感器提供的实时数据很好的整合并进行计算,才能达到「自动辅助驾驶」的能力。
机器视觉算法怎样精准地实现对障碍物的识别

via Tesla 官网不过目前的自动驾驶系统还未达到「无人驾驶」的地步,即便是特斯拉也只能称自己为「自动辅助驾驶」,还是需要驾驶员坐在驾驶位,以便遇到突发情况时随时接管车辆。
BTW:关于 SLAM 的更多知识,欢迎来小知的专栏《知智一分钟》多了解一下~
KnowingAI知智:无处不在!超火的 SLAM 技术藏在哪儿?| 知智一分钟KnowingAI知智:想入门自动驾驶?超火的 SLAM 技术了解一下!|知智一分钟

■网友
道路上的障碍主要分为两类,一类主要指行人、车辆、交通标识等,另一类障碍物还包括石头、塑料袋等非常规物体的识别。
目前,MINIEYE的ADAS系统进行的是前者。MINIEYE的视觉算法将人与车进一步细分成了以下几个类别:
人:普通行人、打伞的人、骑车的人(骑自行车的人、骑电动车人、骑摩托人)
机器视觉算法怎样精准地实现对障碍物的识别


推荐阅读