扫地机器人视觉应用——测距识别 2020.11.6

 

目前应用在扫地机器人上的测距方式主要为2D测距和3D测距。3D测距离不开感光摄像头,所以也叫3D视觉测距,有的会附加识别功能。本文章属于科普原理介绍,让大家对目前的测距方式和原理有一个初步认识。

 

2D测距

01

主要使用三角测距雷达,TOF(Time of Flight,时间飞行法)雷达和超声波测距。原理如下图所示:

 

图片

原理解说:
1. 三角法测距的原理:激光器发射激光,在照射到物体后,反射光由线性CCD接收,由于激光器和探测器间隔了一段距离,所以依照光学路径,不同距离的物体将会成像在CCD上不同的位置。按照三角公式进行计算,就能推导出被测物体的距离。
 
2. TOF和超声波原理一致,也更简单:激光器或超声波发生器发射一个信号脉冲,并由计时器记录下出射的时间,反射信号经接收器接收,由计时器记录下回返的时间,两个时间相减即得到了信号的“飞行时间”。光速和音速是一定的,已知速度和时间就可以很容易计算出距离。
 

 

图片

 

TOF雷达相比于目前普及的三角测距雷达,体积小,精度高。其主要难点在于:
1. 首先是计时问题。在TOF方案中,距离测量依赖于时间的测量。由于光速太快,因此要获得精确的距离,对计时系统的要求也就变得很高。一个数据是,激光雷达要测量1cm的距离,对应的时间跨度约为65ps(65×10-12s)。
 
2. 其次是脉冲信号的处理。这里面又分两个部分:
a) 一个是激光的:三角雷达里对激光器驱动几乎没什么要求,因为测量依赖的激光回波的位置,所以只需要一个连续光出射就可以了。但是TOF却不行,不光要脉冲激光,而且质量还不能太差,目前TOF雷达的出射光脉宽都在几纳秒左右,上升沿更是要求越快越好,因此每家产品的激光驱动方案也是有高低之分的。
b) 另一个是接收器的。一般来说回波时刻鉴别其实是对上升沿时间的鉴别,因此在对回波信号处理时,必须保证信号尽量不要失真。另外,即便信号没有失真,由于回波信号不可能是一个理想的方波,因此在同一距离下对不同物体的测量也会导致前沿的变动。比如对同一位置的白纸和黑纸的测量,可能得到如下图的两个回波信号,而时间测量系统必须测出这两个前沿是同一时刻的(因为距离是同一距离),这就需要特别的处理。除此以外,接收端还面临着信号饱和、底噪处理等问题。

 

 

图片

 

TOF雷达的另一个重要的指标是线数。按线数分类的话常见的有单线,4线,16线,32线,64线等。
 
单束激光发射器在激光雷达内部进行匀速的旋转,每旋转一个小角度即发射一次激光,轮巡一定的角度后,就生成了一帧完整的数据。因此,单线激光雷达的数据可以看做是同一高度的一排点阵。单线激光雷达的数据缺少一个维度,只能描述线状信息,无法描述面,也就无法得到物体垂直于激光雷达发射平面的高度信息。多线雷达是目前自动驾驶最主要使用的雷达,但售价极高,一个64线的激光雷达售价可高达几万美元。
 
2D TOF由于性能好,价格高,主要应用于汽车自动驾驶领域,随着近年来国内TOF激光雷达厂商的崛起,TOF雷达的成本已经得到大幅的降低,国产TOF 激光雷达产品的价格相比于进口品牌,已经有相当大的竞争力。随着生产工艺的完善和出货量的进一步提升,TOF 雷达的成本可降到和三角雷达相近的水平。
三种2D测距方式的性能对比总结如下:

 

图片

 

 

 

3D视觉测距及避障

02

说到视觉就离不开摄像头,摄像头就是机器的眼睛。目前比较靠谱的3D视觉成像技术逐渐衍生出了三个方向:双目立体成像;3D结构光;3D TOF。其中双目视觉的代表公司有Leap Motion、Stereo Labs,以及大疆创新等;结构光解决方案的代表公司有奥比中光、苹果(PrimeSense)、微软(Kinect-1)、英特尔(RealSense),以及Mantis Vision等;ToF技术的代表公司有微软(Kinect-2)、pmd、索尼(SoftKinetic),以及一些智能手机厂商等。

 

图片

 

双目立体成像:
原理很容易理解,就是模拟人的眼睛,通过双目匹配,进行视差运算。摄像头能否拍摄清晰的图像,取决于环境的光线,过亮或过暗的光线都会造成识别上的困难。在漆黑的环境下会失效,为此还需要搭配专用的红外补光单元。而图像的质量问题是对算法性能的最大挑战。
3D结构光:
iPhone X是一款里程碑式的产品,它在手机领域首次实现了深度机器视觉技术,依靠“结构光技术”的硬件模组及算法,实现了对面部信息采集从2D到3D的进化。

 

 

上图三个部件的分工:点阵投影器会发射3万多个肉眼不可见的光点投影在人的脸部,绘制出三维建模的立体面谱,红外镜头则会读取这些点阵图案,并将信息发送到A11处理器的安全隔离区进行匹配对照,而泛光感应则是确保识别面部不受环境光线的影响。
 
与其他普及的基于摄像头和软件算法实现的识别方案相比,iPhone X通过结构光带来的Face ID,具备金融级别的安全等级,因此苹果才能让FaceID在解锁手机之外,还能用于购买应用以及支付Apple Pay。
 
目前结构光的深度测算精度高,但其应用的死穴是近距离,主要应用在识别及避障。受环境光线及工艺复杂性等的限制,后续还有很大拓展空间。
 
3D TOF:
ToF对环境光线的适应能力更强,识别距离可以达到10m,响应时间也更快,而且工艺难度也相对结构光低。因此,现在不少厂商更愿意选择3D ToF感测解决方案。
 
3D TOF的技术原理,就是通过驱动专用激光信号发生器,给目标连续发送光脉冲,然后用传感器接收从物体返回的光,最终通过探测光脉冲的飞行(往返)时间来计算得到目标物的距离。和结构光的点阵传感器相比,TOF技术在距离和精度上有了极大的改善。
 

图片

 

三种3D测距方案性能对比总结如下:

 

图片

 

机器感知是人工智能领域的重要组成部分,机器视觉作为感知的一个重要分支,从70年代麻省理工学院(MIT)人工智能实验室“机器视觉”课程的开设,到80年代,全球性机器视觉研究热潮开始兴起,出现了一些基于机器视觉的应用系统。90年代以后,随着计算机和半导体技术的飞速发展,机器视觉的理论和应用得到进一步发展,目前正处于不断突破、走向成熟的阶段。测距识别作为机器视觉的一个应用方向,未来会越来越深入。