在现实生活中,越来越多的行业用到了摄像头,像直播、监控等等,而在当下,因为某些物理原因,普通摄像头已经不能够满足行业发展的需求。
不论是成像技术,亦或是三维感知,其实都属于深度感知的范畴。虽然目前市场对于深度感知技术的需求呈井喷状态,但是能够提供成熟产品和方案的公司却屈指可数,造成这一现象的核心原因就是技术门槛过高。
从三维感知的角度来看,AI人工智能主要分为感知和认知两个层面。
针对感知层而言,有一个里程碑事件是深度传感器的普及。2009年,微软Kinect 诞生是当时的一个大事件,是人工智能感知传感器中的革命性的里程碑,从此以后大家终于可以很方便和低成本地获取3D信息了;另外,计算机视觉长期存在两大难题:图像理解和三维重建。
一直以来,求解3D都是人们的梦想,最初它需要拍两张或多张照片,费很大的劲儿来重建。但今天有了sensor,人们直接可以测量3D,它一下就开启了今天和未来的很多应用。
但是,Kinect V2是基于连续波间相法的ToF(Time-of-Flight)深度相机,它存在不能抗阳光,不能远距离工作的缺陷。而另一种获取三维数据的方式是通过机械扫描式激光雷达,但它同样存在无法解决的缺陷:产能受限成本高、数据稀疏空间分辨率低,限制了它们的应用范围。
深度感知现有的三种解决方案
现阶段常见的深度感知解决方案,主要依靠深度摄像头,在获取平面图像之外,还可以获取图像中的深度信息,比如说三维的位置以及尺寸等信息,这也就让计算机获得了环境和对象的三维立体数据。
从技术角度来细分的话,深度感知摄像头目前有如下三种解决方案:
结构光:目前应用最广泛的深度感知方案,基本原理是由结构光投射器向被测物体表面投射可控制的光点、光条或光面结构,并由图像传感器获得图像,通过系统几何关系,利用三角原理计算得到物体的三维坐标。上文中提到的Kinect 1代就是使用的这项技术。
双目视觉:只需安装两个摄像头,利用双目立体视觉成像原理,通过两个摄像机来提取包括三维位置在内的信息进行深度感知。因为没有涉及光学系统,所以双目视觉解决方案的成本较低,但是该项技术对于硬件设备的要求又相对较高。
ToF:飞行时间(Time of Flight)技术的缩写,基本原理是传感器发出经调制的近红外光,遇物体后反射,传感器通过计算光线发射和反射时间差或相位差,来换算被拍摄景物的距离,以产生深度信息,此外再结合传统的相机拍摄,就能将物体的三维轮廓以不同颜色代表不同距离的地形图方式呈现出来。ToF是受环境影响最小的技术,不过由于其分辨率不高,所以并不适用于高精度需求的应用场景。
三维感知技术对于AI的革命性推动及应用
目前全球范围内感知深度的ToF传感器有很多种,其中以光珀智能科技的ToF传感器最具代表性。
杭州光珀智能科技有限公司(以下简称“光珀”)主要专注于全球新一代ToF传感器技术的研发。光珀在基于PCT的专利保护下提出原理创新,使得他们的ToF传感器和传统的ToF深度相机(基于连续波间相法)相比,其远距离及抗阳光的特性更类似传统意义上的激光雷达。同时也解决了机械扫描式激光雷达产能受限成本高、数据稀疏空间分辨率低的两大缺陷。
光珀智能CEO白云峰介绍说:“目前,我们已经推出了‘光珀第一代ToF传感器芯片’,并由此构建了三个固态面阵激光雷达技术平台,分别满足不同距离下(近、中、远)、强阳光下(100Klux)、大场景(70⁰)、高精度(<1%)、高空间分辨率(0.06⁰H)等三维感知需求。这三个技术平台可以服务于智能安防、机器人的导航与避障、无人驾驶的环境感知。特别是在无人驾驶领域,光珀的传感器满足了量产无人车对激光雷达低成本、高空间分辨率的两大需要。
“光珀正和科研院校联手创建大场景下的稠密三维数据集。而我们相信,这样的数据集会对未来人工智能的发展有着革命性的推动作用。”
深度感知领域还能有哪些突破?
现阶段的深度感知技术还处于前期,虽然在硬件性能和算法程序上已经有所突破,但是依然面临诸多限制,这也导致了很多应用场景还处于商业化探索阶段。那么,对于深度感知领域,还能有哪些突破?
如果你想得到答案,就一定不要错过镁客网7月9日在北京国家会议中心举办的“3E“硬纪元”AI+产业应用创新峰会”,峰会期间将会有众多人工智能、深度感知领域的大咖,分享他们的最新见解与洞察。所以,你还在犹豫什么,赶紧点击链接报名参加吧!