深度摄像头已过基础期 未来将掀起3D浪潮

简介:

众多前沿领域的应用将越来越依赖深度摄像头,就好像VR、机器人、安防等为了得到更精准的体验,这也是为什么国际巨头都在布局于此的原因。深度摄像头(又称3D传感器)从视觉数据获取的角度提升机器感知能力。由于其具有一定的技术门槛,国内外涉足此研发的比较少。集中在国外有苹果、微软、谷歌、INTEL、Oculus、SONY,国内奥比中光、华捷艾米,图漾,乐行天下等。目前,深度摄像头已经渡过技术基础期,方向明确了,将进入3-5年的成长期,未来将掀起3D传感器的浪潮。

  别被2D的背景虚化给骗了

3维视觉相比于2维视觉,多了一个维度,可以实现更加正确的物体分割,合适精度的三维测量,三维数据的模型重建以及智能视觉识别和分析。上海图漾信息科技有限公司徐韬解析,2维图像在复杂场景下由于缺少深度的信息无法正确分割物体。

一个例子是,以前荣耀出过一款双摄像头的手机,但并非用来做深度,仅是两个不同摄像头的集合,然后进行图像优化,效果是要把背景虚化,但这个其实是假的。它只是把背景模糊了一下,靠猜测背景和人是不一样的物体,这个和深度没有关系,也就是说还只是通过2D处理实现背景虚化,并非真正的3D。而目前智能视觉识别和分析大部分也仍用2D来做。

用3D做出的分割,去除背景和多物体分割都更精准。现在许多创业公司会利用微软kinect进行现场3D建模。同时利用3D图像进行面部识别的准确度更高。以上种种可以看出,3D视觉的确拥有巨大的优势。

3D传感器市场格局

之所以3D视觉还没有普及,因其技术不成熟且供应商仅少数几家企业。徐韬说,3D图像是在2D图像的基础上通过颜色渲染每一个点来代表不同的深度,深度图相对传统的平面图还有很大的提高空间。此外,由于多了一维,其数据处理却不只多一个数量级。在人工智能方面,如果用三维做分析,算法与计算量会有显著的增长,这就需要有新的处理方法来应对,在目前大部分还在用二维图形做处理的情形下,这也是一个挑战。

深度摄像头的三种主要技术方法和代表公司分别为:一是单目结构光,代表公司有苹果(收购最大的结构光技术公司PrimeSense)、微软Kinect-1、英特尔RealSense、GoogleProjectTango等,目前可见的其他创业公司几乎都沿用此技术路线。二是双目可见光,代表公司LeapMotion。三是飞行时间法(TOF),代表公司微软Kinect-2。

在国内,单目结构光供应商有奥比中光科技、华捷艾米软件,双目结构光方案有图漾科技,TOF方案的有乐行天下科技。此外,有两家上市公司也开始了内部研发项目。

不过,徐韬表示图漾的3D传感器技术更像是单目结构光和双目可见光两种技术的结合,可获得更高的图像质量,并且应用场景更广,同时知识产权更加干净。

“在光线不好的情况下,传统的单路结构光会有很大的问题,无法识别或者失效。而我们的产品可靠性更高,这一点在行业应用中占有优势。因为许多特定的行业对产品的可靠性要求非常高,有些竞品在多设备情况下存在互相干扰无法协同,而我们在多设备条件下能够协高工作。”徐韬说道。

最早是一些以色列的创业公司进行深度摄像头的研发,现在这些公司几乎都被科技界巨头收购。比如苹果收购PrineSense,这家公司是深度摄像头的民用化先锋。收购后,不再对外供货。微软使用PrineSense技术做出了Kinect一代,Kinect-2采用内部开发技术,趋于封闭生态。谷歌则不会成为一项产品或技术的供应商,而在于推动应用开发。同样Intel力推Realsense方案需搭配X86芯片使用。可以说巨头的深度摄像头都有为己所用的形态。徐韬认为,这种现状留给了深度摄像头创新型公司更大的市场空间,尤其在行业应用方面。

有望取代激光雷达引发机器人及VR内容应用革命

深度摄像头最知名的消费级应用是体感摄像头,如微软XBOX游戏机的体感摄像头Kinect。微软的HOLOLENSE也大量采用了深度摄像头。深度摄像头最热的领域是机器人,自动驾驶,AR/VR,智能安防,智能家居,消费娱乐等,它们对深度摄像头有着非常巨大的需求。

例如VR配备手势识别和动作识别时用视觉做更多的捕捉,而AR对深度摄像头的需求更大,因为要感知环境,与真实环境融合。联想TANGO手机用深度摄像头做AR应用,据悉已在小批量发货,主打行业应用。

未来,可以利用深度摄像头直接生成内容,无需其他处理或用电脑生成。这充分解决了现在缺少优质VR内容的短板,将带来民众直接拍摄的VR内容的激增。

智能安防领域,通过智能摄像头分析人的行为是否在有潜在危害,在金融行业颇有用途,但对算法要求非常高,到目前为止,还没有非常好的产品出现。

另外,用来做视觉导航在目前大热的领域包括机器人、无人机以及其他移动的场景,这是消费刚需。徐韬认为,现在机器人用激光雷达进行视觉导航,存在价格昂贵,信息缺失的问题。因为它只是在面上作扫描,获得的信息并不完整,导航作用有限。深度摄像头做视觉导航,被普遍认为是行业的发展方向。据介绍,目前已经有具备一定技术研发能力的机器人公司开始用图漾的3D传感器做视觉导航。

机器人的导航主要有无线定位、激光雷达、视觉导航、惯性导航以及超声波等方式。随着3D传感器的发展,视觉导航有望成为最主流的方式。“我认为视觉导航是终结且最好的解决方法,但目前深度摄像头还不成熟,因此激光雷达还有一定的空间,一旦3D传感器技术成熟,那么激光雷达在机器人导航领域可能被秒杀。”

再看看各方的动作,Intel正在推动深度摄像头在电脑中的普及,Google正在尝试深度摄像头与平板的结合。此外手机公司对深度摄像头小型化开始关注,创业公司则投入在硬件与移动设备的结合,利用深度测量能力的应用开发的创新。

深度摄像头是技术门槛非常高的行业,徐韬表示图漾在掌握自有技术的同时,定位在专业的深度摄像头供应商,针对不同行业推出不同版本,提供完整的技术支持做定制化方案。由于具备了一定的优势,也受到了资本市场的认可。随着巨头的积极布局以及技术的逐渐成熟,还有3-5年的技术爆发期,目前是一个很好的时间窗口。

本文转自d1net(转载)

相关文章
|
3月前
|
人工智能 边缘计算 自然语言处理
麦芒30全新绽放,中国电信勾勒出AI手机的新方向
2024年,AI手机迎来爆发,高通CEO称其为关键元年。各品牌如三星、华为、OPPO、小米及苹果纷纷涉足。中国电信发布首款AI手机麦芒30 5G,搭载星辰大模型,提供智能问答、语音转写等服务。市场预期AI手机销量将显著增长,但消费者是否买单仍取决于实际体验。麦芒30 5G针对年轻人提供AI集成的个性化体验,如多方言识别、智慧应用及AI增强的云盘服务。中国电信的运营商背景为其带来差异化优势,结合AI+战略和云网融合,有望重塑市场格局。生成式AI正改变行业,运营商的加入加剧竞争,智能手机市场或将迎来重大变革。
|
机器学习/深度学习 人工智能 编解码
忆海原识发布类脑计算平台,下一代AI突破口到来!(1)
忆海原识发布类脑计算平台,下一代AI突破口到来!
156 0
|
机器学习/深度学习 人工智能 算法
忆海原识发布类脑计算平台,下一代AI突破口到来!(2)
忆海原识发布类脑计算平台,下一代AI突破口到来!
148 0
|
人工智能 供应链 物联网
AI大模型来袭,智能家居迎新拐点?
AI大模型来袭,智能家居迎新拐点?
214 0
|
机器学习/深度学习 人工智能 自动驾驶
忆海原识发布类脑计算平台,下一代AI突破口到来!
近日,在 2022 WAIC AI 开发者日上,忆海原识创始人兼 CEO 任化龙发表主题演讲《类脑计算的发展与关键技术》。演讲中,他夯实细致地介绍了类脑智能的特点以及与传统技术的对比,以及忆海原识自主研发的 Ocean 类脑计算平台。
446 0
忆海原识发布类脑计算平台,下一代AI突破口到来!
|
新零售 编解码 人工智能
上海交大牵手淘宝成立媒体计算实验室:推动视频超分等关键技术发展
7月27日,上海交通大学电子信息与电气工程学院与阿里巴巴集团大淘宝技术宣布达成战略合作,共同成立上海交通大学电子信息与电气工程学院-淘宝(中国)软件有限公司媒体计算联合实验室(下称”联合实验室”)。该联合实验室是为了更好地探索未来媒体时代的极致体验,通过创新和产业结合,推动行业发展。
258 0
上海交大牵手淘宝成立媒体计算实验室:推动视频超分等关键技术发展
|
存储 JSON 运维
漫步云端,世相科技正在引领新媒体时代的潮水方向
漫步云端,世相科技正在引领新媒体时代的潮水方向。阿里云正在携手越来越多的新媒体客户,一道致力于简化基础设施与架构,提升更优的行业竞争力。
164 0
漫步云端,世相科技正在引领新媒体时代的潮水方向
|
机器学习/深度学习 存储 传感器
魔都升级!商汤SenseCore AI大装置亮相,实现物理世界全面数字化转型
这两天的上海来了一位重量级选手,它有个绰号「AI粒子对撞机」!作为AI界「基础设施型」选手,一亮相就带来了「真刀实枪」!
228 0
魔都升级!商汤SenseCore AI大装置亮相,实现物理世界全面数字化转型
|
机器学习/深度学习 人工智能 达摩院
从AI解决风光电并网难题到硅光芯片,达摩院发布2022十大科技趋势!
从AI解决风光电并网难题到硅光芯片,达摩院发布2022十大科技趋势!
197 0
从AI解决风光电并网难题到硅光芯片,达摩院发布2022十大科技趋势!
「镁客·请讲」酷哇机器人刘力源:主打低速自动驾驶场景,AI环卫需求正在急速增长
作为创业公司,得首先保证自己活下去,也就是找到一个中间的商业化落地场景。
615 0