硬纪元AI峰会前瞻:成像技术距离下一次颠覆还有多远?

简介:

在现实生活中,越来越多的行业用到了摄像头,像直播、监控等等,而在当下,因为某些物理原因,普通摄像头已经不能够满足行业发展的需求。

不论是成像技术,亦或是三维感知,其实都属于深度感知的范畴。虽然目前市场对于深度感知技术的需求呈井喷状态,但是能够提供成熟产品和方案的公司却屈指可数,造成这一现象的核心原因就是技术门槛过高。

硬纪元AI峰会前瞻:成像技术距离下一次颠覆还有多远?

从三维感知的角度来看,AI人工智能主要分为感知和认知两个层面。

针对感知层而言,有一个里程碑事件是深度传感器的普及。2009年,微软Kinect 诞生是当时的一个大事件,是人工智能感知传感器中的革命性的里程碑,从此以后大家终于可以很方便和低成本地获取3D信息了;另外,计算机视觉长期存在两大难题:图像理解和三维重建。

一直以来,求解3D都是人们的梦想,最初它需要拍两张或多张照片,费很大的劲儿来重建。但今天有了sensor,人们直接可以测量3D,它一下就开启了今天和未来的很多应用。

但是,Kinect V2是基于连续波间相法的ToF(Time-of-Flight)深度相机,它存在不能抗阳光,不能远距离工作的缺陷。而另一种获取三维数据的方式是通过机械扫描式激光雷达,但它同样存在无法解决的缺陷:产能受限成本高、数据稀疏空间分辨率低,限制了它们的应用范围。

深度感知现有的三种解决方案

现阶段常见的深度感知解决方案,主要依靠深度摄像头,在获取平面图像之外,还可以获取图像中的深度信息,比如说三维的位置以及尺寸等信息,这也就让计算机获得了环境和对象的三维立体数据。

硬纪元AI峰会前瞻:成像技术距离下一次颠覆还有多远?

从技术角度来细分的话,深度感知摄像头目前有如下三种解决方案:

结构光:目前应用最广泛的深度感知方案,基本原理是由结构光投射器向被测物体表面投射可控制的光点、光条或光面结构,并由图像传感器获得图像,通过系统几何关系,利用三角原理计算得到物体的三维坐标。上文中提到的Kinect 1代就是使用的这项技术。

双目视觉:只需安装两个摄像头,利用双目立体视觉成像原理,通过两个摄像机来提取包括三维位置在内的信息进行深度感知。因为没有涉及光学系统,所以双目视觉解决方案的成本较低,但是该项技术对于硬件设备的要求又相对较高。

ToF:飞行时间(Time of Flight)技术的缩写,基本原理是传感器发出经调制的近红外光,遇物体后反射,传感器通过计算光线发射和反射时间差或相位差,来换算被拍摄景物的距离,以产生深度信息,此外再结合传统的相机拍摄,就能将物体的三维轮廓以不同颜色代表不同距离的地形图方式呈现出来。ToF是受环境影响最小的技术,不过由于其分辨率不高,所以并不适用于高精度需求的应用场景。

三维感知技术对于AI的革命性推动及应用

目前全球范围内感知深度的ToF传感器有很多种,其中以光珀智能科技的ToF传感器最具代表性。

杭州光珀智能科技有限公司(以下简称“光珀”)主要专注于全球新一代ToF传感器技术的研发。光珀在基于PCT的专利保护下提出原理创新,使得他们的ToF传感器和传统的ToF深度相机(基于连续波间相法)相比,其远距离及抗阳光的特性更类似传统意义上的激光雷达。同时也解决了机械扫描式激光雷达产能受限成本高、数据稀疏空间分辨率低的两大缺陷。

光珀智能CEO白云峰介绍说:“目前,我们已经推出了‘光珀第一代ToF传感器芯片’,并由此构建了三个固态面阵激光雷达技术平台,分别满足不同距离下(近、中、远)、强阳光下(100Klux)、大场景(70⁰)、高精度(<1%)、高空间分辨率(0.06⁰H)等三维感知需求。这三个技术平台可以服务于智能安防、机器人的导航与避障、无人驾驶的环境感知。特别是在无人驾驶领域,光珀的传感器满足了量产无人车对激光雷达低成本、高空间分辨率的两大需要。

“光珀正和科研院校联手创建大场景下的稠密三维数据集。而我们相信,这样的数据集会对未来人工智能的发展有着革命性的推动作用。”

深度感知领域还能有哪些突破?

现阶段的深度感知技术还处于前期,虽然在硬件性能和算法程序上已经有所突破,但是依然面临诸多限制,这也导致了很多应用场景还处于商业化探索阶段。那么,对于深度感知领域,还能有哪些突破?

硬纪元AI峰会前瞻:成像技术距离下一次颠覆还有多远?

如果你想得到答案,就一定不要错过镁客网7月9日在北京国家会议中心举办的“3E“硬纪元”AI+产业应用创新峰会”,峰会期间将会有众多人工智能、深度感知领域的大咖,分享他们的最新见解与洞察。所以,你还在犹豫什么,赶紧点击链接报名参加吧!


原文发布时间: 2017-07-03 17:42
本文作者: JOKER
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
相关文章
|
23天前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术深度解析:从基础到应用的全面介绍
人工智能(AI)技术的迅猛发展,正在深刻改变着我们的生活和工作方式。从自然语言处理(NLP)到机器学习,从神经网络到大型语言模型(LLM),AI技术的每一次进步都带来了前所未有的机遇和挑战。本文将从背景、历史、业务场景、Python代码示例、流程图以及如何上手等多个方面,对AI技术中的关键组件进行深度解析,为读者呈现一个全面而深入的AI技术世界。
100 10
|
16天前
|
机器学习/深度学习 人工智能 物联网
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
12月14日,由中国软件行业校园招聘与实习公共服务平台携手魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·湖南大学站圆满结营。
AI赋能大学计划·大模型技术与应用实战学生训练营——湖南大学站圆满结营
|
8天前
|
数据采集 人工智能 运维
从企业级 RAG 到 AI Assistant,阿里云Elasticsearch AI 搜索技术实践
本文介绍了阿里云 Elasticsearch 推出的创新型 AI 搜索方案
106 3
从企业级 RAG 到 AI Assistant,阿里云Elasticsearch AI 搜索技术实践
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
AI写作新时代:自然语言生成技术与写作助手的结合
AI写作新时代:自然语言生成技术与写作助手的结合
41 16
|
20天前
|
人工智能 安全 算法
深度剖析 打造大模型时代的可信AI:技术创新与安全治理并重
2024年12月11日,由中国计算机学会计算机视觉专委会主办的“打造大模型时代的可信AI”论坛在上海举行。论坛汇聚了来自多家知名学术机构和企业的顶尖专家,围绕AI的技术风险与治理挑战,探讨如何在大模型时代确保AI的安全性和可信度,推动技术创新与安全治理并行。论坛重点关注计算机视觉领域的最新进展,提出了多项技术手段和治理框架,为AI的健康发展提供了有力支持。
64 8
深度剖析 打造大模型时代的可信AI:技术创新与安全治理并重
|
1天前
|
存储 人工智能 监控
AI视频监控技术在公租房管理中的应用:提升监管精准度与效率
该AI视频监控系统具备1080P高清与夜视能力,采用深度学习技术实现高精度人脸识别(误识率1%),并支持实时预警功能,响应时间小于5秒。系统支持私有化部署,保障数据隐私安全,适用于大规模公租房社区管理,可容纳10万以上人脸库。基于开源架构和Docker镜像,一键部署简单快捷,确保24小时稳定运行,并提供详细的后台数据分析报表,助力政府决策。
|
20天前
|
机器学习/深度学习 人工智能 运维
阿里云技术公开课直播预告:基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot
阿里云技术公开课预告:Elastic和阿里云搜索技术专家将深入解读阿里云Elasticsearch Enterprise版的AI功能及其在实际应用。
125 2
阿里云技术公开课直播预告:基于阿里云 Elasticsearch 构建 AI 搜索和可观测 Chatbot
|
5天前
|
数据采集 人工智能 运维
从企业级 RAG 到 AI Assistant,阿里云Elasticsearch AI 搜索技术实践
本文介绍了阿里云 Elasticsearch 推出的创新型 AI 搜索方案。
|
28天前
|
机器学习/深度学习 人工智能 物联网
AI赋能大学计划·大模型技术与应用实战学生训练营——电子科技大学站圆满结营
12月05日,由中国软件行业校园招聘与实习公共服务平台携手阿里魔搭社区共同举办的AI赋能大学计划·大模型技术与产业趋势高校行AIGC项目实战营·电子科技大学站圆满结营。
AI赋能大学计划·大模型技术与应用实战学生训练营——电子科技大学站圆满结营
|
6天前
|
人工智能 供应链 安全
面向高效大模型推理的软硬协同加速技术 多元化 AI 硬件引入评测体系
本文介绍了AI硬件评测体系的三大核心方面:统一评测标准、平台化与工具化、多维度数据消费链路。通过标准化评测流程,涵盖硬件性能、模型推理和训练性能,确保评测结果客观透明。平台化实现资源管理与任务调度,支持大规模周期性评测;工具化则应对紧急场景,快速适配并生成报告。最后,多维度数据消费链路将评测数据结构化保存,服务于综合通用、特定业务及专业性能分析等场景,帮助用户更好地理解和使用AI硬件。
下一篇
开通oss服务