计算机视觉的发展演进
我们可以轻松地在日常产品中找到计算机视觉技术的应用,从可以识别手势的游戏机到可以自动聚焦于人脸的智能手机摄像头。如今,计算机视觉正在影响我们生活的许多领域。
实际上,计算机视觉在商业和政府使用中已有悠久的历史。可以感测各种光谱范围内的光波的光学传感器已在许多应用中部署:像制造中的产品质量检测,用于环境管理的遥感或在战场上收集情报的高分辨率相机。这些传感器中的一些是固定的,而另一些则附着在移动的物体上,例如卫星、无人机和车辆。
过去,这些计算机视觉应用中有许多都限于某些封闭的平台。但是,当与IP连接技术结合使用时,它们会创建一套以前无法实现的新应用。计算机视觉,再加上IP连接性、高级数据分析和人工智能,将成为彼此的催化剂,从而引发物联网(IoT)创新和应用的革命性飞跃。
推动计算机视觉的多个领域的进步
专为视觉设计的环境
视力或视觉是人类五种感官中最发达的。我们每天都使用它来认识我们的朋友、发现前进道路上的障碍、完成任务并学习新事物。我们设计视觉环境的物理环境,有路标和信号灯可以帮助我们从一个地方到达另一个地方;商店有标牌来帮助我们找到它们;电脑和电视屏幕显示我们消费的信息和娱乐。考虑到视觉的重要性,将其扩展到计算机和自动化领域并不是一个大飞跃。
什么是计算机视觉?
计算机视觉始于捕获和存储图像或一组图像的技术,然后将这些图像转换为可以进一步作用的信息。它由多种技术共同组成(图1)。计算机视觉工程是一个跨学科领域,需要许多这些技术的跨功能和系统专业知识。
例如,Microsoft Kinect使用3D计算机图形算法来使计算机视觉能够分析和理解三维场景。它允许游戏开发人员将实时的全身运动捕捉与人工3D环境合并。除了游戏以外,这还在机器人技术、虚拟现实(VR)和增强现实(AR)应用等领域开辟了新的可能性。
传感器技术的进步也在许多方面超越了传统的相机传感器而迅速发展。最近的一些例子包括:
红外传感器和激光结合起来可感应深度和距离,这是自动驾驶汽车和3D映射应用的关键推动力之一
非侵入式传感器,无需物理接触即可跟踪医疗患者的生命体征
高频摄像头可以捕捉人眼无法察觉的细微动作,帮助运动员分析步态
超低功耗和低成本视觉传感器,可以长时间部署在任何地方
图1.由多个领域的进步推动的计算机视觉。图片来源:IFA
计算机视觉变得智能
早期应用
监控行业是图像处理技术和视频分析的较早采用者之一。视频分析是计算机视觉的一种特殊用例,其重点是从数小时的录像中查找模式。在现实世界中自动检测和识别预定义模式的能力代表着数百个用例的巨大市场机会。
首批视频分析工具使用手工算法来识别图像和视频中的特定功能。它们在实验室设置和模拟环境中都是准确的。但是,当输入数据(例如光照条件和摄像机视图)偏离设计假设时,性能会迅速下降。
研究人员和工程师花了很多年时间开发和调整算法,或者提出新的算法来应对不同的条件。但是,使用这些算法的摄像机或录像机仍然不够坚固。尽管这些年来取得了一些渐进的进步,但现实世界的糟糕表现限制了该技术的实用性和采用性。
深度学习突破
近年来,深度学习算法的出现重新激发了计算机视觉。深度学习使用模仿人类大脑神经元的人工神经网络(ANN)算法。
从2010年代初开始,通过图形处理单元(GPU)加速的计算机性能已经变得足够强大,足以让研究人员实现复杂的人工神经网络的功能。此外,部分地受视频站点和流行的IoT设备驱动,研究人员拥有庞大的视频和图像数据库来训练他们的神经网络。
2012年,一种称为卷积神经网络(CNN)的深度神经网络(DNN)版本在准确性上实现了巨大飞跃。这一发展带动了人们对计算机视觉工程领域的兴趣和兴奋。现在,在需要图像分类和面部识别的应用中,深度学习算法甚至超过了人类。更重要的是,就像人类一样,这些算法具有学习和适应不同条件的能力。
图2.场景的语义表示
随着深度学习的发展,我们正在进入认知技术的时代,其中计算机视觉和深度学习融合在一起,以解决人脑领域中的高级复杂问题(图2)。我们只是在探索一切可能的事物。随着更快的处理器,更先进的机器学习算法以及与边缘设备的更深入集成,这些系统将继续得到改善。计算机视觉将彻底改变物联网。
用例增加
其他有趣的用例包括:
运输基础设施管理(http://www.vivacitylabs.com/)
无人机检查(http://industrialskyworks.com/drone-inspections-services/)
下一代家庭安全摄像头(https://buddyguard.io/)
图3.从无人机收集的图像中的植被指数(来源:Emmetts,www.emmetts.com.au)
这些只是计算机视觉如何在许多领域极大地提高生产力的一些小例子。我们正在进入物联网发展的下一阶段。在第一阶段,我们专注于连接设备,聚合数据和构建大数据平台。在第二阶段,重点将转移到通过计算机视觉和深度学习等技术使“事物”更加智能,生成更多可操作的数据。
挑战
在让计算机视觉技术对大众更实用和更经济时,有许多问题需要克服:
嵌入式平台需要集成深度神经设计。由于功耗、成本、准确性和灵活性,很难做出设计决定。
业界需要标准化,以允许智能设备和系统相互通信并共享元数据。
系统不再是数据的被动收集器。他们需要以最少的人工干预就数据采取行动。他们需要自己学习和即兴创作。整个软件/固件更新过程在机器学习时代具有新的意义。
黑客可以利用计算机视觉和AI中的新安全漏洞。设计师需要考虑到这一点。
总结
在这篇文章中,我们简要介绍了计算机视觉以及它如何成为许多连接的设备和应用的关键组成部分。最重要的是,我们预测了该技术的爆炸式增长,并列举了实际应用中的一些障碍。在下一系列文章中,我们将探索新的框架,最佳实践和设计方法,以克服一些挑战。
原文链接:http://ai.qianjia.com/html/2020-09/04_370313.html
本文转载自千家网,本文一切观点和阿里云视觉智能开放平台无关
如果大家对视觉AI能力感兴趣,欢迎访问视觉智能开放平台进行AI能力的开通及调试。【点我一键开通】
阿里云视觉智能开放平台(vision.aliyun.com)是基于阿里巴巴视觉智能技术实践经验,面向视觉智能技术的开发与应用用户,为其提供好用、易用、普惠的视觉智能API服务,帮助企业和开发者快速建立视觉智能技术的应用能力的综合性视觉AI算法平台,目前已开放9大类目,120+种AI能力,平台95%以上的能力限时免费调用,别犹豫啦,快来体验吧!【0代码在线体验百种AI能力】