一图胜千言,阿里云视觉大数据智能计算实践

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 在2016云栖大会杭州峰会人工智能专场上,阿里云研究员、资深总监华先胜为大家带来了阿里云眼视觉大数据智能计算的实践经验。所谓“一图胜千言”,图像所包含的数据量非常之大,如何充分利用人工智能和大数据以及云计算的平台从海量的视频与图像信息中挖掘数据的价值呢?本文就为大家分享。

以下内容根据演讲PPT以及现场分享整理而成。


引言
在大数据世界里面,视觉大数据应该是量级最大的。之前讲的天文的数据量非常大的,但其实天文的数据也是天眼的数据,说到底还是视觉的数据。

视觉智能计算并不是只做简单地进行一些图像视频的处理,而是要通过人工智能和机器学习的方法在数据中去识别、搜索和挖掘其中的价值,使得数据的价值得以体现,让用户对于数据的使用体验更好。

生活中的各种监控以及直播很普及,一个城市可能有多达60万个摄像头,所以产生的视频数据确实非常多。那么该如何处理这么多的数据呢?如何才能发现我们需要的东西呢?

大家在日常生活中比方旅游时往往会拍摄很多图片以及视频,但是之后这些数据怎么办呢?怎么看?怎么查?怎么用?往往会成为一件非常麻烦的事情,那么技术能不能把这件事情做得更好呢?

当然在其他领域也有很多的图像视觉的东西,对于这些方面,我们可以用智能来实现比如疾病诊断、灾难报告、机械故障的检测以及体育比赛的解说等等,这些确实是实实在在的理性需求,这些需求向视觉智能提出了很多的挑战,同时也带来了很多的机会。

从个体角度而言,视觉智能可以分为个体智能和整体智能。对于个体智能,数据被处理的地方可能是云上或者是终端。一般而言,云上处理的计算复杂度比较高,而终端一般处理的计算复杂度比较低一些。而整体智能则不会只关注一个单点的数据,需要看很多数据一起才能出决策,这一部分在终端上是难以完成的,除非未来端到端的通讯达到无缝的状态。整体智能的意思就是我们拿到的是一个整体的大规模的视频数据,通过这些数据的协同,以及整合到一起才能得出结论并做出决策,比如对于交通灯的控制以及其他决策等。

62a64267cf795cb20e3ac5478e0a287b74a981ae


云上视觉智能五要素
1.算法
2.平台,我们所需要处理的数据量是非常大的,所以背后必须有一个高效率的计算平台才能处理这些数据。
3.数据,数据是必须有的,现在的数据也会越来越多,而且在使用的过程中,数据也在源源不断地产生。
4.用户,用户一方面是数据和技术的使用者,另一方面也是数据的产生者。
5.商业,商业是事物的生命力,没有商业,事物的发展也不会长久。


一、视觉大数据技术和应用方向

视觉计算技术方向
在技术方向大概可以分为如下5个方向:
1.视频图像分析识别,简单而言就是“认”。
2.视觉搜索,也就是“找”。
3.视频图像生成,也就是“攒”。
4.视频大数据挖掘,也就是“挖”。

5.大规模视觉计算平台,也就是“台”,需要建立在通用平台之上的适用于视觉大数据的平台。

3f46e7d0f3b6e19e3bc44e0bb61ab77af7c4bd4a


视觉计算应用方向

在业务方向大概可以分为如下4个:
1.视频监控分析
2.图像视频搜索
3.视频数据生成
4.视觉数据挖掘

a11fdd546af471d9b08d5fa3daa69244e582154f


接下来进入案例的分享。阿里云将所有的视觉信息处理汇总到一起,产生了阿里云眼,这也是阿里云所有技术汇总的一个品牌。阿里云眼实际上也就是大数据平台上的一个智能视觉计算中心,承载云上广泛、深入的视频图像分析、识别、搜索、生成和挖掘服务。

0e58c3f4b4c6be58b6d2dab408fa73602a2817ba


二、阿里云眼应用实例

接下来从七个方面的应用进行分享。

1.城市之眼

顾名思义,城市之眼也就是城市的眼睛,什么意思呢?也就是把城市中产生的所有的视觉数据进行分析、识别以及索引,有了这些信息就可以产生很多有意思的功能,当然这些数据的分析都是由机器来完成的,所以大家不必担心数据隐私问题。

比如交通视频而言,有视频数据分析的技术在背后,可以根据视频对车辆进行检测、跟踪以及识别,基于此可以做很多很有意思的事情。

那么面对如此海量的由摄像头采集到的视频数据,该如何进行处理呢?其实在这背后必须要有大的计算平台进行支撑,而且这个平台需要适合于视觉数据处理,下图展现的就是基于ODPS或者现在称之为MaxCompute的阿里云离线计算平台,在此之上我们做了基于视觉计算的流程,使得其能够将大量的视频图像数据导入进来并进行高效处理。还有一些应用场景下,视频数据是实时的,比如像刚才提到的交通的数据。

f36268dbef8ad3ead0f543d63960973ecbc4b395

刚才提到的平台处理的是离线的数据,那么视频实时数据怎么处理呢?其实同样也会有相应的计算平台,在实时处理的时候除了数据量和系统的容错性还要有时间上的依赖性。这个平台就建立在StreamCompute这个平台上,可以来处理时间上的相关性,使得时间上流的计算变得比较方便也能够支持空间领域,多个摄像头之间的实时协同,所以在实际应用中可以既看时间点以前的数据,又能看摄像头周围的所有摄像头的数据,从而做出综合的决策。

d81722c3a8060b415716b36ae63a7ceecdf3da22

接下来分享一下城市之眼上的应用:禁左策略。禁左是因为车辆在左转的时候往往会挡住对面直行的车流,阻碍交通。所以禁左策略在一些情况下可以改善交通情况。但是给不该禁左呢?该如何去禁左呢?这些都不是简单的问题。可以通过实时的视频数据分析,给车辆的左转时间长短以及是否需要禁左,做出合理的决策。

e17478e6f3cdaef5639f3f4ad5b9d5753d548103

2.数字记忆

之前谈到的数据往往不是我们自己产生的,接下来分享的数据来源是我们自身。看一看在这里面能玩出什么名堂。

对于个人的数据,其实在阿里云的存储系统OSS上,视频数据和图像的数据都占了一半,所以数据量是非常大的。对于这部分数据该如何处理呢?有没有很好的技术、平台以及系统能够将这些数据重新唤醒。我们为什么要拍照呢,其实往往是为了留下体验和经历,希望和别人分享。若果我们能使用平台建立起容易分享和浏览、编辑的功能,这些数据就会被激活,同时还可能带来一些商业价值,比方说如何赏心悦目地加入广告。

要进行这样的处理,首先要进行打标签,我们图片的内容种类很多,这方面其实技术上比较困难。目前阿里云正在做一些配套的机制,使得我们几乎可以识别任何东西。任意的东西听起来比较悬,但是其实是有条件的,第一这个东西必须是视觉可以识别的,有一定视觉上的特征。第二是可以从互联网上找到训练数据。第三就是有这样的一套系统可以自动挖掘互联网上的数据建立模型,进行识别。

在分享时可以直接分享,也可以变化一下再分享,阿里云眼的风格画其实很好玩的,大家可以试试。

f88a5bfbd55543252606ec90b20a808d78c9cf4e

3.商品搜素

在日常生活中,我们在朋友圈往往会看到一些想买的商品,但是不知道具体是什么品牌,这时候就需要进行图片的商品搜索了。比方阿里的拍立淘就能解决这样的问题。

cc0d434929bd178532ea084ca5f750b5dc0b9c90

4.体育视频

体育视频其实是一个比较老的题目,之前曾经火过一段时间。随着近几年深度学习的兴起以及视频数据量的增加,体育视频再一次成为了热点。现在的视频分析要求具有自动性,比方说通过视频在球场上判断什么时候进球了,什么时候传球失误了等等。其应用就是在对视频打标以后可以产生视频集锦,以及对于个人数据进行分析,对于教练的训练也会有很大帮助。

b23300d6859c198a6b22fd0381723f3ebcc0d0ab

5.故障检测

故障检测其实分为机器的故障和人的故障,人的故障也就是对医学图像的处理。通过视频智能计算,之前需要上万人检测的机器故障,现在可以全部或者部分由机器检测。

d1c24d94606a8aa35a23367870fadaaf598e4b37

6.医学图像

对于医疗图像而言,则使用了基于深度学习的方法,也产生了很多的应用,比方说检测人体X光片中小于3nm的结节。


7.视频广告

讲到挖掘视频的商业价值,最好的方法就是广告。但是通常情况下,大家对于硬性的广告比较反感。其实完全可以将广告嵌入到场景中去,让用户感觉不到广告。

cfbced27f4f4d28ffb9c247f97c192ef9833094e


结语
阿里云眼利用视觉数据和视觉关联的数据进行视觉分析,进而构建媒体库、索引以及模型,之后在应用层提供各种能力。阿里云眼基于的平台都是阿里云已有的平台,依靠阿里云搭建各种技术与服务。

440d7ea2efb153dccdf7f82ceb1d6a3a229fcef9

最后回到最初讲的问题,一个成功的应用不仅仅是技术的运用,也需要算法、数据和用户以及平台。

1daf3bc3d23fef30625410ebb69ee5f9bf272636


欢迎加入MaxCompute钉钉群讨论 (官网链接):

767858daefd6375399d47bd5f941d07fe469a8ae

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
22天前
|
机器学习/深度学习 算法 搜索推荐
从理论到实践,Python算法复杂度分析一站式教程,助你轻松驾驭大数据挑战!
【10月更文挑战第4天】在大数据时代,算法效率至关重要。本文从理论入手,介绍时间复杂度和空间复杂度两个核心概念,并通过冒泡排序和快速排序的Python实现详细分析其复杂度。冒泡排序的时间复杂度为O(n^2),空间复杂度为O(1);快速排序平均时间复杂度为O(n log n),空间复杂度为O(log n)。文章还介绍了算法选择、分而治之及空间换时间等优化策略,帮助你在大数据挑战中游刃有余。
46 4
|
2月前
|
人工智能 分布式计算 DataWorks
连续四年!阿里云领跑中国公有云大数据平台
近日,国际数据公司(IDC)发布《中国大数据平台市场份额,2023:数智融合时代的真正到来》报告——2023年中国大数据平台公有云服务市场规模达72.2亿元人民币,其中阿里巴巴市场份额保持领先,占比达40.2%,连续四年排名第一。
164 12
|
2月前
|
人工智能 Cloud Native 数据管理
重磅升级,阿里云发布首个“Data+AI”驱动的一站式多模数据平台
阿里云发布首个AI多模数据管理平台DMS,助力业务决策提效10倍
244 17
|
2月前
|
SQL 人工智能 大数据
阿里云牵头起草!首个大数据批流融合国家标准发布
近日,国家市场监督管理总局、国家标准化管理委员会正式发布大数据领域首个批流融合国家标准GB/T 44216-2024《信息技术 大数据 批流融合计算技术要求》,该标准由阿里云牵头起草,并将于2025年2月1日起正式实施。
73 7
|
2月前
|
SQL 人工智能 大数据
首个大数据批流融合国家标准正式发布,阿里云为牵头起草单位!
近日,国家市场监督管理总局、国家标准化管理委员会正式发布大数据领域首个批流融合国家标准 GB/T 44216-2024《信息技术 大数据 批流融合计算技术要求》,该标准由阿里云牵头起草,并将于2025年2月1日起正式实施。
|
22天前
|
SQL 消息中间件 分布式计算
大数据-143 - ClickHouse 集群 SQL 超详细实践记录!(一)
大数据-143 - ClickHouse 集群 SQL 超详细实践记录!(一)
53 0
|
22天前
|
SQL 大数据
大数据-143 - ClickHouse 集群 SQL 超详细实践记录!(二)
大数据-143 - ClickHouse 集群 SQL 超详细实践记录!(二)
49 0
|
22天前
|
SQL 消息中间件 分布式计算
大数据-130 - Flink CEP 详解 - CEP开发流程 与 案例实践:恶意登录检测实现
大数据-130 - Flink CEP 详解 - CEP开发流程 与 案例实践:恶意登录检测实现
33 0
|
21天前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
22天前
|
分布式计算 关系型数据库 MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
大数据-88 Spark 集群 案例学习 Spark Scala 案例 SuperWordCount 计算结果数据写入MySQL
44 3

相关产品

  • 云原生大数据计算服务 MaxCompute