计算机视觉概述(二)

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
大数据开发治理平台 DataWorks,不限时长
实时数仓Hologres,5000CU*H 100GB 3个月
简介: 计算机视觉概述(二)

开发者学习笔记【阿里云人工智能工程师ACA认证(2023版):计算机视觉概述(二)

课程地址:https://edu.aliyun.com/course/3112108/lesson/19272

 

计算机视觉概述(二)


三、计算机视觉在行业中的典型应用


我们一起来了解一下计算机视觉在不同行业中的典型应用。

首先,让我们探讨计算机视觉在娱乐领域的应用。其中一个典型应用是智能审核网络视频内容。这个应用早在很早以前就开始了。当网站开始提供视频服务时,一些网站就已经开始整理视频内容,确保发布的内容经过筛选和审核。随着用户参与的增加,这些网站吸引了大量的用户。一些视频平台允许用户上传视频并分享,这在国内包括像优酷、土豆、爱奇艺等知名视频平台,以及一些国外的平台。如今很多人都喜欢把观看视频当作娱乐消遣的方式;优酷视频是中国领先的视频在线平台,提供PC端、移动端、车载端的视频制作、发布、观看、审核功能。

图片558.png

那这个就会给平台带来一些法律的风险,因为他要为这个视频的内容的审核上去负责。因为用户上传的视频有可能是不符合法律的。那可能里面有一些现有带有的设情的内容,可能有的是有暴力,或者是跟政治相关等等,反正就是不是以发布的,而不是以公开的。这种视频在这种用户量非常大的情况下,那它上传的视频的数量也是非常巨大。有可能他一天上涨的视频,可能他的审核的员工今年都审核不完。在面对这样叫海量的视频要进行审核的时候,它是不可能去无限的去加人力去审核的。这个时候一定是有计算机视觉的介入,那计算机视觉的。通过对这个视频的识别,它可能有一些方法,比如说抽取关键帧,然后对这个关键段进行一些判断,或者是付助的去去判断了。加快这个审核,可能是直接审核就完成了,可能是帮助这个管理员区审核这个内容。总的来说,这种智能的视频审核,他都能够把照有效的去缓解视频审平台的监管的巨大压力。没有这个基本的功能的话,这个现在目前的视频的平台都没有办法去运行了。


第二种应用我们在娱乐领域的是优化前端内容的开发和运营,能创造出更多的新玩法法,这些玩法有一些很有趣趣的,比如说我用过的就以图图的功能,就你想买一个什么东西,然后就拍照,拍照,然后用手机淘宝这种智能都找出来。你拍的那个东西还有比如说买明星星同同款就是那个边看,然后就可以把那固连接就推给你了。还有基于人体识别这种虚拟的探一,还有这个,像是商品的这种短视频,这种的生场上面的短视频等等,就很多种创新的东西都是基于视觉的,它可以提高软件用户的体验度和活跃度,就是他用起来会一更好用的,而且有一些是好玩的,好玩的和用户也有引起病的活跃,那他还会视频,还会为视频平台创造新的应用场景,视频平台里面有很多用到视据的东西,比如说刚才说的美颜滤镜。还有一些,比如说那个构图,然后自动的去更换背景等等,就有很多有趣的东西。

我们看一下计算机视觉在娱乐领域的实际案例。我们来看一下计算机卷在娱乐领域的是间力。现在很多的人都喜欢把观看视频当做娱乐小遣方式,大家应该都看过有边的一个流股。优酷视频优酷视品是中国领先的视频在线平台,它提供pc端啊,电视端,移动端,车载端的视频制的做发布,观看分享的功能啊。


优酷应该是最早一批财线视频平台之一,它于零六年上线,至今发展壮大。类似的视频平台也有很多,它们允许用户发布视频片段,但这些视频需要经过审核和监控,因为可能存在不良的视频制作者,他们出于吸引流量和获得利益的目的,可能会制作一些不恰当的视频内容。对于像优酷这样的平台,它有责任对这些视频进行审核。


然而,由于用户量非常庞大,每天上传的视频数量也巨大。如果每个视频都需要人工审查,那将需要大量的人力和物力,这是非常高昂的,甚至不切实际的。这时候就需要借助AI和计算机视觉技术。我们已经成功将人工智能技术应用于用户视频的审核中,通过计算机视觉实现了视频的全链路监控,包括流级别的视频流形势监控,法律合规性监控,以及播放并发情况监控等等。还能够进行节点流量的实时监控和自动化调度,以确保视频违规内容能够及时处理。在视频上传后,计算机视觉能够快速完成审核,如果发现违规内容,可以将视频稿件退回,这不仅降低了人力成本,还提高了服务质量和效率。这就是计算机视觉在娱乐领域的应用之一。


我们将探讨计算机视觉在营销领域的应用和作用。在视频电商购物销售中,计算机视觉可以用于挖掘和分析视频中潜在的广告投放机会。与直播销售不同,直播间通常是由平台主持的,里面讲的视频内容不一定是电影或电视剧,也可以是短视频等等。然而,在观众面前出现时,仍存在营销机会。这也是为什么在电影和电视节目中会有植入式广告的原因。例如,在电影中,明星可能使用某个手机品牌,品牌的Logo会出现在画面中,这就是一种广告,旨在将该品牌传达给观众,并让观众能够在视频中找到购买链接,从而进行购物。这种方式非常有效,但工作量很大。可以采用标签投放广告的方式来简化这一过程。


视频处理确实是复杂的任务。使用机器视觉和人工智能可以使这项工作更加高效。在视频平台上投放广告,可以使用挖掘技术分析视频中最适合放广告的地点和时间,这将带来巨大的商机和利润。一些视频平台已经开始采用这种技术,这是计算机视觉技术发展的新应用场景之一。

图片559.png

计算机视觉在营销领域的应用,天猫直播是阿里巴巴推出的消费类直播平台,涵盖母婴、美妆、美食、运动健身等领域。它利用计算机视觉技术来提供多样化的视频内容。它可以根据特定的广告素材进行定时投放控制,并识别广告中的文本和数字等变动内容,以吸引观众。此外,它还可以识别无意义的视频内容,从而提高运营管理的效率。天猫直播还引入了虚拟主播,这些虚拟主播不仅有情感和肢体语言,还具备市场价值等特征,这超越了纯粹的计算机视觉,涵盖了更多AI领域的内容。


本节回顾

通过本节的学习,我们学到了:

1、计算机视觉的背景知识

计算机视觉是一门研究如何使机器“看”的科学,终极目的是使得计算机能够像人一样"看懂世界”。

计算机视觉在图像处理、细微变化识别和图像运算上比人类有优势。

2、计算机视觉与人类视觉的关系

计算机视觉与人类视觉有着相似的结构

但是人类视觉具有对知觉的理解性,这是目前计算机视觉无法做到的

3、计算机视觉在行业中的典型应用

视频审核、智能营销等

相关文章
|
10月前
|
机器学习/深度学习 人工智能 监控
计算机视觉概述(一)
计算机视觉概述(一)
92 0
|
机器学习/深度学习 编解码 监控
计算机视觉概述:视觉任务+场景领域+发展历程+典型任务
比如下图,做到的不仅仅是检测到图像前景中有四个⼈、⼀条街道和⼏辆⻋。除了这些基本信息,⼈类还能够看出图像前景中的⼈正在⾛路,其中⼀⼈⾚脚,我们甚⾄知道他们是谁。我们可以理性地推断出图中⼈物没有被⻋撞击的危险,⽩⾊的⼤众汽⻋没有停好。⼈类还可以描述图中⼈物的穿着,不⽌是⾐服颜⾊,还有材质与纹理。⼈类能够理解和描述图像中的场景。
316 0
|
机器学习/深度学习 数据采集 编解码
【动手学计算机视觉】第十讲:传统目标检测之卷积神经网络概述
入门计算机视觉领域的绝大多数同学应该都学过或听说过斯坦福大学的公开课(CS231n: Convolutional Neural Networks for Visual Recognition),主要就围绕CNN进行展开,甚至很多近几年入门计算机视觉的同学就斩钉截铁的认为,计算机视觉就是卷积神经网络,我认为这有一些"一叶障目,不见泰山的"感觉。CNN是计算机视觉的一个子集,而且是一个很小的子集,更确切的说,计算机视觉是一种应用性技术,CNN是一种工具。本文就来介绍概述一下卷积神经网络,后续会挑选比较经典的模型详细展开并编程实现。入门计算机视觉领域的绝大多数同学应该都学过或听说过斯坦福大学的公开课
【动手学计算机视觉】第十讲:传统目标检测之卷积神经网络概述
|
2月前
|
机器学习/深度学习 计算机视觉
AIGC核心技术——计算机视觉(CV)预训练大模型
【1月更文挑战第13天】AIGC核心技术——计算机视觉(CV)预训练大模型
467 3
AIGC核心技术——计算机视觉(CV)预训练大模型
|
7月前
|
机器学习/深度学习 PyTorch 算法框架/工具
Azure 机器学习 - 使用 ONNX 对来自 AutoML 的计算机视觉模型进行预测
Azure 机器学习 - 使用 ONNX 对来自 AutoML 的计算机视觉模型进行预测
86 0
|
22天前
|
编解码 机器人 测试技术
2024年6月计算机视觉论文推荐:扩散模型、视觉语言模型、视频生成等
6月还有一周就要结束了,我们今天来总结2024年6月上半月发表的最重要的论文,重点介绍了计算机视觉领域的最新研究和进展。
56 8
|
13天前
|
机器学习/深度学习 人工智能 自然语言处理
计算机视觉借助深度学习实现了革命性进步,从图像分类到复杂场景理解,深度学习模型如CNN、RNN重塑了领域边界。
【7月更文挑战第2天】计算机视觉借助深度学习实现了革命性进步,从图像分类到复杂场景理解,深度学习模型如CNN、RNN重塑了领域边界。AlexNet开启新时代,后续模型不断优化,推动对象检测、语义分割、图像生成等领域发展。尽管面临数据隐私、模型解释性等挑战,深度学习已广泛应用于安防、医疗、零售和农业,预示着更智能、高效的未来,同时也强调了技术创新、伦理考量的重要性。
14 1
|
25天前
|
机器学习/深度学习 算法框架/工具 计算机视觉
ViT模型的出现标志着Transformer架构在计算机视觉中的成功应用
ViT模型的出现标志着Transformer架构在计算机视觉中的成功应用
36 2
|
2月前
|
编解码 边缘计算 自然语言处理
2024年5月计算机视觉论文推荐:包括扩散模型、视觉语言模型、图像编辑和生成、视频处理和生成以及图像识别等各个主题
五月发布的计算机视觉领域重要论文涵盖了扩散模型、视觉语言模型、图像生成与编辑及目标检测。亮点包括:1) Dual3D提出双模式推理策略,实现高效文本到3D图像生成;2) CAT3D利用多视图扩散模型创建3D场景,仅需少量图像;3) Hunyuan-DiT是多分辨率的中文理解扩散Transformer,可用于多模态对话和图像生成;4) 通过潜在扩散模型从EEG数据重建自然主义音乐,展示复杂音频重建潜力。此外,还有关于视觉语言模型和图像编辑的创新工作,如BlobGEN用于合成具有控制性的图像。
54 3