计算机视觉概述(二)

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
实时计算 Flink 版,5000CU*H 3个月
简介: 计算机视觉概述(二)

开发者学习笔记【阿里云人工智能工程师ACA认证(2023版):计算机视觉概述(二)

课程地址:https://edu.aliyun.com/course/3112108/lesson/19272

 

计算机视觉概述(二)


三、计算机视觉在行业中的典型应用


我们一起来了解一下计算机视觉在不同行业中的典型应用。

首先,让我们探讨计算机视觉在娱乐领域的应用。其中一个典型应用是智能审核网络视频内容。这个应用早在很早以前就开始了。当网站开始提供视频服务时,一些网站就已经开始整理视频内容,确保发布的内容经过筛选和审核。随着用户参与的增加,这些网站吸引了大量的用户。一些视频平台允许用户上传视频并分享,这在国内包括像优酷、土豆、爱奇艺等知名视频平台,以及一些国外的平台。如今很多人都喜欢把观看视频当作娱乐消遣的方式;优酷视频是中国领先的视频在线平台,提供PC端、移动端、车载端的视频制作、发布、观看、审核功能。

图片558.png

那这个就会给平台带来一些法律的风险,因为他要为这个视频的内容的审核上去负责。因为用户上传的视频有可能是不符合法律的。那可能里面有一些现有带有的设情的内容,可能有的是有暴力,或者是跟政治相关等等,反正就是不是以发布的,而不是以公开的。这种视频在这种用户量非常大的情况下,那它上传的视频的数量也是非常巨大。有可能他一天上涨的视频,可能他的审核的员工今年都审核不完。在面对这样叫海量的视频要进行审核的时候,它是不可能去无限的去加人力去审核的。这个时候一定是有计算机视觉的介入,那计算机视觉的。通过对这个视频的识别,它可能有一些方法,比如说抽取关键帧,然后对这个关键段进行一些判断,或者是付助的去去判断了。加快这个审核,可能是直接审核就完成了,可能是帮助这个管理员区审核这个内容。总的来说,这种智能的视频审核,他都能够把照有效的去缓解视频审平台的监管的巨大压力。没有这个基本的功能的话,这个现在目前的视频的平台都没有办法去运行了。


第二种应用我们在娱乐领域的是优化前端内容的开发和运营,能创造出更多的新玩法法,这些玩法有一些很有趣趣的,比如说我用过的就以图图的功能,就你想买一个什么东西,然后就拍照,拍照,然后用手机淘宝这种智能都找出来。你拍的那个东西还有比如说买明星星同同款就是那个边看,然后就可以把那固连接就推给你了。还有基于人体识别这种虚拟的探一,还有这个,像是商品的这种短视频,这种的生场上面的短视频等等,就很多种创新的东西都是基于视觉的,它可以提高软件用户的体验度和活跃度,就是他用起来会一更好用的,而且有一些是好玩的,好玩的和用户也有引起病的活跃,那他还会视频,还会为视频平台创造新的应用场景,视频平台里面有很多用到视据的东西,比如说刚才说的美颜滤镜。还有一些,比如说那个构图,然后自动的去更换背景等等,就有很多有趣的东西。

我们看一下计算机视觉在娱乐领域的实际案例。我们来看一下计算机卷在娱乐领域的是间力。现在很多的人都喜欢把观看视频当做娱乐小遣方式,大家应该都看过有边的一个流股。优酷视频优酷视品是中国领先的视频在线平台,它提供pc端啊,电视端,移动端,车载端的视频制的做发布,观看分享的功能啊。


优酷应该是最早一批财线视频平台之一,它于零六年上线,至今发展壮大。类似的视频平台也有很多,它们允许用户发布视频片段,但这些视频需要经过审核和监控,因为可能存在不良的视频制作者,他们出于吸引流量和获得利益的目的,可能会制作一些不恰当的视频内容。对于像优酷这样的平台,它有责任对这些视频进行审核。


然而,由于用户量非常庞大,每天上传的视频数量也巨大。如果每个视频都需要人工审查,那将需要大量的人力和物力,这是非常高昂的,甚至不切实际的。这时候就需要借助AI和计算机视觉技术。我们已经成功将人工智能技术应用于用户视频的审核中,通过计算机视觉实现了视频的全链路监控,包括流级别的视频流形势监控,法律合规性监控,以及播放并发情况监控等等。还能够进行节点流量的实时监控和自动化调度,以确保视频违规内容能够及时处理。在视频上传后,计算机视觉能够快速完成审核,如果发现违规内容,可以将视频稿件退回,这不仅降低了人力成本,还提高了服务质量和效率。这就是计算机视觉在娱乐领域的应用之一。


我们将探讨计算机视觉在营销领域的应用和作用。在视频电商购物销售中,计算机视觉可以用于挖掘和分析视频中潜在的广告投放机会。与直播销售不同,直播间通常是由平台主持的,里面讲的视频内容不一定是电影或电视剧,也可以是短视频等等。然而,在观众面前出现时,仍存在营销机会。这也是为什么在电影和电视节目中会有植入式广告的原因。例如,在电影中,明星可能使用某个手机品牌,品牌的Logo会出现在画面中,这就是一种广告,旨在将该品牌传达给观众,并让观众能够在视频中找到购买链接,从而进行购物。这种方式非常有效,但工作量很大。可以采用标签投放广告的方式来简化这一过程。


视频处理确实是复杂的任务。使用机器视觉和人工智能可以使这项工作更加高效。在视频平台上投放广告,可以使用挖掘技术分析视频中最适合放广告的地点和时间,这将带来巨大的商机和利润。一些视频平台已经开始采用这种技术,这是计算机视觉技术发展的新应用场景之一。

图片559.png

计算机视觉在营销领域的应用,天猫直播是阿里巴巴推出的消费类直播平台,涵盖母婴、美妆、美食、运动健身等领域。它利用计算机视觉技术来提供多样化的视频内容。它可以根据特定的广告素材进行定时投放控制,并识别广告中的文本和数字等变动内容,以吸引观众。此外,它还可以识别无意义的视频内容,从而提高运营管理的效率。天猫直播还引入了虚拟主播,这些虚拟主播不仅有情感和肢体语言,还具备市场价值等特征,这超越了纯粹的计算机视觉,涵盖了更多AI领域的内容。


本节回顾

通过本节的学习,我们学到了:

1、计算机视觉的背景知识

计算机视觉是一门研究如何使机器“看”的科学,终极目的是使得计算机能够像人一样"看懂世界”。

计算机视觉在图像处理、细微变化识别和图像运算上比人类有优势。

2、计算机视觉与人类视觉的关系

计算机视觉与人类视觉有着相似的结构

但是人类视觉具有对知觉的理解性,这是目前计算机视觉无法做到的

3、计算机视觉在行业中的典型应用

视频审核、智能营销等

相关文章
|
机器学习/深度学习 人工智能 监控
计算机视觉概述(一)
计算机视觉概述(一)
176 0
|
机器学习/深度学习 编解码 监控
计算机视觉概述:视觉任务+场景领域+发展历程+典型任务
比如下图,做到的不仅仅是检测到图像前景中有四个⼈、⼀条街道和⼏辆⻋。除了这些基本信息,⼈类还能够看出图像前景中的⼈正在⾛路,其中⼀⼈⾚脚,我们甚⾄知道他们是谁。我们可以理性地推断出图中⼈物没有被⻋撞击的危险,⽩⾊的⼤众汽⻋没有停好。⼈类还可以描述图中⼈物的穿着,不⽌是⾐服颜⾊,还有材质与纹理。⼈类能够理解和描述图像中的场景。
426 0
|
机器学习/深度学习 数据采集 编解码
【动手学计算机视觉】第十讲:传统目标检测之卷积神经网络概述
入门计算机视觉领域的绝大多数同学应该都学过或听说过斯坦福大学的公开课(CS231n: Convolutional Neural Networks for Visual Recognition),主要就围绕CNN进行展开,甚至很多近几年入门计算机视觉的同学就斩钉截铁的认为,计算机视觉就是卷积神经网络,我认为这有一些"一叶障目,不见泰山的"感觉。CNN是计算机视觉的一个子集,而且是一个很小的子集,更确切的说,计算机视觉是一种应用性技术,CNN是一种工具。本文就来介绍概述一下卷积神经网络,后续会挑选比较经典的模型详细展开并编程实现。入门计算机视觉领域的绝大多数同学应该都学过或听说过斯坦福大学的公开课
【动手学计算机视觉】第十讲:传统目标检测之卷积神经网络概述
|
8月前
|
机器学习/深度学习 计算机视觉
AIGC核心技术——计算机视觉(CV)预训练大模型
【1月更文挑战第13天】AIGC核心技术——计算机视觉(CV)预训练大模型
672 3
AIGC核心技术——计算机视觉(CV)预训练大模型
|
机器学习/深度学习 PyTorch 算法框架/工具
Azure 机器学习 - 使用 ONNX 对来自 AutoML 的计算机视觉模型进行预测
Azure 机器学习 - 使用 ONNX 对来自 AutoML 的计算机视觉模型进行预测
137 0
|
4月前
|
人工智能 测试技术 API
AI计算机视觉笔记二十 九:yolov10竹签模型,自动数竹签
本文介绍了如何在AutoDL平台上搭建YOLOv10环境并进行竹签检测与计数。首先从官网下载YOLOv10源码并创建虚拟环境,安装依赖库。接着通过官方模型测试环境是否正常工作。然后下载自定义数据集并配置`mycoco128.yaml`文件,使用`yolo detect train`命令或Python代码进行训练。最后,通过命令行或API调用测试训练结果,并展示竹签计数功能。如需转载,请注明原文出处。
|
4月前
|
人工智能 测试技术 PyTorch
AI计算机视觉笔记二十四:YOLOP 训练+测试+模型评估
本文介绍了通过正点原子的ATK-3568了解并实现YOLOP(You Only Look Once for Panoptic Driving Perception)的过程,包括训练、测试、转换为ONNX格式及在ONNX Runtime上的部署。YOLOP由华中科技大学团队于2021年发布,可在Jetson TX2上达到23FPS,实现了目标检测、可行驶区域分割和车道线检测的多任务学习。文章详细记录了环境搭建、训练数据准备、模型转换和测试等步骤,并解决了ONNX转换过程中的问题。
|
6月前
|
自然语言处理 监控 自动驾驶
大模型在自然语言处理(NLP)、计算机视觉(CV)和多模态模型等领域应用最广
【7月更文挑战第26天】大模型在自然语言处理(NLP)、计算机视觉(CV)和多模态模型等领域应用最广
296 11
|
8月前
|
机器学习/深度学习 编解码 人工智能
Vision Mamba:将Mamba应用于计算机视觉任务的新模型
Mamba是LLM的一种新架构,与Transformers等传统模型相比,它能够更有效地处理长序列。就像VIT一样现在已经有人将他应用到了计算机视觉领域,让我们来看看最近的这篇论文“Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Models,”
731 7