中国人工智能学会通讯——基于视频的行为识别技术 1.6 深度神经网络提高视频处理速度

简介:

1.6 深度神经网络提高视频处理速度

视频处理还有一个需要考虑的重要问 题——速度。视频的数据量很大,另一方 面很多视频的应用都有实时性要求,因此 这是一个很实际的问题。对前面介绍的深 度神经网络而言,速度的瓶颈在于计算光 流的时间。

为了解决这个问题,我们注意到有一 个很好的东西可以替代光流。我们知道 现在的视频数据大部分都是压缩,很少 有人会把不压缩的视频存储和传输,因 为数量太大了。视频压缩时会使用运动 向量 MotionVector,运动向量表示一些 具体图像块帧间的运动。这个虽然没有 像光流一样去描述像素级精细的运动信 息,但也提供了运动信息。运动向量的 好处在于,它是不需要额外计算的,在 视频解码过程中首先就要提取运动向量。

image

这就启发我们用运动向量替换光流, 以节约光流的运算时间。当然运动向量也 有它的问题,它代表一些区域运动不像光 流那么精细,看起来像马赛克。另外,它 对运动的描述并不准确,存在噪声。我们 发现直接利用运动向量来训练卷积神经网 络,识别性能会有很大的影响。

image

相比而言,光流训练处的神经网络性 能是很好的,这就启发我们把光流所学 知识或者特征迁移到运动向量神经网络 中。具体而言,我们设计了集中策略包 括模型的初始化、输出监督的迁移等。 通过这些方法,我们发现运动向量神经 网络识别率得到了很大的提升,它的学 习特征更强了。

另外,视频作为一种时间序列,启发 研究人员利用时序模型对视频进行建模。 深度递归神经网络 RNN 是一个非常有效的时序模型。如何利用 RNN 或 LSTM 进行 时序建模?可以先用卷积神经网络提取每 一帧的特征,然后把这个特征作为 LSTM 当前时刻的输入。递归神经网络可以很多 层,可以做双向的,这些都对识别率有帮助。

image

相关文章
|
7月前
|
机器学习/深度学习 人工智能 监控
上海拔俗AI软件定制:让技术真正为你所用,拔俗网络这样做
在上海,企业正通过AI软件定制破解通用化难题。该模式以业务场景为核心,量身打造智能解决方案,涵盖场景化模型开发、模块化架构设计与数据闭环优化三大技术维度,推动技术与业务深度融合,助力企业实现高效、可持续的数字化转型。
239 0
|
8月前
|
监控 前端开发 安全
Netty 高性能网络编程框架技术详解与实践指南
本文档全面介绍 Netty 高性能网络编程框架的核心概念、架构设计和实践应用。作为 Java 领域最优秀的 NIO 框架之一,Netty 提供了异步事件驱动的网络应用程序框架,用于快速开发可维护的高性能协议服务器和客户端。本文将深入探讨其 Reactor 模型、ChannelPipeline、编解码器、内存管理等核心机制,帮助开发者构建高性能的网络应用系统。
528 0
|
10月前
|
监控 算法 安全
基于 C# 基数树算法的网络屏幕监控敏感词检测技术研究
随着数字化办公和网络交互迅猛发展,网络屏幕监控成为信息安全的关键。基数树(Trie Tree)凭借高效的字符串处理能力,在敏感词检测中表现出色。结合C#语言,可构建高时效、高准确率的敏感词识别模块,提升网络安全防护能力。
239 2
|
12月前
|
机器学习/深度学习 算法 PyTorch
Perforated Backpropagation:神经网络优化的创新技术及PyTorch使用指南
深度学习近年来在多个领域取得了显著进展,但其核心组件——人工神经元和反向传播算法自提出以来鲜有根本性突破。穿孔反向传播(Perforated Backpropagation)技术通过引入“树突”机制,模仿生物神经元的计算能力,实现了对传统神经元的增强。该技术利用基于协方差的损失函数训练树突节点,使其能够识别神经元分类中的异常模式,从而提升整体网络性能。实验表明,该方法不仅可提高模型精度(如BERT模型准确率提升3%-17%),还能实现高效模型压缩(参数减少44%而无性能损失)。这一革新为深度学习的基础构建模块带来了新的可能性,尤其适用于边缘设备和大规模模型优化场景。
459 16
Perforated Backpropagation:神经网络优化的创新技术及PyTorch使用指南
|
12月前
|
调度 Python
探索Python高级并发与网络编程技术。
可以看出,Python的高级并发和网络编程极具挑战,却也饱含乐趣。探索这些技术,你将会发现:它们好比是Python世界的海洋,有穿越风暴的波涛,也有寂静深海的奇妙。开始旅途,探索无尽可能吧!
283 15
|
12月前
|
监控 算法 JavaScript
基于 JavaScript 图算法的局域网网络访问控制模型构建及局域网禁止上网软件的技术实现路径研究
本文探讨局域网网络访问控制软件的技术框架,将其核心功能映射为图论模型,通过节点与边表示终端设备及访问关系。以JavaScript实现DFS算法,模拟访问权限判断,优化动态策略更新与多层级访问控制。结合流量监控数据,提升网络安全响应能力,为企业自主研发提供理论支持,推动智能化演进,助力数字化管理。
294 4
|
7月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
1704 73
|
8月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1493 84
|
7月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
723 30