行为检测(一)：openpose、LSTM、TSN、C3D等架构实现或者开源代码总结-阿里云开发者社区

行为检测(一)：openpose、LSTM、TSN、C3D等架构实现或者开源代码总结

2024-10-18 76

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 这篇文章总结了包括openpose、LSTM、TSN和C3D在内的几种行为检测架构的实现方法和开源代码资源。

openpose

一：PyTorch-Pose is a PyTorch implementation of the general pipeline for 2D single human pose estimation. The aim is to provide the interface of the training/inference/evaluation, and the dataloader with various data augmentation options for the most popular human pose databases (e.g., the MPII human pose, LSP and FLIC).

github链接：
https://github.com/bearpaw/pytorch-pose

LSTM

一：基于LSTM的行为识别

数据集：https://archive.ics.uci.edu/ml/machine-learning-databases/00240/
相关博客：点击这里

TSN

wo-stream 卷积网络对于长范围时间结构的建模无能为力，主要因为它仅仅操作一帧（空间网络）或者操作短片段中的单堆帧（时间网络），因此对时间上下文的访问是有限的。视频级框架TSN可以从整段视频中建模动作。和two-stream一样，TSN也是由空间流卷积网络和时间流卷积网络构成。但不同于two-stream采用单帧或者单堆帧，TSN使用从整个视频中稀疏地采样一系列短片段，每个片段都将给出其本身对于行为类别的初步预测，从这些片段的“共识”来得到视频级的预测结果。在学习过程中，通过迭代更新模型参数来优化视频级预测的损失值（loss value）。
数据集：UCF101：链接：https://gas.graviti.cn/dataset/hello-dataset/UCF101/download
代码链接：https://github.com/yjxiong/tsn-pytorch

C3D

通过3D卷积操作核去提取视频数据的时间核空间特征。这些3D特征提取器在空间和时间两个维度上操作，因此可以捕捉视频流的运动信息。然后基于3D卷积提取器构造一个3D卷积神经网络，这个架构可以从连续视频帧中产生多通道的信息，然后在每一个通道都分离地进行卷积和下采样操作。最后将所有通道的信息组合起来得到最终的特征描述。C3D网络将完整的视频作为输入，不依赖于任何处理，可以轻松扩展到大数据集。可以应用于行为识别，场景识别，视频相似度分析等领域。具有通用、紧凑、简单、高效的特点。
数据集：UCF101：链接：https://gas.graviti.cn/dataset/hello-dataset/UCF101/download
代码链接：https://github.com/Niki173/C3D
相关博客：https://blog.csdn.net/weixin_47349091/article/details/113484959

行为检测(一)：openpose、LSTM、TSN、C3D等架构实现或者开源代码总结

openpose

LSTM

TSN

C3D

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

行为检测(一)：openpose、LSTM、TSN、C3D等架构实现或者开源代码总结

openpose

LSTM

TSN

C3D

热门文章

最新文章

相关课程

相关电子书

相关实验场景