LSTM视频分类的深度学习——思路参考

简介: LSTM视频分类的深度学习——思路参考

设计思路


通过训练一个深层神经网络,直接从原始的 GelSight 视频回归硬度 使用一个卷积神经网络模型来表示 GelSight 视频的帧,使用一个递归神经网络模型来模拟凝胶变形随时间的变化。实验GelSight 在一个松散的控制条件下接触物体,并通过 GelSight 的触觉图像序列测量物体的硬度


1)Neural network神经网络设计


使用一个神经网络,映射一个图像序列到一个标量硬度值(测量Shore 00比例尺)。我们用卷积网络特征 φ (Ii)表示每个 GelSight 图像 Ii。对于这些,我们使用 VGG 体系结构的倒数第二层(fc7)。然后,我们使用带有长短期记忆单位的递归神经网络模型(LSTM)来模拟时间信息。在每一个时间步骤中,我们通过当前 LSTM 隐藏状态的一个仿射变换回溯它的输出硬度值:

image.png


其中 W 和 b 定义了隐藏状态 ht 的仿射变换,L使用当前映像根据以前的状态ht更新为ht-1(为简单起见,省略了LSTM 的隐藏单元状态)。预测指标为当前时间步长的硬度估计值。通过平均最后3帧的预测值来估计整个物体的硬度值。


在每帧的基础上进行回归,以增加视频的鲁棒性,其中压迫运动明显不同于那些训练集。在训练期间,我们减少损失,惩罚之间的差异预测和地面真实硬度值,使用胡伯损失。


image.png


图 2使用递归神经网络来映射由 GelSight 传感器记录的视频到硬度值。


这个网络类似于[25] : 图像使用 CNN 的特性 fc7从 vgg16网络,并提供给 LSTM 网络。网络输入是减去初始帧后的一个 GelSight 图像序列。特别是,从一个压入序列中均匀地选择5帧,每帧是一个压入阶段。只用最后3帧,即 y3,y4,y5的 RNN 输出来估计样品的硬度。


2)训练****


这个训练数据集包含了大约7000个视频(在不同的硅树脂样本上按压 GelSight),每个视频都是一个独立的按压序列。在训练过程中多次使用单个视频,采用不同的端点进行序列提取,从而包含了不同最大力的接触情况。


使用随机梯度下降训练模型,使用 ImageNet预训练初始化 CNN 权重,联合训练 CNN 和 LSTM。我们对算法进行了10,000次迭代的训练,学习速度为0.001,步长为1000。\


image.png

图 3  Gelsight大小25mmx25mm,厚度2.4mm。训练数据集主要包含基本对象形状(第1组) ,但也包含大量复杂形状或不良接触条件(第2组和第4组)。这些不规则的数据大大有助于防止模型的过度拟合。第五组是自然物体,可以粗略地感觉到它们是“软”、“非常软”或“硬”




相关文章
|
4月前
|
机器学习/深度学习 PyTorch 算法框架/工具
【从零开始学习深度学习】36. 门控循环神经网络之长短期记忆网络(LSTM)介绍、Pytorch实现LSTM并进行训练预测
【从零开始学习深度学习】36. 门控循环神经网络之长短期记忆网络(LSTM)介绍、Pytorch实现LSTM并进行训练预测
|
5月前
|
机器学习/深度学习 存储 算法
基于CNN+LSTM深度学习网络的时间序列预测matlab仿真,并对比CNN+GRU网络
该文介绍了使用MATLAB2022A进行时间序列预测的算法,结合CNN和RNN(LSTM或GRU)处理数据。CNN提取局部特征,RNN处理序列依赖。LSTM通过门控机制擅长长序列,GRU则更为简洁、高效。程序展示了训练损失、精度随epoch变化的曲线,并对训练及测试数据进行预测,评估预测误差。
|
5月前
|
机器学习/深度学习 传感器 数据可视化
MATLAB用深度学习长短期记忆 (LSTM) 神经网络对智能手机传感器时间序列数据进行分类
MATLAB用深度学习长短期记忆 (LSTM) 神经网络对智能手机传感器时间序列数据进行分类
MATLAB用深度学习长短期记忆 (LSTM) 神经网络对智能手机传感器时间序列数据进行分类
|
4月前
|
机器学习/深度学习 自然语言处理 前端开发
深度学习-[源码+数据集]基于LSTM神经网络黄金价格预测实战
深度学习-[源码+数据集]基于LSTM神经网络黄金价格预测实战
103 0
|
5月前
|
机器学习/深度学习 数据可视化 网络架构
Matlab用深度学习循环神经网络RNN长短期记忆LSTM进行波形时间序列数据预测
Matlab用深度学习循环神经网络RNN长短期记忆LSTM进行波形时间序列数据预测
|
5月前
|
机器学习/深度学习 自然语言处理 算法
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
|
5月前
|
机器学习/深度学习 编解码 算法
R语言用FNN-LSTM假近邻长短期记忆人工神经网络模型进行时间序列深度学习预测4个案例
R语言用FNN-LSTM假近邻长短期记忆人工神经网络模型进行时间序列深度学习预测4个案例
|
5月前
|
机器学习/深度学习 数据采集 并行计算
Matlab用深度学习长短期记忆(LSTM)神经网络对文本数据进行分类
Matlab用深度学习长短期记忆(LSTM)神经网络对文本数据进行分类
|
6天前
|
机器学习/深度学习 数据采集 自然语言处理
深度学习在自然语言处理中的应用与挑战
本文探讨了深度学习技术在自然语言处理(NLP)领域的应用,包括机器翻译、情感分析和文本生成等方面。同时,讨论了数据质量、模型复杂性和伦理问题等挑战,并提出了未来的研究方向和解决方案。通过综合分析,本文旨在为NLP领域的研究人员和从业者提供有价值的参考。
|
2天前
|
机器学习/深度学习 算法 算法框架/工具
深度学习在图像识别中的应用及代码示例
【9月更文挑战第32天】本文将深入探讨深度学习在图像识别领域的应用,包括其原理、技术、优势以及挑战。我们将通过一个简单的代码示例,展示如何使用深度学习技术进行图像识别。无论你是初学者还是有经验的开发者,都可以从中获得启发和帮助。让我们一起探索这个充满无限可能的领域吧!
16 8

热门文章

最新文章

下一篇
无影云桌面