gesture识别模型部署

简介: gesture识别模型部署
(docker run -tdi  -p 59000:22 -p 59001:8888   --name guanjun1   --privileged=true registry.cn-hangzhou.aliyuncs.com/mkmk/jupyter:gestureguanjun init)&&(docker exec -d guanjun1 /bin/bash -c "cd /home/jupyterfiles && nohup /usr/local/python3/bin/jupyter notebook  --allow-root  &")

一、思路说明

本次比赛主要采用初级+次级模型的方法来进行训练与识别。初级模型有三个,其中两个是基于CNN的模型,另外一个是基于LightGBM的模型。在初级模型训练完成后,将其预测的概率作为次级模型的特征,用于训练次级模型以及生成最后的结果。具体模型的网络结果和特征可以阅读代码,其中有详细的注释。

二、训练过程

在训练时,首先调整好三个初级模型,其中包括做特征、调参等,尽量提升模型的预测精度。然后采用三个初级模型来生成次级模型的训练集特征和测试集特征(stacking集成用)。最后用生成的特征调试次级模型,并且生成最后的结果。


20191225114501576.png


该文件主要介绍source文件夹中的代码结构:

(1)model文件夹:用于存储训练好的模型文件,本次比赛每个模型都采用了10折交叉验证,每种模型对应有10个模型文件。由于LightGBM训练较快就未进行存储,只存储了两种CNN网络的训练模型。

(2)stacked feature文件夹:存储由初级模型生成的特征数据,本次比赛利用这些数据进行stacking集成。

(3)test文件夹:测试集文件。

(4)train文件夹:训练集文件。

(5)baseline_cnn_1.ipynb文件:初级模型1,基于CNN的模型。

(6)baseline_cnn_2.ipynb文件:初级模型2,基于CNN的模型。

(7)baseline_lightgbm.ipynb文件:初级模型3,基于LGB。

(8)stacking.ipynb文件:次级模型,基于神经网络。

(9)sub_cnn_1.csv:初级模型1生成的提交文件。

(10)sub_cnn_2.csv:初级模型2生成的提交文件。

(11)sub_lightgbm.csv:初级模型3生成的提交文件。

(12)sub_stacking.csv:次级模型生成的提交文件。

相关文章
|
9月前
|
人工智能 自然语言处理 异构计算
Stability AI发布基于稳定扩散的音频生成模型Stable Audio
近日Stability AI推出了一款名为Stable Audio的尖端生成模型,该模型可以根据用户提供的文本提示来创建音乐。
120 1
|
1月前
|
人工智能 开发者
AI Earth ——开发者模式案例5:鄱阳湖水体区域识别
AI Earth ——开发者模式案例5:鄱阳湖水体区域识别
48 6
|
1月前
|
语音技术
长音频集成模型的标点结果既依赖于语音识别也依赖于语音端点检测(VAD)
长音频集成模型的标点结果既依赖于语音识别也依赖于语音端点检测(VAD)【1月更文挑战第11天】【1月更文挑战第52篇】
48 1
|
机器学习/深度学习 API iOS开发
iOS MachineLearning 系列(17)—— 几个常用的对象识别 CoreML 模型
上一篇文章中,我们介绍了几个官方的图片分类的模型,图片分类模型的应用场景在于将图片中最主要的事物进行识别,在已有的词库中找到最可能得事物。而对象识别则要更高级一些。再之前的文章,我们介绍过可以使用官方提供的API来进行矩形识别,文本识别,二维码识别以及人脸识别等,这类识别功能的特点是我们不仅可以将图片中的物体位置和尺寸分析出来,还可以对其进行类别的分类。
278 0
|
人工智能 文字识别 API
iOS MachineLearning 系列(4)—— 静态图像分析之物体识别与分类
本系列的前几篇文件,详细了介绍了Vision框架中关于静态图片区域识别的内容。本篇文章,我们将着重介绍静态图片中物体的识别与分类。物体识别和分类也是Machine Learning领域重要的应用。通过大量的图片数据进行训练后,模型可以轻易的分析出图片的属性以及图片中物体的属性。
265 0
|
算法 API iOS开发
iOS MachineLearning 系列(3)—— 静态图像分析之区域识别
本系列的前一篇文章介绍了如何使用iOS中自带的API对图片中的矩形区域进行分析。在图像静态分析方面,矩形区域分析是非常基础的部分。API还提供了更多面向应用的分析能力,如文本区域分析,条形码二维码的分析,人脸区域分析,人体分析等。本篇文章主要介绍这些分析API的应用。
236 0
|
10月前
|
Ubuntu 机器人 定位技术
ros_gazebo/turtlebot3 室内仿真导航,提取camera/image和pose位姿真值,并将topic 时间同步对齐,最后制作成kitti 格式的数据集。
ros_gazebo/turtlebot3 室内仿真导航,提取camera/image和pose位姿真值,并将topic 时间同步对齐,最后制作成kitti 格式的数据集。
297 0
|
12月前
|
监控 安全
Video-LLaMa:利用多模态增强对视频内容理解
在数字时代,视频已经成为一种主要的内容形式。但是理解和解释视频内容是一项复杂的任务,不仅需要视觉和听觉信号的整合,还需要处理上下文的时间序列的能力。本文将重点介绍称为video - llama的多模态框架。Video-LLaMA旨在使LLM能够理解视频中的视觉和听觉内容。论文设计了两个分支,即视觉语言分支和音频语言分支,分别将视频帧和音频信号转换为与llm文本输入兼容的查询表示。
379 1
|
机器学习/深度学习 编解码 人工智能
无需新型token mixer就能SOTA:MetaFormer视觉基线模型开源,刷新ImageNet记录
无需新型token mixer就能SOTA:MetaFormer视觉基线模型开源,刷新ImageNet记录
175 0
|
机器学习/深度学习
InstructPix2Pix: 一种无需微调新的快速图像编辑方法
InstructPix2Pix: 一种无需微调新的快速图像编辑方法
158 0

热门文章

最新文章