gesture识别模型部署

简介: gesture识别模型部署
(docker run -tdi  -p 59000:22 -p 59001:8888   --name guanjun1   --privileged=true registry.cn-hangzhou.aliyuncs.com/mkmk/jupyter:gestureguanjun init)&&(docker exec -d guanjun1 /bin/bash -c "cd /home/jupyterfiles && nohup /usr/local/python3/bin/jupyter notebook  --allow-root  &")

一、思路说明

本次比赛主要采用初级+次级模型的方法来进行训练与识别。初级模型有三个,其中两个是基于CNN的模型,另外一个是基于LightGBM的模型。在初级模型训练完成后,将其预测的概率作为次级模型的特征,用于训练次级模型以及生成最后的结果。具体模型的网络结果和特征可以阅读代码,其中有详细的注释。

二、训练过程

在训练时,首先调整好三个初级模型,其中包括做特征、调参等,尽量提升模型的预测精度。然后采用三个初级模型来生成次级模型的训练集特征和测试集特征(stacking集成用)。最后用生成的特征调试次级模型,并且生成最后的结果。


20191225114501576.png


该文件主要介绍source文件夹中的代码结构:

(1)model文件夹:用于存储训练好的模型文件,本次比赛每个模型都采用了10折交叉验证,每种模型对应有10个模型文件。由于LightGBM训练较快就未进行存储,只存储了两种CNN网络的训练模型。

(2)stacked feature文件夹:存储由初级模型生成的特征数据,本次比赛利用这些数据进行stacking集成。

(3)test文件夹:测试集文件。

(4)train文件夹:训练集文件。

(5)baseline_cnn_1.ipynb文件:初级模型1,基于CNN的模型。

(6)baseline_cnn_2.ipynb文件:初级模型2,基于CNN的模型。

(7)baseline_lightgbm.ipynb文件:初级模型3,基于LGB。

(8)stacking.ipynb文件:次级模型,基于神经网络。

(9)sub_cnn_1.csv:初级模型1生成的提交文件。

(10)sub_cnn_2.csv:初级模型2生成的提交文件。

(11)sub_lightgbm.csv:初级模型3生成的提交文件。

(12)sub_stacking.csv:次级模型生成的提交文件。

相关文章
|
机器学习/深度学习 自然语言处理 算法
浅述几种文本和图像数据增强的方法
在现实场景中,我们往往收集不到太多的数据,那么为了扩大数据集,可以采用数据增强手段来增加样本,那么平常我们应该怎么做数据增强的呢? 什么是数据增强 数据增强也叫数据扩增,意思是在不实质性的增加数据的情况下,让有限的数据产生等价于更多数据的价值。
|
1天前
|
人工智能 算法
图像伪造照妖镜!北大发布多模态LLM图像篡改检测定位框架FakeShield
北京大学研究团队提出了一种名为FakeShield的多模态框架,旨在解决图像伪造检测与定位(IFDL)中的黑箱问题及泛化能力不足。FakeShield不仅能评估图像真实性,生成篡改区域的掩码,还能提供像素级和图像级的篡改线索及详细文本描述,增强检测的可解释性。通过使用GPT-4o增强现有数据集,创建多模态篡改描述数据集(MMTD-Set),并引入领域标签引导的可解释伪造检测模块(DTE-FDM)和多模态伪造定位模块(MFLM),FakeShield在多种篡改技术的检测与定位上表现优异,为图像真实性维护提供了有力工具。
25 14
|
算法 API iOS开发
iOS MachineLearning 系列(3)—— 静态图像分析之区域识别
本系列的前一篇文章介绍了如何使用iOS中自带的API对图片中的矩形区域进行分析。在图像静态分析方面,矩形区域分析是非常基础的部分。API还提供了更多面向应用的分析能力,如文本区域分析,条形码二维码的分析,人脸区域分析,人体分析等。本篇文章主要介绍这些分析API的应用。
294 0
|
7月前
|
语音技术
长音频集成模型的标点结果既依赖于语音识别也依赖于语音端点检测(VAD)
长音频集成模型的标点结果既依赖于语音识别也依赖于语音端点检测(VAD)【1月更文挑战第11天】【1月更文挑战第52篇】
132 1
|
机器学习/深度学习 API iOS开发
iOS MachineLearning 系列(17)—— 几个常用的对象识别 CoreML 模型
上一篇文章中,我们介绍了几个官方的图片分类的模型,图片分类模型的应用场景在于将图片中最主要的事物进行识别,在已有的词库中找到最可能得事物。而对象识别则要更高级一些。再之前的文章,我们介绍过可以使用官方提供的API来进行矩形识别,文本识别,二维码识别以及人脸识别等,这类识别功能的特点是我们不仅可以将图片中的物体位置和尺寸分析出来,还可以对其进行类别的分类。
360 0
|
人工智能 文字识别 API
iOS MachineLearning 系列(4)—— 静态图像分析之物体识别与分类
本系列的前几篇文件,详细了介绍了Vision框架中关于静态图片区域识别的内容。本篇文章,我们将着重介绍静态图片中物体的识别与分类。物体识别和分类也是Machine Learning领域重要的应用。通过大量的图片数据进行训练后,模型可以轻易的分析出图片的属性以及图片中物体的属性。
380 0
|
Ubuntu 机器人 定位技术
ros_gazebo/turtlebot3 室内仿真导航,提取camera/image和pose位姿真值,并将topic 时间同步对齐,最后制作成kitti 格式的数据集。
ros_gazebo/turtlebot3 室内仿真导航,提取camera/image和pose位姿真值,并将topic 时间同步对齐,最后制作成kitti 格式的数据集。
480 0
|
机器学习/深度学习 监控 算法
|
算法 PyTorch 算法框架/工具
【DSW Gallery】基于YOLOX模型和iTAG标注数据的图像检测示例
EasyCV是基于Pytorch,以自监督学习和Transformer技术为核心的 all-in-one 视觉算法建模工具,并包含图像分类,度量学习,目标检测,姿态识别等视觉任务的SOTA算法。本文将为您介绍如何在PAI-DSW中使用EasyCV和PAI-iTAG标注的检测数据训练YOLOX模型。
【DSW Gallery】基于YOLOX模型和iTAG标注数据的图像检测示例
|
机器学习/深度学习 自然语言处理 JavaScript
7 Papers & Radios | 首个用于工业开发的自动代码生成系统;多模态图像合成与编辑综述
7 Papers & Radios | 首个用于工业开发的自动代码生成系统;多模态图像合成与编辑综述
243 0