开发者学堂课程【阿里云容器服务使用教程:如何做深度学习模型开发】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/438/detail/5427
如何做深度学习模型开发
选择【容器服务】——【解决方案】——【模型开发】
创建 DevBox 用于开发
输入应用名 mydevbox,选择训练框架tensorflow:1.0.0,数据卷名 tfoss,设置Jupyter 密码,训练日志路径应保证与训练代码中日志输出的路径一致,点击确定。
创建的 DevBox 应用中包含了 Jupyter 服务用于开发。TensorBoard 服务用于监控。
点击路由列表 jupyter路由地址,输入密码,点击Log in点击 New Terminal
将代码下载到 Jupyter 中进行开发,调试。
#git clone
https://github.com/aymericdamien/TensorFlow-Examples.git
Cloning into ‘TensorFlow-Examples’...
remote:Counting objectns: 854, done.
remotet:Compressing objects: 100# (5/5), done.
remote!:Total 854 (delta 0), reused 0(delta 0), pack-reused 849
Receiving objeets:100# (854/854), 3.24 MiB | 453.00 KiB/, done.
Resolving deitas: 100# (521/521), done.
Checking connectivilty... done
#Is
TensorFlow-Examples
#Is /input/tensorflow/mnist/data
t10k-images-idx3-ubyte.gx t10k-labels-idxl-ubyte.gx train-images-idx3-ubyte.gx train-labels-idxl-ubyte. gx
训练数据已从共享存储中自动同步到本地‘/in put’目录下
代码从本地读取训练数据
执行代码 训练模型
打开Tensorboard 服务 监控模型训练进度
修改模型代码 迭代训练