通过阿里云容器服务深度学习解决方案开发TensorFlow应用
目标
- 熟悉阿里云容器服务深度学习解决方案的基本功能
- 练习利用深度学习解决方案创建一个TensorFlow开发环境,运行一个MNIST程序,并且利用Tensorboard的可视化功能观测训练效果
准备工作
- 基本介绍
- 请安装chrome浏览器
注意事项:
- 请携带个人笔记本
步骤:
1. 登录子账号控制台
2. 创建容器集群
为了方便使用,我们已经帮用户创建了一个集群。点击左上角“产品与服务”,找到R下面的“容器服务”,查看集群是否处于运行状态,点击左侧导航栏中的“集群”,查看集群是否处于运行状态。
3. 创建模型开发环境
点击左侧导航栏中“镜像与方案”->“解决方案”,找到模型开发
,点击创建
3.1. 设置模型开发环境的配置
选择集群: 默认即可
填写应用名称:tensorflow
选择训练框架: TensorFlow的1.1.0版本
GPU数量:0
数据卷名: 不使用数据卷
Jupyter密码: tensorflow
勾选训练监控
,保留默认训练日志路径
:/output/training_logs
点击确定
3.2. 创建成功后,就自动跳转到应用列表
页面,就可以看到刚刚创建的应用tensorflow
,点击刷新按钮
,直到状态变成就绪
3.3. 这时就可以点击应用名称tensorflow
进入应用详情,选择路由列表
, 就可以看到两个链接,分别是以jupyter
和tensorboard
为开头的链接
4. 下载TensorFlow示例代码
4.1. 单击Jupyter开头的链接,并且输入 Jupyter
的密码: tensorflow
,就能进入 Jupyter 环境, 创建Terminal
4.2. 从阿里云code下载TensorFlow-Examples
, 在Linux Terminal
4.2.1. 执行 bash
4.2.2. 执行 git clone https://code.aliyun.com/kubernetes/Tensorflow-Examples.git
5. 运行示例代码并且查看Tensorboard
5.1. 回到Jupyter的主页面,就可以看到下载的TensorFlow-Examples
, 跳到TensorFlow-Examples/notebooks/4_Utils
,打开tensorboard_basic.ipynb
5.2. 这样,就可以在Jupyter中开发和运行MNIST代码, 需要把TensorFlow的训练日志路径,设置成前面3.1中指定的训练日志路径
,对于本实验来说是/output/training_logs
, 点击Run All
5.3. 使用Tensorboard查看训练结果
5.3.1. 再次访问3.3中应用的路由列表
,点击其中tensorboard
为开头的链接,这样就跳到了Tensorboard的SCALARS
页面,可以看到Loss和Accuracy
5.3.2. 通过IMAGE
页面查看输入数据是否正确
5.3.3. 通过GRAPHS
页面查看模型结构
选作题目
创建配有Tensorboard的MxNet开发环境, 可以运行一下understanding_vanish_gradient.ipynb