本系列将利用Docker技术在阿里云弹性GPU和容器服务上,帮助您上手TensorFlow的机器学习方案
- 第一篇:打造TensorFlow的实验环境
- 第二篇:轻松搭建TensorFlow Serving集群
- 第三篇:打通TensorFlow持续训练链路
- 第四篇:利用Neural Style的TensorFlow实现,像梵高一样作画
- 第五篇:轻松搭建分布式TensorFlow训练集群(上)
- 第六篇:在阿里云上两分钟玩转AlextNet
简介
AlexNet 是 2012 年由 Alex Krizhevsky 使用五层卷积、三层完全连接层开发的 CNN 网络,并赢得了 ImageNet 竞赛(ILSVRC)。AlexNet 证明了 CNN 在分类问题上的有效性(15.3% 错误率),而此前的图片识别错误率高达 25%。这一网络的出现对于计算机视觉在深度学习上的应用具有里程碑意义。
AlexNet 也是深度学习框架常用的性能指标工具,TensorFlow 就提供的 alexnet_benchmark.py 可以测试 GPU 和 CPU 上的性能。本文章以 AlexNet 为例,向您展示如何在阿里云容器服务上简单快速地运行 GPU 应用。
准备条件
需要基于北京 HPC 或者弹性GPU的容器服务。
具体步骤
1.登录 容器服务的管理控制台。
2.单击左侧导航栏中的 镜像与模板 > 镜像。
3.在搜索框中输入 alexNet_benchmark
并单击 全局搜索。
4.单击 registry.cn-beijing.aliyuncs.com/tensorflow-samples/alexnet_benchmark:1.0.0-devel-gpu
右边的 创建应用。
5.输入应用名称(本示例中为 alexNet)并选择北京 HPC 或者 弹性GPU集群, 单击 下一步。
6.配置应用。
6.1.在 基本配置 中,单击 选择镜像版本,选择镜像版本为 1.0.0-devel-gpu
。
6.2.在 容器配置 中,填写运行的命令行,比如 python /alexnet_benchmark.py --batch_size 128 --num_batches 100
。
6.3.在 标签 中,填写阿里云 gpu
标签,标签名为 aliyun.gpu
,标签值为调度的 GPU 数量,本示例中为 1
。
7.完成应用配置后,单击 创建 创建应用。
7.1 您可以在 应用列表 页面,查看创建的 alexNet 应用。
这样您就可以在管理控制台,直接通过容器日志服务查看 AlexNet 在 弹性GPU服务器或者 HPC 上的性能。
7.2 操作路径:在应用列表页面,单击应用名称 alexNet > 单击 容器列表 页签 > 单击容器右边的 日志
两分钟的时间,AlexNet就妥妥的运行起来了。
总结
利用阿里云弹性GPU和容器服务我们可以在云端快速测试、部署深度学习应用,让机器学习不再高冷。阿里云为机器学习提供了丰富的基础设施,从弹性计算、负责均衡到对象存储,日志、监控等等。容器服务可以优雅地将这些能力整合起来,释放深度学习应用的威力。
最后的最后,要提示您的是:
在阿里云弹性GPU服务器和HPC上,使用容器服务是完全免费的
想了解更多容器服务内容,请访问 https://www.aliyun.com/product/containerservice