在阿里云容器服务上运行基于 TensorFlow 的 Alexnet
AlexNet 是 2012 年由 Alex Krizhevsky 使用五层卷积、三层完全连接层开发的 CNN 网络,并赢得了 ImageNet 竞赛(ILSVRC)。AlexNet 证明了 CNN 在分类问题上的有效性(15.3% 错误率),而此前的图片识别错误率高达 25%。这一网络的出现对于计算机视觉在深度学习上的应用具有里程碑意义。
AlexNet 也是深度学习框架常用的性能指标工具,TensorFlow 就提供的
alexnet_benchmark.py 可以测试 GPU 和 CPU 上的性能。本文档以 AlexNet 为例,向您展示如何在阿里云容器服务上简单快速地运行 GPU 应用。
前提条件
需要基于北京 HPC 或者 GN4 规格族 GPU 云服务器的容器服务。
操作步骤
- 登录 容器服务的管理控制台。
- 单击左侧导航栏中的 [backcolor=transparent]镜像与方案 > [backcolor=transparent]镜像。
- 在搜索框中输入 alexNet_benchmark 并单击 [backcolor=transparent]全局搜索。
- 单击 registry.cn-beijing.aliyuncs.com/tensorflow-samples/alexnet_benchmark:1.0.0-devel-gpu 右边的 [backcolor=transparent]创建应用。
- 输入应用名称(本示例中为 [backcolor=transparent]alexNet)并选择北京 HPC 或者 GN4 规格族 ECS 集群, 单击 [backcolor=transparent]下一步。
- 配置应用。
在 [backcolor=transparent]基本配置 中,单击 [backcolor=transparent]选择镜像版本,选择镜像版本为 1.0.0-devel-gpu。
- 在 [backcolor=transparent]容器配置 中,填写运行的命令行,比如 python /alexnet_benchmark.py --batch_size 128 --num_batches 100。
- 在 [backcolor=transparent]标签 中,填写阿里云 gpu 标签,标签名为 aliyun.gpu,标签值为调度的 GPU 数量,本示例中为1。
完成应用配置后,单击 [backcolor=transparent]创建 创建应用。
您可以在 [backcolor=transparent]应用列表 页面,查看创建的 [backcolor=transparent]alexNet 应用。
这样您就可以在管理控制台,直接通过容器日志服务查看 AlexNet 在 EGS 或者 HPC 上的性能。
操作路径:在应用列表页面,单击应用名称 [backcolor=transparent]alexNet > 单击 [backcolor=transparent]容器列表 页签 > 单击容器右边的 [backcolor=transparent]日志