浅尝Kubeflow系列:阿里云上小试TFJob
## 介绍
本系列将介绍如何在阿里云容器服务上运行[Kubeflow](https://github.com/kubeflow/kubeflow), 本文介绍如何使用`TfJob`运行模型训练。
## TFJob简介
模型训练是机器学习最主要的实践场景,尤其以使用机器学习框架TensorFlow进行模型训练最为流行,但是随着机器学习的平台由单机变成集群,这个问题变得复杂了。GPU
阿里云 云存储OSS的命令行使用
1.简介
OSS,Object Storage Service,对象存储服务。简单讲就是把文件放在云上。
官网介绍: https://www.aliyun.com/product/oss
2.阿里云申请与配置
2.1 创建AccessKey
图2-1 创建accessKey
2.2 创建OSS的bucket
bucket是虚拟目录,起到nameSpace的作用。
在控制台使用OSS Select
对象存储OSS(Object Storage Service)具有海量、可靠、安全、高性能、低成本的特点。OSS提供标准、低频、归档类型,覆盖多种数据从热到冷的存储需求,单个文件的大小从1字节到48.8TB,可以存储的文件个数无限制。