浅尝Kubeflow系列:阿里云上小试TFJob
## 介绍
本系列将介绍如何在阿里云容器服务上运行[Kubeflow](https://github.com/kubeflow/kubeflow), 本文介绍如何使用`TfJob`运行模型训练。
## TFJob简介
模型训练是机器学习最主要的实践场景,尤其以使用机器学习框架TensorFlow进行模型训练最为流行,但是随着机器学习的平台由单机变成集群,这个问题变得复杂了。GPU
OSS JAVA SDK
环境准备
使用 Java 1.8 及以上版本。
查看版本执行命令java -version查看Java版本。
下载SDK
直接通过 GitHub 下载
安装SDK,在Maven项目中加入依赖项(推荐方式)
com.aliyun.oss
aliyun-sdk-oss
2.8.3
初始化的参数设置
弱网的环境下最好将超时时间设置长一些,增加重试次数,避免上传失败。