OSS Bucket导出数据有多种场景,以下是两种主要方法: 全量数据导出到另一个OSS Bucket或本地
- 新增来源数据源:指定表格存储数据源。
- 新增目标数据源:设定OSS Bucket作为目标数据存放位置。
- 新建离线任务节点:创建任务以执行数据同步。
- 配置离线同步任务并启动:
- 向导模式:直观填写,适合快速配置。
- 脚本模式:编写JSON脚本,适用于高级需求。
- 验证结果:在OSS控制台检查导出数据。
导出Bucket的元数据清单
1 . 登录OSS管理控制台,选择目标Bucket。
2 . 导航至数据湖管理 > HDFS服务。
3 . 导出元数据清单,过程可能需几分钟到几小时。
4 . 下载清单文件:使用Jindo SDK命令下载导出的JSON格式清单。
注意:
- 元数据清单默认保存路径不可自定义,且
.sysinfo/inventory/
目录不可删除。 - 确保使用最新JindoSDK并正确配置访问密钥。 以上步骤覆盖了基本的OSS Bucket数据及元数据导出流程。
参考链接:https://help.aliyun.com/zh/csg/user-guide/replicate-data?spm=a2c6h.13066369.question.5.122e3fa2mhxQFR