DataWorks中oss如何上传json数据到odps？

展开

收起

真的很搞笑 2023-10-10 18:02:02 167 0

5 条回答

写回答

取消提交回答

街头艺术家

在DataWorks中创建一个新的数据源，并选择OSS作为数据源类型。

在创建数据源时，需要填写OSS的Access Key ID、Access Key Secret以及Bucket名称等信息。

在创建数据源后，可以在DataWorks的工作流中使用OSS数据源来读取或写入数据。

如果需要将json数据上传到OSS，可以使用DataWorks中的文件操作任务。在文件操作任务中，可以选择将本地文件上传到OSS。

2023-10-13 16:59:59

赞同展开评论打赏
Skyund

在DataWorks中创建一个任务，选择“OSS”作为源数据，并选择“ODPS”作为目标数据。
在任务参数配置页面中，填写任务名称、描述、源数据参数（如OSS Bucket名称、Object名称等）和目标数据参数（如ODPS数据库名称、表名称等）。
在任务配置页面中，编写SQL脚本，用于将JSON数据转换为ODPS支持的格式。
在任务配置页面中，设置任务调度，定期执行JSON数据的上传任务。

2023-10-13 15:41:22

赞同展开评论打赏
Star时光
在DataWorks中，可以使用数据集成功能将JSON数据从OSS（Object Storage Service）上传到ODPS（MaxCompute）。以下是一种常见的方法：
1. 配置数据源：在DataWorks中配置OSS和ODPS的数据源连接。确保您具有正确的权限来访问和操作这两个数据源。
2. 创建数据集成任务：使用DataWorks的数据集成功能，创建一个新的数据集成任务。
3. 配置源端连接：在任务中配置源端连接，选择OSS作为源数据源，并提供OSS的Endpoint、AccessKeyId、AccessKeySecret等信息。
4. 配置目标端连接：在任务中配置目标端连接，选择ODPS作为目标数据源，并提供ODPS的Endpoint、AccessKeyId、AccessKeySecret等信息。
5. 设置数据同步规则：在任务中设置数据同步规则，具体包括文件路径、格式、字段映射等。对于JSON数据，可以选择适当的格式（如JSON File），并映射JSON字段到ODPS表的对应字段。
6. 调度和执行任务：根据需求配置任务的调度策略和触发器，以便定期或实时地执行数据同步任务。
2023-10-11 14:43:58

赞同展开评论打赏
芯在这

一、打开OSS，上传文件

{"id":5644228109524316032,"sourceType":1}
{"id":-736866360508848202,"sourceType":3}
二、登录DataWorks，建立外部表

三、建立临时查询，查看数据

set odps.sql.type.system.odps2=true;
set odps.sql.hive.compatible=true;
select * from json_table;
，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-10-11 09:13:32

赞同展开评论打赏
小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
在DataWorks中，可以通过创建Data Source和Job，将OSS中的JSON数据上传到ODPS中。
1. 创建Data Source：在DataWorks的控制台中，选择左侧菜单的“数据源管理”，然后点击“新建数据源”按钮，选择OSS作为数据源类型，然后填写数据源的相关信息，如AccessKey、SecretKey等，最后点击“保存”按钮。
2. 创建Job：在DataWorks的控制台中，选择左侧菜单的“任务管理”，然后点击“新建任务”按钮，选择Data Ingestion作为任务类型，然后填写Job的相关信息，如Job Name、Input Format、Output Format等，然后在Job的Configuration中填写Data Source的名称，然后在Job的Configuration中填写JSON数据的路径，最后点击“保存”按钮。
2023-10-10 22:41:21

赞同展开评论打赏