使用dataworks投递日志服务数据到MaxCompute-阿里云开发者社区

使用dataworks投递日志服务数据到MaxCompute

2020-03-09 5879

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

日志服务 SLS，月写入数据量 50GB 1个月

简介： 日志服务提供了多种投递数据的方式，如: 在控制台直接配置投递任务，通过消费组获取数据然后再投递。控制台直接投递配置方式与dataworks类似，不过配置项更少，更容易操作。

背景

本文将为您介绍如何通过数据集成（DataWorks）功能投递LogHub（SLS）数据至MaxCompute。

温馨提示：如果已有MaxCompute表，可以跳过这一步。

1.进入DataWorks控制台的工作空间列表页面，鼠标悬停至目标工作空间对应操作列的快速进入，单击数据开发。

2.单击左侧数据开发 > 鼠标悬停至+新建图标，单击新建业务流程，弹窗内输入业务名称，然后单击新建即可完成业务流程的创建。

3.鼠标悬停至+新建图标，单击新建节点 > MaxCompute > ODPS SQL，弹窗内输入对应的节点类型、路径、名称，然后单击提交完成新建节点。

4.新建节点完成后，即会跳出sql页面，输入sql语句单击运行即可进行表的创建。

CREATE TABLE IF NOT EXISTS tableName
(
  c1  STRING,
  c2  STRING
)
PARTITIONED BY
(
  p1  STRING
)
LIFECYCLE 3;

a.在新增数据源弹框中选择LogHub。

b.填写新增LogHub数据源对话框中的配置。

参数	描述
数据源名称	数据源名称必须以字母、数字、下划线组合，且不能以数字和下划线开头。
数据源描述	对数据源进行简单描述，不得超过80个字符。
LogHub Endpoint	LogHub的Endpoint，格式为http://example.com。详情请参见服务入口。
Project	目标日志服务的项目名称。
AccessKey ID	访问密钥中的AccessKey ID，您可以进入控制台的用户信息管理页面进行复制。
AccessKey Secret	访问密钥中的AccessKey Secret，相当于登录密码。

c.单击测试连通性。

d.连通性测试通过后，单击完成。

a.在新增数据源弹框中选择MaxCompute。

b.填写新增MaxCompute数据源对话框中的配置。

参数	描述
数据源名称	数据源名称必须以字母、数字、下划线组合，且不能以数字和下划线开头。
数据源描述	对数据源进行简单描述，不得超过80个字符。
ODPS Endpoint	MaxCompute的Endpoint，格式为http://example.com。详情请参见服务入口。
ODPS项目名称	MaxCompute项目名称。
AccessKey ID	访问密钥中的AccessKey ID，您可以进入控制台的用户信息管理页面进行复制。
AccessKey Secret	访问密钥中的AccessKey Secret，相当于登录密码。