阿里云MVP Meetup 《云数据·大计算：海量日志数据分析与应用》之《数据应用：数据服务》篇-阿里云开发者社区

阿里云MVP Meetup 《云数据·大计算：海量日志数据分析与应用》之《数据应用：数据服务》篇

2019-03-27 1445

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

日志服务 SLS，月写入数据量 50GB 1个月

大数据开发治理平台DataWorks，资源组抵扣包 750CU*H

云原生 API 网关，700元额度，多规格可选

简介： 本文主要阐述在使用DataWorks（数据工场）的过程中如何使用数据服务模块，快速将已生成的数据给用起来。此功能可用于快速将数仓中的结果表生成API，通过API给下游应用使用，或者通过API服务完成数据共享等。

实验背景介绍
在进行本实验前，请先完成实验《数据采集：日志数据上传》、《数据加工：用户画像》、《数据治理：数据质量监控》。上述三个实验使用了DataWorks的三个模块，分别是数据集成模块（快速将数据上云），数据开发模块（完成数据的清洗和周期调度）和数据质量模块（配置数据的校验规则，保证数据产出质量）。本文将给大家讲述如何使用DataWorks的数据服务模块，快速完成数据共享，将整个数据研发流程达到闭环。

数据服务介绍

DataWorks数据服务旨在为企业搭建统一的数据服务总线，帮助企业统一管理对内对外的API服务。数据服务为您提供快速将数据表生成数据API的能力，同时支持您将现有的API快速注册到数据服务平台以统一管理和发布。

数据服务已与API网关（API Gateway）打通，支持将API服务一键发布至API网关。数据服务与API网关为您提供了安全稳定、低成本、易上手的数据开放共享服务。

数据服务采用Serverless架构，您只需关注API本身的查询逻辑，无需关心运行环境等基础设施，数据服务会为您准备好计算资源，并支持弹性扩展，零运维成本。

数据服务配置

在前三个课程中，我们已经产出了一系列的表，其中可以直接被报表系统使用的表有 rpt_user_info_d，可以被应用使用的明细表有 dw_user_info_all_d。本文我们会通过使用数据服务，快速的将这两个表生成API。

注册数据源

由于MaxCompute的特性是离线、批量大数据计算，所以直接连MaxCompute生成的数据服务API是无法快速响应的，那么MaxCompute计算引擎为了提升查询效率，推出了lightning加速引擎。那在数据服务中如何使用 lightning引擎呢？

在数据集成界面，新增数据，选择lightning 。

填写lightning引擎内容：
数据源名称：（建议为）当前项目名
数据源描述：日志数据表
Lightning Endpoint：lightning.cn-shanghai.maxcompute.aliyun-inc.com
Port：443
MaxCompute项目名称：当前项目名
AccessKey ID：访问者的AK信息
AccessKey Secret：访问者的AK信息
JDBC扩展参数：无需修改

以上信息，填写完成以后，点击测试连通性，测试连通性成功后，点击完成即可。

创建数据服务API

鼠标hover在右上角DataWorks的图标上，跳转至数据服务模块。

注：由于数据服务是结合API网关使用的，如果没有开通API网关的话，需要先开通API网关，具体开通流程本文不做详细概述。

鼠标选中API列表，右键选择新建分组。

输入分组名称。

创建完成分组后，鼠标右键单击分组名称，选择生成API，选择向导模式。

我们这里把 rpt_user_info_d 的数据快速生成api，故API的名称为 rpt_user_info_d ，路径与名称同名。

点击确认后，进入API的编辑界面，我们只需要简单的选择数据源类型、数据源名称、数据表名称即可，勾选上入参和出参，保存API。

注：这里建议大家勾选uid和分区字段dt为入参，出参可全选。

保存API完成后，点击右上角的测试，会弹出入参的填写框，入参中uid可以填写：0016359810821 ，dt可以填写昨天的日期。

测试通过后，可返回API编辑面板，点击右上角的发布，发布后的API就可以被正常访问了。可按照上述方法，将 dw_user_info_all_d 表也生成数据服务API。

API调用

生成的API如何调用呢？
首先你需要将API发布，在发布之前要先开通API网关。

这个发布操作就会将数据服务生成的API发布到API网关。

在数据服务右上角，可以选择服务管理。在服务管理中，可以对已发布的API进行查看和授权操作。切换至服务管理后，可以在左侧的API调用模块下，看到API的调用信息。

然后通过API网关的SDK调用，详见这里。

关于数据服务API的更多用法，可以参考文档：《海量大数据大屏分析展示一步到位：DataWorks数据服务+MaxCompute Lightning对接DataV最佳实践》

阿里云MVP Meetup 《云数据·大计算：海量日志数据分析与应用》之《数据应用：数据服务》篇

数据服务介绍