阿里云
为了无法计算的价值
打开APP
阿里云APP内打开
学习中心> 阿里云DataHub使用教程> 正文

阿里云DataHub使用教程

5课时 |
810人已学 |
免费
课程介绍

DataHub服务是阿里云提供的流式数据(Streaming Data)服务,它提供流式数据的发布 (Publish)和订阅 (Subscribe)的功能,让您可以轻松构建基于流式数据的分析和应用。


产品详情:https://data.aliyun.com/product/datahub

初识DataHub

 

内容介绍:

  1. DataHub基本使用指南
  2. 创建项目空间

 

 

一、DataHub基本使用指南

在浏览器地址栏输入DataHub.consola.aliyun.com进入Data控制台,可以看到提供了项目管理、数据采集以及帮助文档。

 

帮助文档里主要有Data产品介绍文档及详细使用方法、提供Java SDK和Python SDK文档,用SDK 接口的文档可以根据API 指南进行开发。

数据采集提供了不同的开源工具,包括LogStash等插件的接入方式和云上一些数据平台的接入方式。

 

二、创建项目空间

在使用Data之前,需创建一个项目空间,点解创建Project,创建名为test-dh1。

 

 

创建成功后,进入项目管理页面,点击创建Topic,即可创建固定形式的Topic,在这里,创建名称为test-dh-topic;Topic类型为强格式,即TUPLE;Schema创建三个阶段,分别为f1、f2、f3;Shard数量目前每个支持1000qps,根据流量不同,决定Shard数量,这里设为1;生命周期为3天。

如下图。

创建成功后,可在topic页面上点击查看,可看到topic基本详情,包括其创建时间、修改时间、存储空间以及通道状态。

 

点击数据采集,通过文件上传方式上传本地csv文件,选择刚创建的topic,选择文件中选择不跳过首行,进行上传,上传成功后,可在topic项目管理页面对数据进行查看,点击数据抽样,选择当前时间抽样,就可看到刚刚上传成功的几条数据,System time代表的是数据上传时间。