流计算的数据源怎么配置?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
流计算的数据源配置需要根据具体的流计算平台和数据源类型进行操作。以下是基于知识库资料的详细配置方法,适用于阿里云相关产品(如物联网边缘计算、智能用户增长等)。
计算源是流计算任务中原始数据的来源,通常用于存储和处理大规模数据。以下以MaxCompute为例说明如何配置计算源:
进入计算源配置页面
在Quick Audience或其他支持的平台上,选择配置管理 > 数据源 > 数据源 > 计算源配置。
添加MaxCompute计算源
填写参数
根据实际需求配置以下参数:
测试连通性
完成配置
维表是流计算中用于关联静态数据的表格,通常存储在关系型数据库中。以下以MySQL为例说明如何配置维表:
CREATE TABLE rds_dim_table(
id int,
len int,
content VARCHAR,
PRIMARY KEY (id),
PERIOD FOR SYSTEM_TIME
) with (
type='rds',
url='jdbc:mysql://your_db_host:your_db_port/your_db_name',
tableName='your_table_name',
userName='config://local_db_username',
password='config://local_db_password'
);
rds
表示MySQL。your_db_host
、your_db_name
等)为实际值。源表是流计算任务中流式数据的输入来源,用于驱动流数据分析的运行。以下以EdgeBus为例说明如何配置源表:
create table property (
propertyName varchar,
propertyValue varchar,
productKey varchar,
deviceName varchar,
gmtCreate varchar,
ts varchar,
tstamp as to_timestamp (cast (ts as bigint)),
WATERMARK wk FOR tstamp as withOffset (tstamp, 2000)
) with (
type = 'edgebus',
jsonParser = 'device_property'
);
edgebus
。device_property
、device_event
、default
三种解析器。流计算任务的结果需要输出到目标数据存储中,支持多种输出类型(如EdgeBusSink、RDS、File等)。以下分别说明各类型配置方法:
create table edgehub_output (
productKey varchar,
deviceName varchar,
temperature int,
productTime timestamp,
inputTime timestamp,
outputTime timestamp,
delayTime bigint
) with (
type = 'edgebus_sink',
topic = '/sys/streamCompute/highTemperature'
);
create table db (
productKey varchar,
deviceName varchar,
ts timestamp,
temperature int
) with (
type = 'rds',
url='jdbc:mysql://your_db_host:your_db_port/your_db_name',
tableName='your_table_name',
userName='config://local_db_username',
password='config://local_db_password'
);
create table print_sink (
productKey varchar,
deviceName varchar,
eventCode varchar,
ts timestamp,
temperature int
) with (
type = 'file',
tag = 'prop_filter_b',
filePath = '/linkedge/run/debug/prop_filter_b.txt'
);
在某些场景下,可能需要动态配置数据源(如工业互联网平台中的组件样式属性)。以下为动态变量的使用方法:
以上内容涵盖了流计算中常见的数据源配置方法,包括计算源、维表、源表和输出配置。请根据具体业务需求选择合适的配置方式,并确保所有参数正确无误。