【Druid】（八）Apache Druid 核心插件 Kafka Indexing Service & SLS Indexing Service 3-阿里云开发者社区

【Druid】（八）Apache Druid 核心插件 Kafka Indexing Service & SLS Indexing Service 3

2022-06-13 272

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

日志服务 SLS，月写入数据量 50GB 1个月

简介： 【Druid】（八）Apache Druid 核心插件 Kafka Indexing Service & SLS Indexing Service 3

四、关于 SLS Indexing Service

SLS Indexing Service 是 E-MapReduce 推出的一个 Druid 插件，用于从 SLS 消费数据。

4.1 背景介绍

SLS Indexing Service 消费原理与 Kafka Indexing Service 类似，因此也支持 Kafka Indexing Service 一样的 Exactly-Once 语义。其综合了 SLS 与 Kafka Indexing Service 两个服务的优点：

极为便捷的数据采集，可以利用 SLS 的多种数据采集方式实时将数据导入 SLS。

不用额外维护一个 Kafka 集群，省去了数据流的一个环节。

支持 Exactly-Once 语义。

消费作业高可靠保证，作业失败重试，集群重启/升级业务无感知等。

4.2 准备工作

如果您还没有开通 SLS 服务，请先开通 SLS 服务，并配置好相应的 Project 和 Logstore。

准备好以下配置项内容：

SLS 服务的 endpoint（注意要用内网服务入口）

可访问 SLS 服务的 AccessKeyId 和对应的 AccessKeySecret

4.3 使用 SLS Indexing Service

准备数据格式描述文件

如果您熟悉 Kafka Indexing Service，那么 SLS Indexing Service 会非常简单。具体请参见 Kafka Indexing Service 的介绍，我们用同样的数据进行索引，那么数据源的数据格式描述文件如下（将其保存为 metrics-sls.json）：

{
    "type": "sls",
    "dataSchema": {
        "dataSource": "metrics-sls",
        "parser": {
            "type": "string",
            "parseSpec": {
                "timestampSpec": {
                    "column": "time",
                    "format": "auto"
                },
                "dimensionsSpec": {
                    "dimensions": ["url", "user"]
                },
                "format": "json"
            }
        },
        "granularitySpec": {
            "type": "uniform",
            "segmentGranularity": "hour",
            "queryGranularity": "none"
        },
        "metricsSpec": [{
                "type": "count",
                "name": "views"
            },
            {
                "name": "latencyMs",
                "type": "doubleSum",
                "fieldName": "latencyMs"
            }
        ]
    },
    "ioConfig": {
        "project": <your_project>,
        "logstore": <your_logstore>,
        "consumerProperties": {
            "endpoint": "cn-hangzhou-intranet.log.aliyuncs.com", (以杭州为例，注意使用内网服务入口)
            "access-key-id": <your_access_key_id>,
            "access-key-secret": <your_access_key_secret>,
            "logtail.collection-mode": "simple"/"other"
        },
        "taskCount": 1,
        "replicas": 1,
        "taskDuration": "PT1H"
    },
    "tuningConfig": {
        "type": "sls",
        "maxRowsInMemory": "100000"
    }
}

对比 Kafka Indexing Service 一节中的介绍，我们发现两者基本上是一样的。这里简要列一下需要注意的字段：

type: sls。

dataSchema.parser.parseSpec.format：与 ioConfig.consumerProperties.logtail.collection-mode 有关，也就是与 SLS 日志的收集模式有关。如果是极简模式（simple）收集，那么该处原本文件是什么格式，就填什么格式。如果是非极简模式（other）收集，那么此处取值为 json。

ioConfig.project：您要收集的日志的 project。

ioConfig.logstore：您要收集的日志的 logstore。

ioConfig.consumerProperties.endpoint： SLS 内网服务地址，例如杭州对应 cn-hangzhou-intranet.log.aliyuncs.com。

ioConfig.consumerProperties.access-key-id：账户的 AccessKeyID。

ioConfig.consumerProperties.access-key-secret：账户的 AccessKeySecret。

ioConfig.consumerProperties.logtail.collection-mode： SLS 日志收集模式，极简模式填 simple，其他情况填 other。

注意上述配置文件中的 ioConfig 配置格式仅适用于 EMR-3.20.0 及之前版本。自 EMR-3.21.0 开始，ioConfig 配置变更如下：

"ioConfig": {
        "project": <your_project>,
        "logstore": <your_logstore>,
        "endpoint": "cn-hangzhou-intranet.log.aliyuncs.com", (以杭州为例，注意使用内网服务入口)
        "accessKeyId": <your_access_key_id>,
        "accessKeySec": <your_access_key_secret>,
        "collectMode": "simple"/"other"
        "taskCount": 1,
        "replicas": 1,
        "taskDuration": "PT1H"
    },

即，取消了 consumerProperties 层级、access-key-id、access-key-secret，logtail.collection-mode 变更为 accessKeyIdaccessKeySeccollectMode 。

执行下述命令添加 SLS supervisor。

curl --negotiate -u:druid -b ~/cookies -c ~/cookies -XPOST -H 'Content-Type: application/json' -d @metrics-sls.json http://emr-header-1.cluster-1234:18090/druid/indexer/v1/supervisor

注意其中 --negotiate、-u、-b、-c 等选项是针对安全 Druid 集群。

向 SLS 中导入数据。

您可以采用多种方式向 SLS 中导入数据。具体请参见 SLS 文档。

在 Druid 端进行相关查询。

【Druid】（八）Apache Druid 核心插件 Kafka Indexing Service & SLS Indexing Service 3

四、关于 SLS Indexing Service

4.1 背景介绍

4.2 准备工作

4.3 使用 SLS Indexing Service

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

【Druid】（八）Apache Druid 核心插件 Kafka Indexing Service & SLS Indexing Service 3

四、关于 SLS Indexing Service

4.1 背景介绍

4.2 准备工作

4.3 使用 SLS Indexing Service

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像