实践教程之采集PolarDB-X SQL日志到ElasticSearch

简介: PolarDB-X 为了方便用户体验,提供了免费的实验环境,您可以在实验环境里体验 PolarDB-X 的安装部署和各种内核特性。除了免费的实验,PolarDB-X 也提供免费的视频课程,手把手教你玩转 PolarDB-X 分布式数据库。本期实验将指导您如何采集PolarDB-X SQL日志到ElasticSearch。

PolarDB-X 为了方便用户体验,提供了免费的实验环境,您可以在实验环境里体验 PolarDB-X 的安装部署和各种内核特性。除了免费的实验,PolarDB-X 也提供免费的视频课程,手把手教你玩转 PolarDB-X 分布式数据库。

本期实验将指导您如何采集PolarDB-X SQL日志到ElasticSearch

本期免费实验地址

本期教学视频地址


前置准备

假设已经根据前一讲内容完成了PolarDB-X的搭建部署,使用PolarDB-X Operator安装PolarDB-X,并且可以成功链接上PolarDB-X数据库。

安装PolarDB-X LogCollector

本步骤将指导您安装PolarDB-X LogCollector组件,并将PolarDB-X日志投递到Elastic Search中。

1.执行如下命令,创建一个名为polardbx-logcollector的命名空间。

kubectl create namespace polardbx-logcollector

2.执行如下命令,安装 PolarDB-X LogCollector。

helm install --namespace polardbx-logcollector polardbx-logcollector polardbx/polardbx-logcollector --version=1.3.0-alpha.1

3.执行如下命令,等待 PolarDB-X LogCollector 的组件ready。

kubectl get pods -n polardbx-logcollector

4. PolarDB-X 日志采集功能是默认关闭的,执行如下命令,为第三步创建的 PolarDB-X 集群开启日志采集功能。

kubectl patch pxc polardb-x --patch '{"spec":{"config":{"cn":{"enableAuditLog":true}}}}' --type merge

5. 在 LogStash 标准输出查看 PolarDB-X 日志。

说明:logstash pod name需要替换为 polardbx-logcollector 命名空间下的 logstash pod 名称。

kubectl logs -n polardbx-logcollector {logstash pod name} -f


部署Elastic Search

本步骤将指导您如何在K8s上部署一个Elastic Search集群。

1.执行如下命令,创建ECK的CRD。

kubectl create -f https://download.elastic.co/downloads/eck/2.4.0/crds.yaml

2.执行如下命令,安装ECKOperator。

kubectl apply -f https://download.elastic.co/downloads/eck/2.4.0/operator.yaml

3.执行如下命令,查看ECK Operator的POD状态,等待所有的POD都变成Running状态。

kubectl get pods -n elastic-system

4.执行如下命令,创建es.yaml。

vim es.yaml

5.按i键进入编辑模式,将如下代码复制到文件中,然后按ECS退出编辑模式,输入:wq后按下Enter键保存并退出。

apiVersion: elasticsearch.k8s.elastic.co/v1
kind: Elasticsearch
metadata:
  name: quickstart
spec:
  version: 8.4.3
  image: elasticsearch:8.4.3
  nodeSets:
  - name: default
    count: 1
    config:
      node.store.allow_mmap: false

6.执行如下命令,创建Elastic Search集群。

kubectl apply -f es.yaml

7.执行如下命令,查看Elastic Search集群创建状态。

kubectl get elasticsearch

返回结果如下,请您耐心等待几分钟,当PHASE显示为Ready时,表示Elastic Search 集群已经部署完成。

8.执行如下命令,创建kibana.yaml。

vim kibana.yaml

9.按i键进入编辑模式,将如下代码复制到文件中,然后按ECS退出编辑模式,输入:wq后按下Enter键保存并退出。

apiVersion: kibana.k8s.elastic.co/v1
kind: Kibana
metadata:
  name: quickstart
spec:
  version: 8.4.3
  image: kibana:8.4.3
  count: 1
  elasticsearchRef:
    name: quickstart

10.执行如下命令,创建 Kinana 实例。

kubectl apply -f kibana.yaml

11.执行如下命令,查看Kibana创建状态。

kubectl get kibana

12.获取Elastic Search集群的访问信息。

执行如下命令,获取Elastic Search的密码。

kubectl get secret quickstart-es-elastic-user -o go-template='{{.data.elastic | base64decode}}' | xargs echo "PASSWORD: "


投递日志到 Elastic Search

PolarDB-X日志采集功能开启后,默认会投递日志到logstash的标准输出。您可以修改logstash的output配置,将日志投递到其它系统中。本步骤将指导您将PolarDB-X日志投递到Elastic Search中,并在Kibana上访问日志信息。

1.Elastic Search 8以上默认要求HTTPS访问,因此需要为 logstash 配置访问 Elastic Search 的证书。执行如下命令获取 Elastic Search的访问证书,并配置到 logstash的 secret中

CRT=$(kubectl get secret quickstart-es-http-certs-public -o jsonpath={.data}) kubectl patch secret elastic-certs-public  -p "{\"data\": ${CRT}}" -n polardbx-logcollector

2.配置 Logstash 的 output, 将日志输出到 ES。

2.1 获取 ES 的访问密码。

注意:请提前复制密码,后续的配置文件中需要填入。

kubectl get secret quickstart-es-elastic-user -o go-template='{{.data.elastic | base64decode}}' | xargs echo "PASSWORD: "

2.2 执行如下命令,创建 logstash-pipeline-patch.yaml。

vim logstash-pipeline-patch.yaml

2.3 按i键进入编辑模式,将如下代码复制到文件中,并修改output中的password字段为上面获取到的ES密码,然后按ECS退出编辑模式,输入:wq后按下Enter键保存并退出。

注意:需要修改output中的password字段,才能正确投递。

data:
  logstash.conf: |-
    input {
      beats {
        port => 5044
      }
    }
    filter {
        if [fields][log_type] in ["cn_sql_log","cn_slow_log"] {
            polardbx {
            }
            date{
              match => ["timestamp", "UNIX_MS","ISO8601"]
              timezone => "Asia/Shanghai"
            }
            mutate{
              remove_field => ["event", "timestamp","[message][begin_time]","[message][timestamp]"]
              add_field => { "[@metadata][target_index]" => "%{[fields][log_type]}-%{+YYYY.MM.dd}" }
            }
         } else if [fields][log_type] == "cn_tddl_log" {
            grok{
              match =>  { "message" => "%{TIMESTAMP_ISO8601:timestamp} \[%{DATA:thread}\] %{LOGLEVEL:loglevel} %{DATA:logger} - %{JAVALOGMESSAGE:messagetmp}" }
            }
            date{
              match => ["timestamp","ISO8601"]
              timezone => "Asia/Shanghai"
            }
            mutate{
                remove_field => ["event","timestamp"]
                rename => {"messagetmp" => "message"}
                add_field => { "[@metadata][target_index]" => "%{[fields][log_type]}-%{+YYYY.MM.dd}" }
            }
         } else {
            mutate{
                 add_field => { "[@metadata][target_index]" => "other_log-%{+YYYY.MM.dd}" }
            }
         }
    }
    output {
      elasticsearch {
        hosts => ["https://quickstart-es-http.default:9200"]
        user => elastic
        password => "{ES 的密码}"
        ssl => true
        cacert => "/usr/share/logstash/config/certs/ca.crt"
        index => "%{[@metadata][target_index]}"
       }
    }


2.4 执行如下命令,更新Logstash的output配置,将上面的配置项填入output中。

kubectl patch configmap logstash-pipeline -n polardbx-logcollector --patch-file logstash-pipeline-patch.yaml

2.5 执行如下命令,等待logstash pod重建完成。

kubectl get pods -n polardbx-logcollector -w

执行业务SQL

本步骤将指导您如何连接通过K8s部署的PolarDB-X集群,并执行相关SQL、

1.执行如下命令,查看PolarDB-X集群登录密码。

kubectl get secret polardb-x -o jsonpath="{.data['polardbx_root']}" | base64 -d - | xargs echo "Password: "

返回结果如下,您可以查看到PolarDB-X集群登录密码。

2.执行如下命令,将PolarDB-X集群端口转发到3306端口。

说明:使用MySQL Client方式登录通过k8s部署的PolarDB-X集群前,您需要进行获取PolarDB-X集群登录密码和端口转发。

kubectl port-forward svc/polardb-x 3306

3.在实验页面,单击右上角的+ 图标,创建新的终端二。

8.png

4.在终端二中,执行如下命令,连接PolarDB-X集群。

说明:

  • 您需要将<PolarDB-X集群登录密码>替换为实际获取到的PolarDB-X集群登录密码。
  • 如遇到mysql: [Warning] Using a password on the command line interface can be insecure.ERROR 2013 (HY000): Lost connection to MySQL server at 'reading initial communication packet', system error: 0报错,请您稍等一分钟,重新转发端口并连接PolarDB-X集群即可。
mysql -h127.0.0.1 -P3306 -upolardbx_root -p<PolarDB-X集群登录密码>

5.依次执行如下的SQL语句,验证PolarDB-X是否正常。

# 检查GMS 
select * from information_schema.schemata;
# 创建分区表
create database polarx_example partition_mode='partitioning';
use polarx_example;
create table example (
  `id` bigint(11) auto_increment NOT NULL,
  `name` varchar(255) DEFAULT NULL,
  `score` bigint(11) DEFAULT NULL,
  primary key (`id`)
) engine=InnoDB default charset=utf8 
partition by hash(id) 
partitions 8;
insert into example values(null,'lily',375),(null,'lisa',400),(null,'ljh',500);
select * from example;
select sleep(2);
select sleep(3);
show topology from example;

查看SQL审计日志

本步骤将指导您登录Kibana,查看PolarDB-X的SQL日志。

1.切换回终端一窗口,输入CRTL+C终止之前的命令。

2.执行如下命令,将Kibana的service转发到本地。

kubectl port-forward service/quickstart-kb-http 5601 --address=0.0.0.0

3.在本地电脑上通过浏览器访问URL: https://{实验ECS公网ip}:5601。

4.输入用户名密码。

用户名:elastic 密码:上面获取的ES访问密码

5.登录后创建如下三个Index patthen。

日志类型 Index Pattern
SQL日志 cn_sql_log-*
慢日志 cn_slow_log-*
错误日志 cn_tddl_log-*


7.jpeg

6.jpeg

6.在输入框中输入相关关键字,即可搜索PolarDB-X相关日志。

例:搜索包含select关键字的SQL。

message.sql: "create"


本文来源:PolarDB-X知乎号,关注阅读更多技术好文。


相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍如何基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
相关文章
|
8月前
|
数据采集 存储 大数据
大数据之路:阿里巴巴大数据实践——日志采集与数据同步
本资料全面介绍大数据处理技术架构,涵盖数据采集、同步、计算与服务全流程。内容包括Web/App端日志采集方案、数据同步工具DataX与TimeTunnel、离线与实时数仓架构、OneData方法论及元数据管理等核心内容,适用于构建企业级数据平台体系。
760 1
|
存储 运维 开发工具
警惕日志采集失败的 6 大经典雷区:从本地管理反模式到 LoongCollector 标准实践
本文探讨了日志管理中的常见反模式及其潜在问题,强调科学的日志管理策略对系统可观测性的重要性。文中分析了6种反模式:copy truncate轮转导致的日志丢失或重复、NAS/OSS存储引发的采集不一致、多进程写入造成的日志混乱、创建文件空洞释放空间的风险、频繁覆盖写带来的数据完整性问题,以及使用vim编辑日志文件导致的重复采集。针对这些问题,文章提供了最佳实践建议,如使用create模式轮转日志、本地磁盘存储、单线程追加写入等方法,以降低日志采集风险,提升系统可靠性。最后总结指出,遵循这些实践可显著提高故障排查效率和系统性能。
1591 21
|
6月前
|
消息中间件 Java Kafka
搭建ELK日志收集,保姆级教程
本文介绍了分布式日志采集的背景及ELK与Kafka的整合应用。传统多服务器环境下,日志查询效率低下,因此需要集中化日志管理。ELK(Elasticsearch、Logstash、Kibana)应运而生,但单独使用ELK在性能上存在瓶颈,故结合Kafka实现高效的日志采集与处理。文章还详细讲解了基于Docker Compose构建ELK+Kafka环境的方法、验证步骤,以及如何在Spring Boot项目中整合ELK+Kafka,并通过Logback配置实现日志的采集与展示。
1140 64
搭建ELK日志收集,保姆级教程
|
9月前
|
存储 运维 开发工具
警惕日志采集失败的 6 大经典雷区:从本地管理反模式到 LoongCollector 标准实践
本文总结了日志管理中的六大反模式及优化建议,涵盖日志轮转、存储选择、并发写入等常见问题,帮助提升日志采集的完整性与系统可观测性,适用于运维及开发人员优化日志管理策略。
328 5
|
5月前
|
数据采集 缓存 大数据
【赵渝强老师】大数据日志采集引擎Flume
Apache Flume 是一个分布式、可靠的数据采集系统,支持从多种数据源收集日志信息,并传输至指定目的地。其核心架构由Source、Channel、Sink三组件构成,通过Event封装数据,保障高效与可靠传输。
355 1
|
6月前
|
存储 Kubernetes 监控
Kubernetes日志管理:使用Loki进行日志采集
通过以上步骤,在Kubernetes环境下利用LoKi进行有效率且易于管理地logs采集变成可能。此外,在实施过程中需要注意版本兼容性问题,并跟进社区最新动态以获取功能更新或安全补丁信息。
433 16
|
7月前
|
存储 缓存 Apache
StarRocks+Paimon 落地阿里日志采集:万亿级实时数据秒级查询
A+流量分析平台是阿里集团统一的全域流量数据分析平台,致力于通过埋点、采集、计算构建流量数据闭环,助力业务提升流量转化。面对万亿级日志数据带来的写入与查询挑战,平台采用Flink+Paimon+StarRocks技术方案,实现高吞吐写入与秒级查询,优化存储成本与扩展性,提升日志分析效率。
977 1
|
6月前
|
缓存 Java 应用服务中间件
Spring Boot配置优化:Tomcat+数据库+缓存+日志,全场景教程
本文详解Spring Boot十大核心配置优化技巧,涵盖Tomcat连接池、数据库连接池、Jackson时区、日志管理、缓存策略、异步线程池等关键配置,结合代码示例与通俗解释,助你轻松掌握高并发场景下的性能调优方法,适用于实际项目落地。
1119 5
|
8月前
|
JSON 安全 网络安全
LoongCollector 安全日志接入实践:企业级防火墙场景的日志标准化采集
LoonCollector 是一款轻量级日志采集工具,支持多源安全日志的标准化接入,兼容 Syslog、JSON、CSV 等格式,适用于长亭 WAF、FortiGate、Palo Alto 等主流安全设备。通过灵活配置解析规则,LoonCollector 可将原始日志转换为结构化数据,写入阿里云 SLS 日志库,便于后续查询分析、威胁检测与合规审计,有效降低数据孤岛问题,提升企业安全运营效率。
|
8月前
|
存储
WGLOG日志管理系统可以采集网络设备的日志吗
WGLOG日志审计系统提供开放接口,支持外部获取日志内容后发送至该接口,实现日志的存储与分析。详情请访问:https://www.wgstart.com/wglog/docs9.html

相关产品

  • 云原生数据库 PolarDB