【数据同步】你还不会在Docker下安装Canal吗?

本文涉及的产品
云数据库 RDS MySQL Serverless,0.5-2RCU 50GB
云数据库 RDS MySQL Serverless,价值2615元额度,1个月
简介: 最近在工作中遇到了需求,主要是为了完成对Binlog日志的监听和消费,做了一些数据同步的技术选型,最后选择了Canal。

前言

大家好,我是小郭,在前面的文章中,我们在Docker下安装了MySQL和MySQL的主备,最近在工作中遇到了需求,主要是为了完成对Binlog日志的监听和消费,做了一些数据同步的技术选型,最后选择了Canal。

一、Canal什么,它主要是干什么的

从官网上,我们直接引用他们的图,来了解一下Canal

主要的作用: MySQL数据库Binlog解析

网络异常,图片无法展示
|

主要的应用场景:

  1. 数据库镜像
  2. 数据库实时备份
  3. 索引构建和实时维护(拆分异构索引、倒排索引等)
  4. 业务 cache 刷新
  5. 带业务逻辑的增量数据处理

二、Canal工作原理

原理:是基于二进制日志(binlog)进行数据增量同步。

  1. 模拟 MySQL slave 的交互协议,伪装自己为 MySQL slave ,向 MySQL master 发送dump 协议。
  2. master 收到 dump 请求,开始推送 binary log 给 slave。
  3. canal 解析 binary log 对象。

看完这个原理是不是感觉和主备搭建的时候,感觉很相似,没错的,他们的原理是一样的,都是等待主机发送binlog日志文件,然后对文件进行解析。

三、在Docker下搭建Canal

我们在之间的文章中已经在Docker中搭建了一个3306的数据环境,为了满足Canal的需要。

接下来,我们在搭建一个Canal。

  1. 下载对应版本,启动pull下来的镜像
    docker pull canal/canal-server
  2. 进入容器docker exec -it canal bash
  3. 将文件替换到外部

可以选择在服务器上一个位置,将主要的两个配置文件canal.properties和instance.properties复制过去

docker cp canal:/home/admin/canal-server/conf/canal.properties /home/canal
docker cp canal:/home/admin/canal-server/conf/example/instance.properties /home/canal 
  1. 重新加载镜像 注意:这里的配置文件需要映射,docker里面的文件
docker run --name canal -p 11111:11111 -v /home/canal/instance.properties:/home/admin/canal-server/conf/example/instance.properties -v /home/canal/canal.properties:/home/admin/canal-server/conf/canal -d canal/canal-server
  1. 修改配置
# 设置serverd,一般设置为IP,同一局域网内注意要唯一,如果相同,则它们之间不能设定为主备关系
canal.instance.mysql.slaveId=23
# 数据地址
canal.instance.master.address = xxx

这里需要创建canal用户的账号,步骤与搭建主备的方法一致,这里就不在重复了

# 创建的账号
canal.instance.dbUsername=canal
canal.instance.dbPassword=canal 

四、docker环境下安装admin

  1. 拉取 canal-admin
docker pull canal/canal-admin:v1.1.5
  1. 也可以下载canal-admin脚本
wget https://raw.githubusercontent.com/alibaba/canal/master/docker/run_admin.sh 
  1. 可以使用docker启动,也可以使用脚本启动
sh  run_admin.sh -e server.port=8089 \
         -e spring.datasource.address=xxx \
         -e spring.datasource.database=xx \
         -e spring.datasource.username=xx \
         -e spring.datasource.password=xx

或者

docker run -d -it -h 127.0.0.1 -e server.port=8089 -e canal.adminUser=admin -e canal.adminPasswd=admin -e spring.datasource.address=:3306  -e spring.datasource.database= canal_manager  -e spring.datasource.username= canal  -e spring.datasource.password= canal  --name=canal-admin -p 8089:8089 -m 1024m canal/canal-admin
  1. 默认账号密码: admin/123456

三个步骤,就可以完成admin的搭建,也是官方为我们提供的管理工具。

了解canal-server架构

canal-server主要是由server,instance组成

  1. 每个Instance对应于一个数据队列
  2. 每个server代表一个canal-server运行实例jvm
  3. 每个server上可以运行一个或多个Instance; 在实际的使用中,通常我们一个任务就是一个Instance

Instance的主要组件

  1. EventParser :数据源接入,模拟MySQL slave协议从master上dump binlog,并进行解析
  2. EventSink :对dump的数据进行过滤、加工、分发,连接Parser和Store
    用来把多个instance上的数据进行归并
  3. EventStore :对sink模块处理后的数据进行临时存储
    利用RingBuffer来进行点位记录,只为一个消费者维护信息
  4. MetaManager:元数据管理器

HA机制设计

网络异常,图片无法展示
|

实战中遇到的异常问题

  1. Canal报错:Could not find first log file name in binary log index file

错误原因:与主机的Binlog文件,记录的位置不一致

解决方案:需删除example下的meta.dat文件,再重新启动

思考问题

  1. Canal在同一时间产生大量的数据,如何处理?
  2. 有没有可能出现数据丢失或者重复消费的情况?

文章有限,我们下一篇再展开说说

总结

今天的文章,主要介绍了Canal的搭建和原理,有利于我们后面学习和使用,

也可以看到Canal的机制其实是很简单的,我们可以了理解为伪装的salve节点,但是在数据处理上还有一些瑕疵,需要我们手动去处理。

最后一图总结


网络异常,图片无法展示
|

相关实践学习
基于CentOS快速搭建LAMP环境
本教程介绍如何搭建LAMP环境,其中LAMP分别代表Linux、Apache、MySQL和PHP。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
1天前
|
前端开发 jenkins 持续交付
新的centos7.9安装docker版本的jenkins2.436.1最新版本-前端项目发布(五)
新的centos7.9安装docker版本的jenkins2.436.1最新版本-前端项目发布(五)
|
1天前
|
jenkins 网络安全 持续交付
新的centos7.9安装docker版本的jenkins2.436.1最新版本-后端项目发布(四)
新的centos7.9安装docker版本的jenkins2.436.1最新版本-后端项目发布(四)
|
1天前
|
Java 开发工具 git
新的centos7.9安装docker版本的jenkins2.436.1最新版本-项目发布(三)
新的centos7.9安装docker版本的jenkins2.436.1最新版本-项目发布(三)
10 4
|
1天前
|
网络安全 Docker 容器
测试开发环境下centos7.9下安装docker的minio
测试开发环境下centos7.9下安装docker的minio
|
1天前
|
NoSQL Redis Docker
Mac上轻松几步搞定Docker与Redis安装:从下载安装到容器运行实测全程指南
Mac上轻松几步搞定Docker与Redis安装:从下载安装到容器运行实测全程指南
12 0
|
1天前
|
安全 Linux 网络安全
安装docker
安装docker
14 0
|
1天前
|
网络协议 Linux Docker
在centos7下通过docker 安装onlyoffice
在centos7下通过docker 安装onlyoffice
|
2天前
|
Shell 数据安全/隐私保护 Docker
docker安装anaconda3 python环境
docker安装anaconda3 python环境
10 0
|
2天前
|
NoSQL Linux Redis
本地虚拟机centos7通过docker安装主从redis3.2
本地虚拟机centos7通过docker安装主从redis3.2
|
2天前
|
关系型数据库 MySQL Linux
本地虚拟机centos7通过docker安装主从mysql5.7.21
本地虚拟机centos7通过docker安装主从mysql5.7.21
10 0