【数据同步】你还不会在Docker下安装Canal吗?

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: 最近在工作中遇到了需求,主要是为了完成对Binlog日志的监听和消费,做了一些数据同步的技术选型,最后选择了Canal。

前言

大家好,我是小郭,在前面的文章中,我们在Docker下安装了MySQL和MySQL的主备,最近在工作中遇到了需求,主要是为了完成对Binlog日志的监听和消费,做了一些数据同步的技术选型,最后选择了Canal。

一、Canal什么,它主要是干什么的

从官网上,我们直接引用他们的图,来了解一下Canal

主要的作用: MySQL数据库Binlog解析

网络异常,图片无法展示
|

主要的应用场景:

  1. 数据库镜像
  2. 数据库实时备份
  3. 索引构建和实时维护(拆分异构索引、倒排索引等)
  4. 业务 cache 刷新
  5. 带业务逻辑的增量数据处理

二、Canal工作原理

原理:是基于二进制日志(binlog)进行数据增量同步。

  1. 模拟 MySQL slave 的交互协议,伪装自己为 MySQL slave ,向 MySQL master 发送dump 协议。
  2. master 收到 dump 请求,开始推送 binary log 给 slave。
  3. canal 解析 binary log 对象。

看完这个原理是不是感觉和主备搭建的时候,感觉很相似,没错的,他们的原理是一样的,都是等待主机发送binlog日志文件,然后对文件进行解析。

三、在Docker下搭建Canal

我们在之间的文章中已经在Docker中搭建了一个3306的数据环境,为了满足Canal的需要。

接下来,我们在搭建一个Canal。

  1. 下载对应版本,启动pull下来的镜像
    docker pull canal/canal-server
  2. 进入容器docker exec -it canal bash
  3. 将文件替换到外部

可以选择在服务器上一个位置,将主要的两个配置文件canal.properties和instance.properties复制过去

docker cp canal:/home/admin/canal-server/conf/canal.properties /home/canal
docker cp canal:/home/admin/canal-server/conf/example/instance.properties /home/canal 
  1. 重新加载镜像 注意:这里的配置文件需要映射,docker里面的文件
docker run --name canal -p 11111:11111 -v /home/canal/instance.properties:/home/admin/canal-server/conf/example/instance.properties -v /home/canal/canal.properties:/home/admin/canal-server/conf/canal -d canal/canal-server
  1. 修改配置
# 设置serverd,一般设置为IP,同一局域网内注意要唯一,如果相同,则它们之间不能设定为主备关系
canal.instance.mysql.slaveId=23
# 数据地址
canal.instance.master.address = xxx

这里需要创建canal用户的账号,步骤与搭建主备的方法一致,这里就不在重复了

# 创建的账号
canal.instance.dbUsername=canal
canal.instance.dbPassword=canal 

四、docker环境下安装admin

  1. 拉取 canal-admin
docker pull canal/canal-admin:v1.1.5
  1. 也可以下载canal-admin脚本
wget https://raw.githubusercontent.com/alibaba/canal/master/docker/run_admin.sh 
  1. 可以使用docker启动,也可以使用脚本启动
sh  run_admin.sh -e server.port=8089 \
         -e spring.datasource.address=xxx \
         -e spring.datasource.database=xx \
         -e spring.datasource.username=xx \
         -e spring.datasource.password=xx

或者

docker run -d -it -h 127.0.0.1 -e server.port=8089 -e canal.adminUser=admin -e canal.adminPasswd=admin -e spring.datasource.address=:3306  -e spring.datasource.database= canal_manager  -e spring.datasource.username= canal  -e spring.datasource.password= canal  --name=canal-admin -p 8089:8089 -m 1024m canal/canal-admin
  1. 默认账号密码: admin/123456

三个步骤,就可以完成admin的搭建,也是官方为我们提供的管理工具。

了解canal-server架构

canal-server主要是由server,instance组成

  1. 每个Instance对应于一个数据队列
  2. 每个server代表一个canal-server运行实例jvm
  3. 每个server上可以运行一个或多个Instance; 在实际的使用中,通常我们一个任务就是一个Instance

Instance的主要组件

  1. EventParser :数据源接入,模拟MySQL slave协议从master上dump binlog,并进行解析
  2. EventSink :对dump的数据进行过滤、加工、分发,连接Parser和Store
    用来把多个instance上的数据进行归并
  3. EventStore :对sink模块处理后的数据进行临时存储
    利用RingBuffer来进行点位记录,只为一个消费者维护信息
  4. MetaManager:元数据管理器

HA机制设计

网络异常,图片无法展示
|

实战中遇到的异常问题

  1. Canal报错:Could not find first log file name in binary log index file

错误原因:与主机的Binlog文件,记录的位置不一致

解决方案:需删除example下的meta.dat文件,再重新启动

思考问题

  1. Canal在同一时间产生大量的数据,如何处理?
  2. 有没有可能出现数据丢失或者重复消费的情况?

文章有限,我们下一篇再展开说说

总结

今天的文章,主要介绍了Canal的搭建和原理,有利于我们后面学习和使用,

也可以看到Canal的机制其实是很简单的,我们可以了理解为伪装的salve节点,但是在数据处理上还有一些瑕疵,需要我们手动去处理。

最后一图总结


网络异常,图片无法展示
|

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
1天前
|
弹性计算 Ubuntu Linux
阿里云服务器一键安装Docker社区版教程,基于系统运维管理OOS
阿里云服务器一键安装Docker社区版教程,基于系统运维管理OOS自动化部署。支持Ubuntu 22.04/20.04、CentOS 7.7-7.9及Alibaba Cloud Linux 3.2104 LTS。前提条件:ECS实例需运行中且有公网。步骤:选择Docker扩展并安装,验证成功通过命令`docker -v`查看版本号。
103 78
|
15天前
|
NoSQL 关系型数据库 应用服务中间件
docker基础篇:安装tomcat
docker基础篇:安装tomcat
143 64
|
4天前
|
NoSQL 关系型数据库 Redis
《docker高级篇(大厂进阶):1.Docker复杂安装详说》包括:安装mysql主从复制、安装redis集群
《docker高级篇(大厂进阶):1.Docker复杂安装详说》包括:安装mysql主从复制、安装redis集群
40 14
|
1天前
|
关系型数据库 MySQL 应用服务中间件
《docker基础篇:8.Docker常规安装简介》包括:docker常规安装总体步骤、安装tomcat、安装mysql、安装redis
《docker基础篇:8.Docker常规安装简介》包括:docker常规安装总体步骤、安装tomcat、安装mysql、安装redis
24 7
|
16天前
|
关系型数据库 MySQL 数据库
docker高级篇(大厂进阶):安装mysql主从复制
docker高级篇(大厂进阶):安装mysql主从复制
93 24
|
17天前
|
NoSQL 算法 Redis
docker高级篇(大厂进阶):安装redis集群
docker高级篇(大厂进阶):安装redis集群
81 24
|
16天前
|
Ubuntu Linux Docker
Ubuntu22.04上Docker的安装
通过以上详细的安装步骤和命令,您可以在Ubuntu 22.04系统上顺利安装
212 11
|
2月前
|
缓存 Linux Docker
【最新版正确姿势】Docker安装教程(简单几步即可完成)
之前的老版本Docker安装教程已经发生了变化,本文分享了Docker最新版安装教程,其他操作系统版本也可以参考官 方的其他安装版本文档。
1826 3
【最新版正确姿势】Docker安装教程(简单几步即可完成)
|
2月前
|
Docker 容器
【赵渝强老师】使用二进制包方式安装Docker
本文介绍了在企业生产环境中无法直接访问外网时,如何使用Docker官方提供的二进制包进行Docker的离线安装。文章详细列出了从安装wget、下载Docker安装包、解压、复制命令到启动Docker服务的具体步骤,并提供了相关命令和示例图片。最后,还介绍了如何设置Docker为开机自启模式。
|
2月前
|
缓存 Ubuntu Linux
如何安装Docker
如何安装Docker
205 0