【数据同步】你还不会在Docker下安装Canal吗?

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: 最近在工作中遇到了需求,主要是为了完成对Binlog日志的监听和消费,做了一些数据同步的技术选型,最后选择了Canal。

前言

大家好,我是小郭,在前面的文章中,我们在Docker下安装了MySQL和MySQL的主备,最近在工作中遇到了需求,主要是为了完成对Binlog日志的监听和消费,做了一些数据同步的技术选型,最后选择了Canal。

一、Canal什么,它主要是干什么的

从官网上,我们直接引用他们的图,来了解一下Canal

主要的作用: MySQL数据库Binlog解析

网络异常,图片无法展示
|

主要的应用场景:

  1. 数据库镜像
  2. 数据库实时备份
  3. 索引构建和实时维护(拆分异构索引、倒排索引等)
  4. 业务 cache 刷新
  5. 带业务逻辑的增量数据处理

二、Canal工作原理

原理:是基于二进制日志(binlog)进行数据增量同步。

  1. 模拟 MySQL slave 的交互协议,伪装自己为 MySQL slave ,向 MySQL master 发送dump 协议。
  2. master 收到 dump 请求,开始推送 binary log 给 slave。
  3. canal 解析 binary log 对象。

看完这个原理是不是感觉和主备搭建的时候,感觉很相似,没错的,他们的原理是一样的,都是等待主机发送binlog日志文件,然后对文件进行解析。

三、在Docker下搭建Canal

我们在之间的文章中已经在Docker中搭建了一个3306的数据环境,为了满足Canal的需要。

接下来,我们在搭建一个Canal。

  1. 下载对应版本,启动pull下来的镜像
    docker pull canal/canal-server
  2. 进入容器docker exec -it canal bash
  3. 将文件替换到外部

可以选择在服务器上一个位置,将主要的两个配置文件canal.properties和instance.properties复制过去

docker cp canal:/home/admin/canal-server/conf/canal.properties /home/canal
docker cp canal:/home/admin/canal-server/conf/example/instance.properties /home/canal 
  1. 重新加载镜像 注意:这里的配置文件需要映射,docker里面的文件
docker run --name canal -p 11111:11111 -v /home/canal/instance.properties:/home/admin/canal-server/conf/example/instance.properties -v /home/canal/canal.properties:/home/admin/canal-server/conf/canal -d canal/canal-server
  1. 修改配置
# 设置serverd,一般设置为IP,同一局域网内注意要唯一,如果相同,则它们之间不能设定为主备关系
canal.instance.mysql.slaveId=23
# 数据地址
canal.instance.master.address = xxx

这里需要创建canal用户的账号,步骤与搭建主备的方法一致,这里就不在重复了

# 创建的账号
canal.instance.dbUsername=canal
canal.instance.dbPassword=canal 

四、docker环境下安装admin

  1. 拉取 canal-admin
docker pull canal/canal-admin:v1.1.5
  1. 也可以下载canal-admin脚本
wget https://raw.githubusercontent.com/alibaba/canal/master/docker/run_admin.sh 
  1. 可以使用docker启动,也可以使用脚本启动
sh  run_admin.sh -e server.port=8089 \
         -e spring.datasource.address=xxx \
         -e spring.datasource.database=xx \
         -e spring.datasource.username=xx \
         -e spring.datasource.password=xx

或者

docker run -d -it -h 127.0.0.1 -e server.port=8089 -e canal.adminUser=admin -e canal.adminPasswd=admin -e spring.datasource.address=:3306  -e spring.datasource.database= canal_manager  -e spring.datasource.username= canal  -e spring.datasource.password= canal  --name=canal-admin -p 8089:8089 -m 1024m canal/canal-admin
  1. 默认账号密码: admin/123456

三个步骤,就可以完成admin的搭建,也是官方为我们提供的管理工具。

了解canal-server架构

canal-server主要是由server,instance组成

  1. 每个Instance对应于一个数据队列
  2. 每个server代表一个canal-server运行实例jvm
  3. 每个server上可以运行一个或多个Instance; 在实际的使用中,通常我们一个任务就是一个Instance

Instance的主要组件

  1. EventParser :数据源接入,模拟MySQL slave协议从master上dump binlog,并进行解析
  2. EventSink :对dump的数据进行过滤、加工、分发,连接Parser和Store
    用来把多个instance上的数据进行归并
  3. EventStore :对sink模块处理后的数据进行临时存储
    利用RingBuffer来进行点位记录,只为一个消费者维护信息
  4. MetaManager:元数据管理器

HA机制设计

网络异常,图片无法展示
|

实战中遇到的异常问题

  1. Canal报错:Could not find first log file name in binary log index file

错误原因:与主机的Binlog文件,记录的位置不一致

解决方案:需删除example下的meta.dat文件,再重新启动

思考问题

  1. Canal在同一时间产生大量的数据,如何处理?
  2. 有没有可能出现数据丢失或者重复消费的情况?

文章有限,我们下一篇再展开说说

总结

今天的文章,主要介绍了Canal的搭建和原理,有利于我们后面学习和使用,

也可以看到Canal的机制其实是很简单的,我们可以了理解为伪装的salve节点,但是在数据处理上还有一些瑕疵,需要我们手动去处理。

最后一图总结


网络异常,图片无法展示
|

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
11天前
|
关系型数据库 MySQL 数据库
Docker Compose V2 安装常用数据库MySQL+Mongo
以上内容涵盖了使用 Docker Compose 安装和管理 MySQL 和 MongoDB 的详细步骤,希望对您有所帮助。
84 42
|
1月前
|
弹性计算 Ubuntu Linux
阿里云服务器一键安装Docker社区版教程,基于系统运维管理OOS
阿里云服务器一键安装Docker社区版教程,基于系统运维管理OOS自动化部署。支持Ubuntu 22.04/20.04、CentOS 7.7-7.9及Alibaba Cloud Linux 3.2104 LTS。前提条件:ECS实例需运行中且有公网。步骤:选择Docker扩展并安装,验证成功通过命令`docker -v`查看版本号。
297 79
|
4天前
|
监控 Linux PHP
【02】客户端服务端C语言-go语言-web端PHP语言整合内容发布-优雅草网络设备监控系统-2月12日优雅草简化Centos stream8安装zabbix7教程-本搭建教程非docker搭建教程-优雅草solution
【02】客户端服务端C语言-go语言-web端PHP语言整合内容发布-优雅草网络设备监控系统-2月12日优雅草简化Centos stream8安装zabbix7教程-本搭建教程非docker搭建教程-优雅草solution
52 20
|
15天前
|
Linux Docker 容器
安装docker-18.06报错Error: libseccomp conflicts with docker-18.06
通过这些步骤,您可以成功在CentOS上安装Docker 18.06,并解决libseccomp的冲突问题。这些方法确保系统兼容性,并保证Docker的正常运行。
52 27
|
5天前
|
Ubuntu API 网络虚拟化
ubuntu22 编译安装docker,和docker容器方式安装 deepseek
本脚本适用于Ubuntu 22.04,主要功能包括编译安装Docker和安装DeepSeek模型。首先通过Apt源配置安装Docker,确保网络稳定(建议使用VPN)。接着下载并配置Docker二进制文件,创建Docker用户组并设置守护进程。随后拉取Debian 12镜像,安装系统必备工具,配置Ollama模型管理器,并最终部署和运行DeepSeek模型,提供API接口进行交互测试。
102 15
|
3天前
|
消息中间件 Kafka Docker
docker compose 安装 kafka
通过本文的步骤,您可以快速在本地使用 Docker Compose 安装并配置 Kafka 和 Zookeeper。Docker Compose 简化了多容器应用的管理,方便快速搭建和测试分布式系统。
26 2
|
1月前
|
前端开发 应用服务中间件 nginx
docker安装nginx,前端项目运行
通过上述步骤,你可以轻松地在Docker中部署Nginx并运行前端项目。这种方法不仅简化了部署流程,还确保了环境的一致性,提高了开发和运维的效率。确保按步骤操作,并根据项目的具体需求进行相应的配置调整。
122 25
|
1月前
|
安全 数据安全/隐私保护 Docker
docker私有仓库harbor安装
通过以上步骤,您可以成功在企业内部安装和配置Harbor私有仓库,方便地管理和分发Docker镜像。Harbor不仅提供了基础的镜像管理功能,还增强了安全性、身份管理和审计功能,使其成为企业级容器镜像管理的理想选择。
100 22
|
2月前
|
NoSQL 关系型数据库 Redis
《docker高级篇(大厂进阶):1.Docker复杂安装详说》包括:安装mysql主从复制、安装redis集群
《docker高级篇(大厂进阶):1.Docker复杂安装详说》包括:安装mysql主从复制、安装redis集群
127 14
|
1月前
|
关系型数据库 MySQL 应用服务中间件
《docker基础篇:8.Docker常规安装简介》包括:docker常规安装总体步骤、安装tomcat、安装mysql、安装redis
《docker基础篇:8.Docker常规安装简介》包括:docker常规安装总体步骤、安装tomcat、安装mysql、安装redis
122 7