阿里云数据库专家田英鹤:云数据库系统容灾架构设计和实战

简介: 8月30-31日20:00-21:30,一场别开生面的技术大会—— “蚂蚁金服&阿里云在线金融技术峰会”将在线举办。本次将聚焦数据库、应用架构、移动开发、机器学习等热门领域,帮助金融业技术开发者深入解析互联网应用的前沿应用与技术实践。

8月30-31日20:00-21:30,一场别开生面的技术大会—— “蚂蚁金服&阿里云在线金融技术峰会”将在线举办。本次将聚焦数据库、应用架构、移动开发、机器学习等热门领域,帮助金融业技术开发者深入解析互联网应用的前沿应用与技术实践。


蚂蚁金服&阿里云在线金融技术峰会专题: https://yq.aliyun.com/activity/109
峰会统一报名链接: http://yq.aliyun.com/webinar/join/38


来自阿里云的技术专家田英鹤(花名:喜乐) ,将在本次峰会中为大家带来《云数据库系统容灾架构设计和实战》的分享,下面是议题详情,供大家参考。


议题名称:《云数据库系统容灾架构设计和实战》


议题简介: 本次演讲向大家介绍云数据库的高可用容灾方案设计。在各种架构,部署条件下,如何最大程度的保证系统的连续性及数据可靠性。主要包括实例健康检测方法,参数配置,实例故障切换方案及机房容灾方案。通常来讲,数据库的高性能及高可靠往往不可兼得,在实例的HA配置策略上,对于高可用优先和高可靠优先两种方案前提下,如何进行数据库配置及如何制定高可用切换方案。


在双节点架构的高可用配置下,如何保证数据连续可服务及性能;在可靠性配置下,系统如何优先保证数据的可靠和一致性。在三数据节点部署条件下,如何能够更好的保证数据的可用性及可靠性。在机房容灾上主要介绍双机房及三机房的跨机房部署条件下,单个机房或网络故障后可以有哪些数据库的容灾方案。对于以上的容灾场景,也会特别的提到阿里云数据库技术组在这方面所做的工作和努力。


听众收益:
1)了解常见的数据库容灾方案,熟悉原理后更好的设计应用系统的容灾方案
2)收获客户端配置建议,能够更好的理解和减少数据库切换对应用带来的影响


关于分享者: 田英鹤(花名:喜乐),阿里云数据库技术专家,主要从事阿里云数据库服务系统的架构设计及研发。该系统目前支撑了公有云逾万级实例每日逾万次的日常自动化运维服务,设计的数据库高可用系统支持了mysql,pgsql,mssql等逾万级线上实例7*24小时不间断服务。对云计算,大规模并发系统有7年以上的系统架构设计及研发经验。


以下为本次采访内容:


云栖社区:请介绍下你及相关工作经历。

喜乐:
我是2010年硕士毕业后加入阿里巴巴淘宝网,在运营支撑部工作,主要负责淘宝网服务中心,智能机器人搜索引擎相关工作,2013年加入阿里云数据库技术组,主要负责数据库管控服务系统的开发和项目管理工作。

云栖社区:能否分享下阿里云数据库服务系统的架构演变过程,以及所遇到的挑战。

喜乐:
数据库服务系统从2013年支撑数千实例级别到2016年支撑数以万计的实例,从支撑mysql、sqlserver引擎到支持redis,mongo,pgsql/ppas,petadata等引擎,的确从系统架构上,从数据库多种结构上变化很大,对原系统进行了大规模的功能拆分及服务化,从原来仅支持自动化运维任务到目前资源管理,监控,全自动上下线主机,迁移,计费等产品功能日渐丰富。

当然,中间也遇到很多挑战,比如如何支持多机型,支持多种引擎,存储架构,我们将众多引擎的共性及差异性逐渐分离,抽象,使得接入新引擎成本更低,将基础代码,方法维护得更加健壮,使得整个服务系统更加顺滑,可监控,出现问题可及时修复。当然,最大的困难就在于在人力不大幅增加的条件下,如何在快速响应新业务的同时,对现有管控进行深度的优化,重构,使得我们跑的快,跑的稳。

云栖社区:高可用性是云数据库首要解决的问题,在架构设计上你们是如何设计的?对设计中遇到的技术难点都是如何解决的?

喜乐:云计算条件下要同时管理数以万计的数据库,架构上我们在原来数据库基础运维经验的背景下,通过参考和借鉴集团和行业内其他厂商和资深专家的过往经验,再结合我们自己开发条件,逐步完善起来的。

设计中对不同引擎,不同数据库的策略是各不相同的,我们的优势是系统开发同学和各数据库内核同学都在一个大团队下,所以难点攻关上,我们团队的管控服务同学和内核同学通力合作,共同克服了一个个工程问题,也通过在线上不断的实践,总结,再实践一步一步走过来的。

云栖社区:你是如何在云数据库高性能和高可靠之间进行平衡的?

喜乐:首先,成本,性能,数据可用性,可靠性对不同应用要求是不一样的,即使是金融行业的应用由于使用场景,业务不同,那么也会对这些点要求不同,那么我们充分考虑各种需求,给应用提供了更多的选择及建议,使得应用在各项指标间寻找到一个平衡点,都能找到适合自己的数据库部署结构及高可用策略。这个能力我们认为在市场中是很必要的。

云栖社区:据了解,阿里云数据库系统目前支撑了公有云7W+实例每日2W+次的日常自动化运维服务,设计的数据库高可用系统支持了mysql,pgsql,mssql等7W+线上实例7*24小时不间断服务,因此在云数据库健康检测上,是否有什么检查机制?


喜乐:我们对检查策略及实际的检测结果做了更加细致的区分,除了常见的进程crash,宕机,网络中断,对数据库卡慢的情况,也通过内核改造,提供内部运行数据,结合主机数据进行实时分析和计算,来决定是否需要failover,这样可以给用户和应用提供更好的用户体验。当前,我们也还在不断的完善和改进,这是一个不断深入的过程。

云栖社区:你认为优秀的云数据库架构设计应包含哪些要素?
喜乐:架构上应该提供更加灵活的部署方式,配置方式及高可用策略,同时也要提供专家级的建议,在架构决策上给用户提供尽可能价格合理,性能匹配,容量合适的云数据库基础设置,稳定性,性能,成本,体验四个方面应该是衡量一个云数据库产品架构最重要的几个方面。

云栖社区:在本次技术峰会上,分享这个议题主要是基于什么考虑?另外,你认为什么样的听众适合听这个分享?

喜乐:对数据库有基本的运维或者使用经验,想了解数据库架构设计,特别是数据库容灾设计的同行。

云栖社区:生活中,你还会做哪些有意义的事?

喜乐:关注失学儿童及教育,希望能够尽一些绵薄之力。


相关文章
|
7月前
|
SQL 关系型数据库 数据库
Python SQLAlchemy模块:从入门到实战的数据库操作指南
免费提供Python+PyCharm编程环境,结合SQLAlchemy ORM框架详解数据库开发。涵盖连接配置、模型定义、CRUD操作、事务控制及Alembic迁移工具,以电商订单系统为例,深入讲解高并发场景下的性能优化与最佳实践,助你高效构建数据驱动应用。
835 7
|
人工智能 关系型数据库 OLAP
聚光灯已就位!阿里云瑶池数据库邀你征战Cursor首届实战征文大赛
阿里云AnalyticDB携手Cursor中文社区,正式发起首届实战征文大赛!我们诚邀开发者融合Cursor的智能编程能力与AnalyticDB PostgreSQL提供的Supabase服务进行项目开发,让优秀项目被专家看见、被机遇拥抱!
|
负载均衡 算法 关系型数据库
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
本文聚焦 MySQL 集群架构中的负载均衡算法,阐述其重要性。详细介绍轮询、加权轮询、最少连接、加权最少连接、随机、源地址哈希等常用算法,分析各自优缺点及适用场景。并提供 Java 语言代码实现示例,助力直观理解。文章结构清晰,语言通俗易懂,对理解和应用负载均衡算法具有实用价值和参考价值。
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
|
11月前
|
关系型数据库 MySQL 数据库连接
Django数据库配置避坑指南:从初始化到生产环境的实战优化
本文介绍了Django数据库配置与初始化实战,涵盖MySQL等主流数据库的配置方法及常见问题处理。内容包括数据库连接设置、驱动安装、配置检查、数据表生成、初始数据导入导出,并提供真实项目部署场景的操作步骤与示例代码,适用于开发、测试及生产环境搭建。
496 1
|
11月前
|
SQL 数据建模 关系型数据库
别光知道存数据库了,数据建模才是王道!(入门指南+实战代码)
别光知道存数据库了,数据建模才是王道!(入门指南+实战代码)
2564 4
|
8月前
|
存储 数据库 开发者
Python SQLite模块:轻量级数据库的实战指南
本文深入讲解Python内置sqlite3模块的实战应用,涵盖数据库连接、CRUD操作、事务管理、性能优化及高级特性,结合完整案例,助你快速掌握SQLite在小型项目中的高效使用,是Python开发者必备的轻量级数据库指南。
679 0
|
存储 运维 监控
百万指标,秒级查询,零宕机——时序数据库 TDengine 在 AIOps 中的硬核实战
本篇文章详细讲述了七云团队在运维平台中如何利用 TDengine 解决海量时序数据存储与查询的实际业务需求。内容涵盖了从数据库选型、方案落地到业务挑战及解决办法的完整过程,特别是分享了升级 TDengine 3.x 时的实战经验,给到有需要的小伙伴参考阅读。
640 1
|
存储 缓存 监控
71.7万/秒到1.4万/秒!数据库查询优化实战
在现代计算机系统中,程序的局部性原理是优化性能的关键。通过利用时间局部性和空间局部性,可以显著提升数据访问效率,减少高开销的操作如内存访问和网络 I/O。本文将探讨如何利用空间局部性原理,在实际案例中减少数据库查询量,并通过详细的监控和优化措施确保系统的稳定性和高效性。
71.7万/秒到1.4万/秒!数据库查询优化实战
|
关系型数据库 数据库 数据安全/隐私保护
云数据库实战:基于阿里云RDS的Python应用开发与优化
在互联网时代,数据驱动的应用已成为企业竞争力的核心。阿里云RDS为开发者提供稳定高效的数据库托管服务,支持多种数据库引擎,具备自动化管理、高可用性和弹性扩展等优势。本文通过Python应用案例,从零开始搭建基于阿里云RDS的数据库应用,详细演示连接、CRUD操作及性能优化与安全管理实践,帮助读者快速上手并提升应用性能。
|
存储 SQL 数据库
深入浅出后端开发之数据库优化实战
【10月更文挑战第35天】在软件开发的世界里,数据库性能直接关系到应用的响应速度和用户体验。本文将带你了解如何通过合理的索引设计、查询优化以及恰当的数据存储策略来提升数据库性能。我们将一起探索这些技巧背后的原理,并通过实际案例感受优化带来的显著效果。
286 4