数据库管理 │ 浅谈从集中式到分布式数据库的转型要点

简介: 数据库管理 │ 浅谈从集中式到分布式数据库的转型要点

银行传统上使用的Oracle、Db2等商业数据库,都属于集中式架构。集中式数据库安装在单台服务器上,供本地用户和远程用户访问。

image.png


01、和传统集中式数据库的区别


与集中式数据库相比,分布式数据库有以下区别。

性价比:较传统集中式数据库,性价比更高;

性能上:整体性能优于传统集中式数据库;

可靠性:集中式数据库通常选择IBM小机,IBM小机可靠性高,分布式数据库组成x86服务器集群提升可靠性;

扩展性:集中式数据库通常纵向扩展(增加CPU个数、增加内存),分布式数据库可以纵向与横向同时扩展。


02、分布式数据库特点


扩展性:能够按照需求变化进行动态伸缩,支持横向与纵向扩展。

可靠性:不存在单点,服务不会因为单点失效问题而中断,切换机制要更丰富、整体容灾能力更强,数据可靠性、服务可用性有较高质量的保障。

高性能:由多台物理服务器组成,性能与数量成正比,基本呈线性增长。


03、分布式架构的局限性


分布式数据库带来了数据去中心化、负载分摊的优势,同时也带来了某些局限性。不单需要从架构上解决,还需要通过应用和规范来解决。

(1)分布式架构带来的复杂性,比集中式数据库运维难度大。

解决方案:通过平台化运维的新思路,统一上报告警及统计信息、统一日志中心、自动化监控、自动化运维、自动化巡检等。

(2)X86服务器可靠性低。

解决方案:服务器和数据都进行冗余配置,当出现节点故障时,通过主备切换保证服务的持续可用性。

(3)应用设计复杂度高。

解决方案:设计层面需合理设置分发键、增加冗余字段、减少多表关联、尽可能减少跨节点交互。

(4)分布式事务一致性维护成本高。

解决方案:分布式依赖网络,网络问题会导致事务一致性提交时间变长,因此应用编写的SQL语句应尽可能带分发键,减少跨节点事务数量。


04、分布式数据库设计与运维需要注意的点


从集中式数据库转型到分布式数据库后,需要从以下几方面关注设计开发和运维方面带来的新问题。


1●设计开发方面

设计开发方面主要涉及SQL兼容性问题、性能问题、异地一致性问题等。

(1)SQL兼容性问题。

GoldenDB完全兼容MySQL语法。但部分语句在分布式环境下执行代价过大,通过产品迭代,完善执行效率、逐步放开代价过大的SQL语句功能。

(2)性能问题。

由于数据切分到多个数据节点,涉及网络通信的交互次数和交换的数据量较多时,存在SQL语句性能慢、锁冲突、多分片访问不均匀问题,需要采取针对性的优化方案。

(3)异地数据一致性。

由于网络时延、网络带宽等问题,异地数据可能存在一致性问题。异地对外提供服务前,分布式数据库会进行业务数据一致性对齐,自动恢复到最新的一致性时间点。、


2●运维方面

运维方面主要涉及用户安全问题、数据安全问题、扩展性问题等,


(1)用户安全。

分布式数据库中涉及多种用户,包括Linux操作系统用户、数据库用户,对这些用户如何进行管理是个难题。需要按照相关规范控制用户权限:。

(2)数据安全。

数据的安全问题是重中之重,从设计、部署到日常运维均需要保障。

(3)扩展性。

扩展性包括纵向扩展和横向扩展,纵向扩展增加硬件,横向扩展增加数据分片。横向扩容之后需要重分布,重分布之前规划磁盘空间,确保空间足够。

(4)运维中的性能问题。

通过监控及时发现性能问题并进行优化。

(5)监控问题。

分布式数据库组件众多,通过单一种类的监控定位问题比较困难,需要一套或者多套监控体系配合来精准定位到故障节点。

(6)巡检问题。

需要开发一键式巡检脚本,通过生成的巡检报告展示分布式数据库运行趋势,从而配合监控更早定位出问题。

(7)备份恢复问题。

对数据备份和一致性恢复要求高,目前使用NBU软件进行备份恢复。

(8)读写分离问题。

为了提升交易处理的吞吐量,将读操作分流到备机。

(9)自动化应急。

分布式数据库涉及的组件多,必须实现自动化应急,真正做到“预防为主,处置高效”。


目录
相关文章
|
8天前
|
分布式计算 Java Hadoop
杨校老师课堂之分布式数据库HBase的部署和基本操作
杨校老师课堂之分布式数据库HBase的部署和基本操作
19 0
|
24天前
|
存储 缓存 NoSQL
浅谈分布式数据库系统
【6月更文挑战第4天】该文探讨了数据库管理系统的解决方案,建议使用Redis和MQ作为缓存和中转,减轻数据库压力。分布式系统需透明处理数据位置,解决查询执行和正确性问题。了解这些底层设计有助于应对性能挑战。
39 8
浅谈分布式数据库系统
|
23天前
|
监控 NoSQL 数据建模
使用Apache Cassandra进行分布式数据库管理的技术实践
【6月更文挑战第5天】本文探讨了使用Apache Cassandra进行分布式数据库管理的技术实践。Cassandra是一款高性能、可扩展的NoSQL数据库,适合大规模、高并发场景。文章介绍了其高可扩展性、高性能、高可用性和灵活数据模型等核心特性,并详细阐述了环境准备、安装配置、数据建模与查询以及性能优化与监控的步骤。通过本文,读者可掌握Cassandra的运用,适应不断增长的数据需求。
|
1天前
|
关系型数据库 MySQL 数据库
深入OceanBase分布式数据库:MySQL 模式下的 SQL 基本操作
深入OceanBase分布式数据库:MySQL 模式下的 SQL 基本操作
|
1天前
|
存储 分布式数据库 数据库
深入OceanBase内部机制:分区构建高可用、高性能的分布式数据库基石
深入OceanBase内部机制:分区构建高可用、高性能的分布式数据库基石
|
1天前
|
存储 关系型数据库 MySQL
深入OceanBase内部机制:高性能分布式(实时HTAP)关系数据库概述
深入OceanBase内部机制:高性能分布式(实时HTAP)关系数据库概述
|
22天前
|
存储 安全 关系型数据库
分布式数据库的性能和安全麻烦
【6月更文挑战第6天】该文探讨了分布式系统中节点交互的两种方式,并对比mysql和oracle两个数据库的CAP平衡模式。
43 0
分布式数据库的性能和安全麻烦
|
10天前
|
存储 NoSQL Java
HBase是一个开源的、分布式的、面向列的NoSQL数据库系统
HBase是一个开源的、分布式的、面向列的NoSQL数据库系统
40 0
|
16天前
|
存储 分布式计算 Hadoop
【大数据】分布式数据库HBase下载安装教程
【大数据】分布式数据库HBase下载安装教程
28 0

热门文章

最新文章