分库分表,做到永不迁移数据和避免热点的方法

简介: 分库分表,做到永不迁移数据和避免热点的方法: 基础: 1、数据拆分方式:垂直拆分,水平拆分。 2、垂直拆分:原来就一个数据库,数据量一大了,就拆分为多个数据库。 3、水平拆分:原来是t_order表,拆分成t_order_1、t_order_2、t_order_3、t_order_4。
分库分表,做到永不迁移数据和避免热点的方法:
    基础:
      1、数据拆分方式:垂直拆分,水平拆分。
      2、垂直拆分:原来就一个数据库,数据量一大了,就拆分为多个数据库。
      3、水平拆分:原来是t_order表,拆分成t_order_1、t_order_2、t_order_3、t_order_4。
      4、Mysql单表存储推荐是百万级,尽量别到千万级。
    分库分表方案:
      1、常用的方案:hash取模、range范围方案,分库分表方案最主要的就是路由算法,把路由的key按照指定的算法进行路由存放。        
      2、hash取模方案(无热点问题,扩容困难)
          (一)、首先预估一下总数据量m,设定每张表的最大数据量n,m/n=z 是表个数。
          (二)、hash方案就是对指定的路由key(如:id)对z进行取模,"t_order_"+id%z 是表名字。
          (三)、优缺点:优点是数据均匀的分布在每张表中,不会有热点问题;缺点是数据的迁移或者扩容会很麻烦。
      3、range范围方案(不需要迁移数据,有热点问题)
          (一)、range方案是以范围进行数据拆分:id=50在0~1000的在t_order_0表、id=1050在1000~2000的t_order_1表等。
          (二)、优缺点:优点是扩容方便,不需要数据迁移;缺点是id在0-1000时,t_order_0会很忙,t_order_1,t_order_2...t_order_n...都没有数据的访问,一段时间只有一个热点表。
      4、range和hash组合方案
          (一)、设计是比较简单的,就三张表,把group,db,table之间建立好关联关系。
          group表字段:group_id,group_name,start_id,end_id
          db表字段:db_id,db_name,group_id,hash_value
          group和db的关系表字段:table_id,table_name,db_id,start_id,end_id
          
  分库分表就会带来各种join组合条件的分页查询问题,怎样解决分页查询问题,很有挑战性。   
  
  1.事务问题:
    (1)、分布式事务 (2)、通过应用程序与数据库共同控制实现事务
          方案一:使用分布式事务
              优点:交由数据库管理,简单有效
              缺点:性能代价高,特别是shard(分片)越来越多时
          方案二:由应用程序和数据库共同控制
               原理:将一个跨多个数据库的分布式事务分拆成多个仅处
                     于单个数据库上面的小事务,并通过应用程序来总控
                     各个小事务。
               优点:性能上有优势
               缺点:需要应用程序在事务控制上做灵活设计。如果使用  
                     了spring的事务管理,改动起来会面临一定的困难。
  2.跨节点Join的问题
       只要是进行切分,跨节点Join的问题是不可避免的。但是良好的设计和切分却可以减少此类情况的发生。解决这一问题的普遍做法是分两次查询实现。在第一次查询的结果集中找出关联数据的id,根据这些id发起第二次请求得到关联数据。

  3.跨节点的count,order by,group by以及聚合函数问题

      这些是一类问题,因为它们都需要基于全部数据集合进行计算。多数的代理都不会自动处理合并工作。

  解决方案:与解决跨节点join问题的类似,分别在各个节点上得到结果后在应用程序端进行合并。和join不同的是每个结点的查询可以并行执行,因此很多时候它的速度要比单一大表快很多。但如果结果集很大,对应用程序内存的消耗是一个问题。

    
相关文章
|
存储 SQL Cloud Native
深入了解云原生数据库CockroachDB的概念与实践
作为一种全球领先的分布式SQL数据库,CockroachDB以其高可用性、强一致性和灵活性等特点备受关注。本文将深入探讨CockroachDB的概念、设计思想以及实践应用,并结合实例演示其在云原生环境下的优越表现。
|
自然语言处理 Dubbo Java
【面试问题】Dubbo 推荐用什么协议?
【1月更文挑战第27天】【面试问题】Dubbo 推荐用什么协议?
|
SpringCloudAlibaba 网络协议 Cloud Native
Spring Cloud Alibaba-全面详解(学习总结---从入门到深化)
Spring Cloud Alibaba致力于提供微服务开发的一站式解决方案。
14793 2
Spring Cloud Alibaba-全面详解(学习总结---从入门到深化)
|
SQL 缓存 NoSQL
接口的幂等性设计和防重保证,详细分析幂等性的几种实现方法
本篇文章详细说明了幂等性,解释了什么是幂等性,幂等性的使用场景,讨论了幂等和防重的概念。分析了幂等性的情况以及如何设计幂等性服务。阐述了幂等性实现防重的几种策略,包括乐关锁,防重表,分布式锁,token令牌以及支付缓冲区。
8319 0
接口的幂等性设计和防重保证,详细分析幂等性的几种实现方法
|
存储 数据采集 安全
各种系统架构图与详细说明
原文:各种系统架构图与详细说明 共享平台逻辑架构设计 如上图所示为本次共享资源平台逻辑架构图,上图整体展现说明包括以下几个方面: 1 应用系统建设 本次项目的一项重点就是实现原有应用系统的全面升级以及新的应用系统的开发,从而建立行业的全面的应用系统架构群。
26419 1
|
Java Apache
java依赖冲突解决问题之NoClassDefFoundError异常如何解决
java依赖冲突解决问题之NoClassDefFoundError异常如何解决
|
前端开发 API UED
React组件生命周期详解
【9月更文挑战第4天】在React应用开发中,掌握组件生命周期对于管理状态和属性至关重要,并能有效提升应用性能。本文详细介绍了React组件生命周期的三个阶段:挂载、更新和卸载,并通过代码示例展示了如何避免状态更新导致的死循环及优化网络请求等问题,帮助开发者构建更高效、可维护的应用。
260 3
|
开发工具 git
Git 中 merge 和 rebase 的区别
$ git pull --rebase和$ git pull区别 是git fetch + git merge FETCH_HEAD的缩写,所以默认情况下,git pull就是先fetch,然后执行merge操作,如果加-rebase参数,就是使用git rebase代替git merge 。
29561 0
|
SQL 消息中间件 监控
分库分表后,数据库数据一致性问题如何解决?
分库分表后,数据库数据一致性问题如何解决?