备案控制台

开发者社区数据库文章正文

设计思想赏析-单表超大数据量处理-水平切割法

2023-08-30 222

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 设计思想赏析-单表超大数据量处理-水平切割法

MySQL分表

MySQL环境中，单表建议容量不超过千万条，否则查询效率会有较大影响。在常规的索引、读写分离、合理sql等方法都用上之后，剩下的方法就是分区分表，分表（sharding）就是水平切割。

mysql5.1版本开始，提供分区（PARTITION）功能，也是对表数据进行切分你的方法之一。分表是把一张大表拆成N张小表；分区是把一张大表的数据分别存储在若干个区块上，仍然还是一张表。

分表策略一般有几类：

1.数字id可以按照数字范围切分，比如上图所示，ID为1~1000w的，放在第一个节点上；10000001~2000w的，放在第二节点上，依次类推。这种方法的好处是方便检索，按id查能够快速定位到那个节点，扩容也方便，增加一个节点就好了；不好的地方是数据不均匀，最后一个节点由于数据比较热，访问的频次会非常大。

2.为了解决数据热点问题，可以采用取模的方式，进行切分。一般设置2^n个节点，对数字的2^n取模。这种方法的好处是起到负载均衡的作用，热点数据会均衡的散落在各个节点中。坏处是扩容比较费劲，不能随意扩容，只能进行双倍扩容，否则需要进行重新sharding。

3.如果是日志类的数据，可以按照日期进行切分。

文章标签：

云原生大数据计算服务 MaxCompute

关系型数据库

MySQL

SQL

负载均衡

存储

相关实践学习

基于MaxCompute的热门话题分析

Apsara Clouder大数据专项技能认证配套课程：基于MaxCompute的热门话题分析

大数据架构师

目录

相关文章

云梦泽123

|

JSON Shell DataX

DataX定时执行json脚本文件

DataX定时执行json脚本文件

云梦泽123

960 0 0

最好zzz

|

数据采集 Java 数据安全/隐私保护

Spring Boot 3.3中的优雅实践：全局数据绑定与预处理

【10月更文挑战第22天】在Spring Boot应用中，`@ControllerAdvice`是一个强大的工具，它允许我们在单个位置处理多个控制器的跨切面关注点，如全局数据绑定和预处理。这种方式可以大大减少重复代码，提高开发效率。本文将探讨如何在Spring Boot 3.3中使用`@ControllerAdvice`来实现全局数据绑定与预处理。

最好zzz

293 2 2

微帧科技Visionular

|

计算机视觉

HDR的主要标准有哪些？

HDR（高动态范围）技术通过提供更广阔的亮度范围和丰富的色彩细节，显著提升图像质量，使电影、图片和游戏画面更加逼真。相比SDR，HDR拥有更宽的色域、更高的色深和动态范围，支持多种行业标准如HDR10、Dolby Vision、HDR10+、HLG和HDR Vivid，为用户带来更接近真实的视觉体验。

微帧科技Visionular

1398 7 7

我也要当昏君

|

算法 NoSQL 容器

1.贪心理论与常见的证明方法

1.贪心理论与常见的证明方法

我也要当昏君

328 0 0

powdba

|

Oracle 关系型数据库大数据

DataX配置及使用

powdba

32208 0 1

羽林小王子

|

SQL 机器学习/深度学习分布式计算

spark与pyspark教程（一）

spark与pyspark教程（一）

羽林小王子

945 0 0

大数据架构师

|

存储数据采集关系型数据库

数据仓库模型全景

数据仓库模型全景

大数据架构师

436 0 1

大数据架构师

|

安全前端开发架构师

技术文档中的各种架构图该怎么画？ by彭文华

技术文档中的各种架构图该怎么画？ by彭文华

大数据架构师

756 0 1

大数据架构师

|

存储搜索推荐数据建模

（下）原理都懂，就是不会建模？来，顶尖数据模型走一波

（下）原理都懂，就是不会建模？来，顶尖数据模型走一波

大数据架构师

768 1 1

大数据架构师

|

搜索推荐领域建模调度

（上）原理都懂，就是不会建模？来，顶尖数据模型走一波

（上）原理都懂，就是不会建模？来，顶尖数据模型走一波

大数据架构师

650 1 1

热门文章

最新文章

RPA学习第一课 --初识RPA

Kubernetes中的Pod无法访问外网-Ubuntu16.04 LTS

docker启动容器时报错：iptables: No chain/target/match by that name

C++ ＜windows.h＞库函数探究初步：句柄操作

Eclipse Oxygen 如何正确配置Java 9 SDK

阿里云Intel Xeon Platinum 8269CY（Cascade Lake）处理器CPU性能评测

python获取pdf和word文档页数

redolog文件头简单探究

IbatisNet支持2.0的版本Release 发布了

【Oracle】在线重定义表

2026年阿里云服务器租用价格表（一年/按月/按小时报价明细）

2026年阿里云服务器租用收费标准与最新活动价格表，手动整理

Lux 上手指南：让 AI 直接操作你的电脑

技术人视角：传统产品经理如何系统性转型AI产品经理

Web3 的真相：天天喊去中心化，可中心到底“藏”在哪？

容器跑起来才是危险的开始：聊聊 Falco + eBPF + 行为检测这套“运行时安全真功夫”

Flink 最近又“进化”了：状态后端与 Savepoint，真不是背概念那么简单

libicu-62.1-6.ky10.x86_64.rpm 安装步骤详解（麒麟V10系统）

什么是 Code 39?

基于深度学习的水稻病虫害检测系统

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

基于Python+Vue开发的口腔牙科预约管理系统