分片节点:数据切分后,一个大表被分到不同的分片数据库上面,每个表分片所在的数据库就是分片节点(dataNode)。
节点主机:数据切分后,每个分片节点(dataNode)不一定回独占一台机器,同一个机器上面可以有多个分片数据库,这样一个或者多个分片节点(dataNode)所在的机器就是节点主机(datahost),为了规避单节点主机并发数限制,尽量将读写压力高的分片节点(dataNode)均衡的放在不同的节点主机。
分片规则:
前面讲了数据切分,一个大表被分成若干个分片表,就需要一定的规则,这样按照某种业务规则把数据分到某个分片的规则就是分片规则,数据切分选择合适的分片规则非常重要,将极大的避免后续数据处理的难度。
全局序列号:
数据切分后,原有的关系数据库中的主键约束在分布式条件下降无法使用,因此需要引入外部机制保证数据唯一标识,这种保证全局的数据唯一标识的机制就是全局序列号
。