MongoDB的sharding功能(转)

本文涉及的产品
云数据库 MongoDB,独享型 2核8GB
推荐场景:
构建全方位客户视图
简介:

MongoDB的auto-sharding功能是指mongodb通过mongos自动建立一个水平扩展的数据库集群系统,将数据库分表存储在sharding的各个节点上。
一个mongodb集群包括一些shards(包括一些mongod进程),mongos路由进程,一个或多个config服务器

Shards
每一个shard包括一个或多个服务和存储数据的mongod进程(mongod是MongoDB数据的核心进程)
典型的每个shard开启多个服务来提高服务的可用性。这些服务/mongod进程在shard中组成一个复制集

Chunks
Chunk是一个来自特殊集合中的一个数据范围,(collection,minKey,maxKey)描叙一个chunk,它介于minKey和maxKey范围之间。
例如chunks 的maxsize大小是100M,如果一个文件达到或超过这个范围时,会被切分到2个新的chunks中。当一个shard的数据过量时,chunks将会被迁移到其他的shards上。同样,chunks也可以迁移到其他的shards上

Config Servers
Config服务器存储着集群的metadata信息,包括每个服务器,每个shard的基本信息和chunk信息
Config服务器主要存储的是chunk信息。每一个config服务器都复制了完整的chunk信息。



配置:(模拟2个shard服务和一个config服务)
Shard1:27020
Shard2:27021
Config:27022
Mongos启动时默认使用的27017端口

新建存放数据的目录

[falcon@www.fw php.cn  ~/mongodata] mkdir270202702127022[falcon@www.fwphp.cn /mongodata]mkdir270202702127022[falcon@www.fwphp.cn /mongodata] ls
27020  27021  27022

[falcon@www.fwphp.cn  ~/mongodb/bin] ./mongod --dbpath /home/falcon/mongodata/27020 --port 27020 > /home/falcon/mongodata/27020.log & 
 [falcon@www.fwphp.cn  ~/mongodb/bin]
./mongod --dbpath /home/falcon/mongodata/27020 --port 27020 > /home/falcon/mongodata/27020.log &  [falcon@www.fwphp.cn  ~/mongodb/bin]
./mongod --dbpath /home/falcon/mongodata/27021 --port 27021  > /home/falcon/mongodata/27021.log &
[falcon@www.fwphp.cn  ~/mongodb/bin]$ ./mongod --dbpath /home/falcon/mongodata/27022 --port 27022  > /home/falcon/mongodata/27022.log &

启动mongos时,默认开启了27017端口

[falcon@www.fwphp.cn  ~/mongodb/bin]$ ./mongos --configdb localhost:27022 > /home/falcon/mongodata/config.log &

检查是否启动

[falcon@www.fwphp.cn  ~/mongodb/bin] psef|grepmongofalcon26121020:15?00:00:00./mongoddbpath/home/falcon/mongodata/27020port27020falcon26191020:15?00:00:00./mongoddbpath/home/falcon/mongodata/27021port27021falcon26251020:15?00:00:00./mongoddbpath/home/falcon/mongodata/27022port27022falcon26581020:15?00:00:00./mongosconfigdblocalhost:27022falcon28042772020:31pts/000:00:00bin/mongofalcon28472812020:55pts/200:00:00grepmongo[falcon@www.fwphp.cn /mongodb/bin]ps−ef|grepmongofalcon26121020:15?00:00:00./mongod−−dbpath/home/falcon/mongodata/27020−−port27020falcon26191020:15?00:00:00./mongod−−dbpath/home/falcon/mongodata/27021−−port27021falcon26251020:15?00:00:00./mongod−−dbpath/home/falcon/mongodata/27022−−port27022falcon26581020:15?00:00:00./mongos−−configdblocalhost:27022falcon28042772020:31pts/000:00:00bin/mongofalcon28472812020:55pts/200:00:00grepmongo[falcon@www.fwphp.cn /mongodb/bin] 

[falcon@www.fwphp.cn  ~/mongodb/bin]$ netstat -an  -t
Active Internet connections (servers and established)
Proto Recv-Q Send-Q Local Address               Foreign Address             State      
tcp        0      0 0.0.0.0:10022               0.0.0.0:*                   LISTEN      
tcp        0      0 0.0.0.0:27017               0.0.0.0:*                   LISTEN      
tcp        0      0 0.0.0.0:587                 0.0.0.0:*                   LISTEN      
tcp        0      0 0.0.0.0:27020               0.0.0.0:*                   LISTEN      
tcp        0      0 0.0.0.0:27021               0.0.0.0:*                   LISTEN      
tcp        0      0 0.0.0.0:27022               0.0.0.0:*                   LISTEN      
......   
tcp        0      0 0.0.0.0:28020               0.0.0.0:*                   LISTEN      
tcp        0      0 0.0.0.0:28021               0.0.0.0:*                   LISTEN      
tcp        0      0 0.0.0.0:28022               0.0.0.0:*                   LISTEN      
tcp        0      0 127.0.0.1:631               0.0.0.0:*                   LISTEN     
........

看到以上信息证明mongodb启动完整,对于开启的28020、28021、28022是对于的http接口

[falcon@www.fwphp.cn  ~/mongodb/bin]$ ./mongo   默认连接到mongos上
MongoDB  shell version: 1.2.4-
url: test
connecting to: test
type "help" for help
> show dbs
admin
config
Local

加入shard节点

> use admin
switched to db admin

> db.runCommand( { addshard : "localhost:27020", allowLocal : true } )
{"ok" : 1 , "added" : "localhost:27020"}

> db.runCommand( { addshard : "localhost:27021", allowLocal : true } )
{"ok" : 1 , "added" : "localhost:27021"}

> db.runCommand({listshards:1});   查看shard节点列表
{
         "shards" : [
                 {
                         "_id" : ObjectId("4b9cd380c33000afad27718e"),
                         "host" : "localhost:27020"
                 },
                 {
                         "_id" : ObjectId("4b9cd381c33000afad27718f"),
                         "host" : "localhost:27021"
                 }
         ],
         "ok" : 1
}

新建自动切片的库user001:

> config = connect("localhost:27022")
> config = config.getSisterDB("config")
> user001=db.getSisterDB("user001");
user001
> db.runCommand({enablesharding:"user001"})
{ "ok" : 1 }

> db.printShardingStatus();
--- Sharding Status --- 
   sharding version: { "_id" : ObjectId("4b9cd354c33000afad27718d"), "version" : 2 }
   shards:
       { "_id" : ObjectId("4b9cd380c33000afad27718e"), "host" : "localhost:27020" }
       { "_id" : ObjectId("4b9cd381c33000afad27718f"), "host" : "localhost:27021" }
   databases:
         { "name" : "admin", "partitioned" : false, "primary" : "localhost:27022", "_id" : ObjectId("4b9cd3776693dcfa468dec13") }
         { "name" : "user001", "partitioned" : true, "primary" : "localhost:27021", "_id" : ObjectId("4b9cde866693dcfa468dec17") }
                 my chunks

我们来在user001中新建表,插入数据

> use user001
switched to db user001
> db.createCollection("user_001")
{ "ok" : 1 }
> show collections
system.indexes
user_001
> db.user_001.insert({uid:1,username:"Falcon.C",sex:"男",age:25});
> db.user_001.find();
{ "_id" : ObjectId("4b9ce1a6c84d7f20576c4df1"), "uid" : 1, "username" : "Falcon.C", "sex" : "男", "age" : 25 }

我们来看看user001库被分配到了哪个shard上

[falcon@www.fwphp.cn  ~/mongodata] lsR.:270202702127022mongos.log./27020:27020.logmongod.locktest.0test.1test.nstmp./27020/tmp:./27021:27021.logmongod.locktmpuser.0user001.0user001.1user001.nsuser.1user.ns./27021/tmp:./27022:27022.logconfig.0config.nsmongod.lockmongos.logtmp./27022/tmp:[falcon@www.fwphp.cn /mongodata]ls−R.:270202702127022mongos.log./27020:27020.logmongod.locktest.0test.1test.nstmp./27020/tmp:./27021:27021.logmongod.locktmpuser.0user001.0user001.1user001.nsuser.1user.ns./27021/tmp:./27022:27022.logconfig.0config.nsmongod.lockmongos.logtmp./27022/tmp:[falcon@www.fwphp.cn /mongodata]

从以上的文件可以看出,user001被分配到了27021的shard上了,但是通过mongos路由,我们并感觉不到是数据存放在哪个shard的chunk上


Sharding的管理命令

> db. cmd.findOne(isdbgrid:1);"isdbgrid":1,"hostname":"www.fwphp.cn","ok":1>db.cmd.findOne(isdbgrid:1);"isdbgrid":1,"hostname":"www.fwphp.cn","ok":1>db.cmd.findOne({ismaster:1});
{ "ismaster" : 1, "msg" : "isdbgrid", "ok" : 1 }
> printShardingStatus(db.getSisterDB("config"))
--- Sharding Status --- 
   sharding version: { "_id" : ObjectId("4b9cd354c33000afad27718d"), "version" : 2 }
   shards:
       { "_id" : ObjectId("4b9cd380c33000afad27718e"), "host" : "localhost:27020" }
       { "_id" : ObjectId("4b9cd381c33000afad27718f"), "host" : "localhost:27021" }
   databases:
         { "name" : "admin", "partitioned" : false, "primary" : "localhost:27022", "_id" : ObjectId("4b9cd3776693dcfa468dec13") }
                 my chunks
         { "name" : "user001", "partitioned" : true, "primary" : "localhost:27021", "_id" : ObjectId("4b9cde866693dcfa468dec17") }
                 my chunks
> use admin
switched to db admin
> db.runCommand({netstat:1})
{ "configserver" : "localhost:27022", "isdbgrid" : 1, "ok" : 1 }
>

参考信息:http://www.mongodb.org/display/DOCS/Sharding


本文转自 不得闲 博客园博客,原文链接:http://www.cnblogs.com/DxSoft/archive/2010/10/21/1857363.html   ,如需转载请自行联系原作者


相关实践学习
MongoDB数据库入门
MongoDB数据库入门实验。
快速掌握 MongoDB 数据库
本课程主要讲解MongoDB数据库的基本知识,包括MongoDB数据库的安装、配置、服务的启动、数据的CRUD操作函数使用、MongoDB索引的使用(唯一索引、地理索引、过期索引、全文索引等)、MapReduce操作实现、用户管理、Java对MongoDB的操作支持(基于2.x驱动与3.x驱动的完全讲解)。 通过学习此课程,读者将具备MongoDB数据库的开发能力,并且能够使用MongoDB进行项目开发。   相关的阿里云产品:云数据库 MongoDB版 云数据库MongoDB版支持ReplicaSet和Sharding两种部署架构,具备安全审计,时间点备份等多项企业能力。在互联网、物联网、游戏、金融等领域被广泛采用。 云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。 产品详情: https://www.aliyun.com/product/mongodb
相关文章
|
7月前
|
Oracle NoSQL 关系型数据库
实时计算 Flink版产品使用合集之MongoDB CDC connector的全量快照功能可以并发读取吗
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
124 2
|
4月前
|
存储 NoSQL 数据管理
揭秘MongoDB时间序列集合:这个超级功能将如何彻底改变你的数据管理?
【8月更文挑战第8天】时间序列数据记录随时间变化的信息,在数据库管理中至关重要。MongoDB自4.0版起引入时间序列集合,专为这类数据优化存储与查询。通过问答形式介绍其特点:自动数据过期、高效存储机制及快速查询操作。创建时需指定时间字段及可选元数据字段。支持设置数据过期时间,采用粗粒度索引减少I/O操作。查询时可通过时间范围筛选数据,并利用聚合框架进行数据分析。随着实时分析需求的增长,时间序列集合的应用将更加广泛。
189 0
|
6月前
|
存储 负载均衡 NoSQL
MongoDB的分片功能
【6月更文挑战第6天】MongoDB的分片功能
74 1
|
7月前
|
分布式计算 DataWorks NoSQL
DataWorks产品使用合集之在 DataWorks 中,离线同步的一键生成目标表结构功能不能识别 MongoDB 数据源如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
66 0
|
存储 人工智能 NoSQL
MongoDB推出高级数据管理功能,实现随处可运行应用程序
借助MongoDB Atlas for the Edge,企业不仅可以安全地存储数据,还可以跨越不同数据源和目的地实时同步数据,从而提供具有高可用性、高弹性和高可靠性的应用程序
|
NoSQL 测试技术 API
Eolink Apikit 版本更新:「数据字典」功能上线、支持 MongoDB 数据库操作...
Eolink Apikit 版本更新: 1. 搭建自定义接口协议架构,支持快速适配金融行业各类型私有协议的导入、编辑和展示。 2. 数据字典功能上线,支持以数据字典的形式管理参数枚举值。 3. 数据库连接支持 MongoDB 数据库操作。 4. 基于 Apikit 类型导入 API 数据支持增量更新。
87 0
|
存储 NoSQL 分布式数据库
MongoDB性能系列最佳实践-Sharding
MongoDB将会推出一系列介绍MongoDB性能最佳实践的文章,旨在帮助用户在多个关键方面实现规模化性能优化。
MongoDB性能系列最佳实践-Sharding
|
数据可视化 前端开发 NoSQL
【BackEnd】SpringBoot整合MongoDB实现登录注册功能(适合初学者)
该项目使用SpringBoot2.7+MongoDB实现的登录注册Demo,可作为启动项目的BaseLine
311 0
|
存储 传感器 缓存
MongoDB 功能详解之时间序列集合(Time Series Collections)
时间序列集合(Time Series Collections):MongoDB 5.0 版本中的新功能。
|
NoSQL MongoDB
《阿里云MongoDB备份恢复功能说明和原理介绍》电子版地址
阿里云MongoDB备份恢复功能说明和原理介绍
103 0
《阿里云MongoDB备份恢复功能说明和原理介绍》电子版地址