二十七、MongoDB 分片集群技术

海量的数据使得单台 MongoDB 存储显得吃力且难以满足提供可接受的读写吞吐量

通过将数据分割到多台服务器就变得越来越重要,使得 MongoDB 数据库系统能存储和处理更多的数据

为什么使用分片

1、 复制所有的写入操作到主节点;
2、 延迟的敏感数据会在主节点查询;
3、 单个副本集限制在12个节点;
4、 当请求量巨大时会出现内存不足;
5、 本地磁盘不足;
6、 垂直扩展价格昂贵;

MongoDB分片

下图展示了 MongoDB 分片集群结构分布

 

MongoDB 分片集群技术主要有三个组件

1、 ShardServer

用于存储实际的数据块  
一个 shard server 角色可由几台机器组一个负载均衡承担,防止主机单点故障

2、 ConfigServer

mongod 实例,存储了整个 Cluster Metadata,包括 chunk 信息

3、 QueryRouters

前端路由  
客户端由此接入,且让整个集群看上去像单一数据库

MongoDB 分片技术搭建范例

假设 MongoDB 分片集群结构组件如下所示

Shard Server

Shard Server 1:localhost:27020
Shard Server 2:localhost:27021
Shard Server 3:localhost:27022
Shard Server 4:localhost:27023

Config Server

Config Server :localhost:27100

Query Routers Server

Route Process:localhost:40000

MongoDB 分片集群搭建步骤

1、 启动ShardServer

    [root@ddkk.com ~]# mkdir -p /mnt/data/www/mongodb/shared/s0
    [root@ddkk.com ~]# mkdir -p /mnt/data/www/mongodb/shared/s1
    [root@ddkk.com ~]# mkdir -p /mnt/data/www/mongodb/shared/s2
    [root@ddkk.com ~]# mkdir -p /mnt/data/www/mongodb/shared/s3
    [root@ddkk.com ~]# mkdir -p /mnt/data/www/mongodb/shared/log
    [root@ddkk.com ~]#        
    [root@ddkk.com ~]#
    [root@ddkk.com ~]# /usr/local/mongodb/bin/mongod --port 27020 --dbpath=/mnt/data/www/mongodb/shared/s0 --logpath=/mnt/data/www/mongodb/shared/log/s0.log --logappend --fork
    [root@ddkk.com ~]#
    [root@ddkk.com ~]# /usr/local/mongodb/bin/mongod --port 27021 --dbpath=/mnt/data/www/mongodb/shared/s1 --logpath=/mnt/data/www/mongodb/shared/log/s1.log --logappend --fork
    [root@ddkk.com ~]#
    [root@ddkk.com ~]# /usr/local/mongodb/bin/mongod --port 27022 --dbpath=/mnt/data/www/mongodb/shared/s2 --logpath=/mnt/data/www/mongodb/shared/log/s2.log --logappend --fork
    [root@ddkk.com ~]#
    [root@ddkk.com ~]# /usr/local/mongodb/bin/mongod --port 27023 --dbpath=/mnt/data/www/mongodb/shared/s3 --logpath=/mnt/data/www/mongodb/shared/log/s3.log --logappend --fork

2、 启动ConfigServer

    [root@ddkk.com ~]# mkdir -p /mnt/data/www/mongodb/shared/config
    [root@ddkk.com ~]# /usr/local/mongodb/bin/mongod --port 27100 --dbpath=/mnt/data/www/mongodb/shared/config --logpath=/mnt/data/www/mongodb/shared/log/config.log --logappend --fork

**注意:** 我们可以像启动普通 mongodb 服务一样启动,不需要添加 —shardsvr 和 configsvr 参数,因为这两个参数的作用就是改变启动端口的,只要我们自行指定了端口就可以

3、 启动QueryRoutersServer

    [root@ddkk.com ~]# /usr/local/mongodb/bin/mongos --port 40000 --configdb localhost:27100 --fork --logpath=/mnt/data/www/mongodb/shared/log/route.log --chunkSize 500
    mongos 启动参数中,chunkSize 这一项是用来指定 chunk 的大小的,单位是 MB,默认大小为 200MB

4、 配置Sharding

我们使用 MongoDB Shell 登录到 mongos ,添加 Shard 节点

    [root@ddkk.com ~]# /usr/local/mongodb/bin/mongo admin --port 40000
    MongoDB shell version v3.4.9
    connecting to: mongodb://127.0.0.1:40000/admin
    MongoDB server version: 3.4.9
    mongos> db.runCommand({ addshard:"localhost:27020" })
    { "shardAdded" : "shard0000", "ok" : 1 }
    mongos> db.runCommand({ addshard:"localhost:27021" })
    { "shardAdded" : "shard0001", "ok" : 1 }
    mongos> db.runCommand({ addshard:"localhost:27022" })
    { "shardAdded" : "shard0002", "ok" : 1 }
    mongos> db.runCommand({ addshard:"localhost:27023" })
    { "shardAdded" : "shard0003", "ok" : 1 }

--------------------

    mongos> db.runCommand({ enablesharding:"test" })设置分片存储的数据库
    { "ok" : 1 }
    mongos> db.runCommand({ shardcollection: "test.log", key: { id:1,time:1}})
    { "collectionsharded" : "test.log", "ok" : 1 }

5、 程序代码内无需太大更改,直接按照连接普通的mongo数据库,但需要将数据库连接接入端口改为40000;