MongoDB 面试题

1. 什么是MongoDB?

MongoDB是一种非关系型数据库,被广泛用于大型数据存储和分布式系统的构建。MongoDB支持的数据模型比传统的关系型数据库更加灵活,支持动态查询和索引,也支持BSON格式的数据存储,这种格式可以支持读取和写入大量的数据。

2. MongoDB的优势是什么?

MongoDB的优势主要包括:

灵活的数据模型:MongoDB支持动态查询和索引,可以支持更大的数据集。

分布式扩展:MongoDB可以轻松地横向扩展,支持跨多个服务器分布数据,实现高可用性和负载均衡。

大规模数据存储:MongoDB支持海量数据存储,提供非常高的性能和可扩展性。

易于使用:MongoDB提供简单的命令行工具和可视化界面,支持多种编程语言,易于使用和自定义。

3. MongoDB的工作原理是什么?

MongoDB基于JSON格式存储数据,并使用BSON格式处理数据。它支持多个数据节点的分布式存储,每个数据节点都可以独立扩展。MongoDB可以自动化控制数据的复制和故障转移。需要注意的是,MongoDB不支持跨节点的事务。

4. MongoDB的数据存储格式是什么?

MongoDB将数据存储为对应的BSON格式文件,这个文件是二进制的,可以通过MongoDB提供的命令行工具进行读取和写入。BSON是Binary JSON的缩写,是JSON的一种扩展,能够更快地将数据存储和读取到MongoDB数据库中。

5. 什么是MongoDB索引?

MongoDB索引是为一个或者多个文档字段创建的数据结构,能够帮助MongoDB更加快速地执行查询操作。索引可以被定义为唯一的,如果这样定义,MongoDB将确保所有的值都不同。MongoDB支持单边和多边索引,可以深度嵌套和数组字段的嵌套索引。

使用db.collection.createIndex()在集合中创建一个索引

6. 如何优化MongoDB查询性能?

MongoDB查询性能可以优化的方法包括:

为查询字段创建索引:在查询频繁的字段上创建索引,能够提高查询速度。

限制查询结果的数量:可以使用skip()和limit()方法分页,减少查询结果大小。

只查询需要的字段:使用projection或者特定字段查询的方式,避免查询所有字段,减少网络传输带宽。

使用聚合查询:使用聚合查询代替多个单独的查询语句,可以提高性能。

为数据结构优化设计:为了优化结构设计,尽可能减少重复的数据。

7. MongoDB的复制如何工作?

MongoDB的复制工作是基于主从复制实现的。其中一个节点被定义为主节点,使用replica set的方式,其他的节点被定义为备份节点,数据会进行实时同步。在某些情况下,主节点可能会失效或消失,这时候从节点将被提升为主节点继续工作。

8. MongoDB的副本集是什么?

MongoDB的副本集是一组备份节点,用于实现高度的可用性。副本集维护多个数据节点,其中的一个被定义为主节点,其他的节点都被定义为备份节点。如果主节点在崩溃,选择另外一个节点作为主节点。

9. 如何区分MongoDB和关系型数据库?

MongoDB相较关系型数据库有以下几个显著的不同点:

数据结构不同:MongoDB使用文档形式存储数据,而关系型数据库使用表这种结构体来存储数据。

索引不同:MongoDB支持的索引比关系型数据库更加灵活。

分布式和可扩展性强:MongoDB具有高度的可扩展性和分布式数据库的特性,能够支持海量数据存储。而关系型数据库的可扩展性较差,虽然引入到分布式系统,但是需要较多的数据库连接和配置。

10. 什么是MongoDB的聚合函数?

MongoDB的聚合函数用于对文档进行分组和汇总操作,支持对数据进行复杂计算和处理。聚合函数对于数据分析和统计非常有用,通过数据分组可以更快的获取收集数据中的关键信息。聚合函数可以支持多个匹配条件,同时也可以支持分组计算,并提供了丰富可运算算法和运算符支持。

db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)

11. MongoDB成为最好NoSQL数据库的原因是什么?

以下特点使得MongoDB成为最好的NoSQL数据库:

  • 面向文件的
  • 高性能
  • 高可用性
  • 易扩展性
  • 丰富的查询语言

12. 在哪些场景使用MongoDB?

  • 大数据
  • 内容管理系统
  • 移动端Apps
  • 数据管理

13. MongoDB支持哪些数据类型

  • String
  • Integer
  • Double
  • Boolean
  • Object
  • Object ID
  • Arrays
  • Min/Max Keys
  • Datetime
  • Code
  • Regular Expression等

14.如何查询集合中的文档

db.collectionName.find({

     key:value})

15. 用什么方法可以格式化输出结果

db.collectionName.find().pretty()

16. 更新数据

db.collectionName.update({

     key:value},{

     $set:{

     newkey:newValue}})

17. 如何删除文档

db.collectionName.remove({

     key:value})

18. 在MongoDB中如何排序

并使用1 和 -1 来指定排序方式,其中 1 表示升序,而 -1 表示降序。

db.connectionName.find({

     key:value}).sort({

     columnName:1})

19. 如何理解MongoDB中的GridFS机制,MongoDB为何使用GridFS来存储文件?

GridFS是一种将大型文件存储在MongoDB中的文件规范。使用GridFS可以将大文件分隔成多个小文档存放,这样我们能够有效的保存大文档,而且解决了BSON对象有限制的问题

20. 索引类型有哪些?

  • 单字段索引(Single Field Indexes)
  • 复合索引(Compound Indexes)
  • 多键索引(Multikey Indexes)
  • 全文索引(text Indexes)
  • Hash 索引(Hash Indexes)
  • 通配符索引(Wildcard Index)
  • 2dsphere索引(2dsphere Indexes)

21. 复制集节点类型有哪些?

  • 优先级0型(Priority 0)节点
  • 隐藏型(Hidden)节点
  • 延迟型(Delayed)节点
  • 投票型(Vote)节点以及不可投票节点

22. 更新操作立刻fsync到磁盘?

不会,磁盘写操作默认是延迟执行的.写操作可能在两三秒(默认在60秒内)后到达磁盘.例如,如果一秒内数据库收到一千个对一个对象递增的操作,仅刷新磁盘一次.

23. 我怎么查看 Mongo 正在使用的链接?

db._adminCommand("connPoolStats");

24. MongoDB支持存储过程吗?如果支持的话,怎么用?

MongoDB支持存储过程,它是javascript写的,保存在db.system.js表中。

25.如果一个分片(Shard)停止或很慢的时候,发起一个查询会怎样?

如果一个分片停止了,除非查询设置了“Partial”选项,否则查询会返回一个错误。如果一个分片响应很慢,MongoDB会等待它的响应。

26. 分片(sharding)和复制(replication)是怎样工作的?

每一个分片(shard)是一个分区数据的逻辑集合。分片可能由单一服务器或者集群组成,我们推荐为每一个分片(shard)使用集群。

27. 数据在什么时候才会扩展到多个分片(shard)里?

MongoDB 分片是基于区域(range)的。所以一个集合(collection)中的所有的对象都被存放到一个块(chunk)中。只有当存在多余一个块的时候,才会有多个分片获取数据的选项。现在,每个默认块的大小是 64Mb,所以你需要至少 64 Mb 空间才可以实施一个迁移。

28. 什么是master或primary?

它是当前备份集群(replica set)中负责处理所有写入操作的主要节点/成员。在一个备份集群中,当失效备援(failover)事件发生时,一个另外的成员会变成primary。

29. 什么是secondary或slave?

Seconday从当前的primary上复制相应的操作。它是通过跟踪复制oplog(local.oplog.rs)做到的。

30. 你怎么比较MongoDB、CouchDB及CouchBase?

MongoDB和CouchDB都是面向文档的数据库。MongoDB和CouchDB都是开源NoSQL数据库的最典型代表。 除了都以文档形式存储外它们没有其他的共同点。MongoDB和CouchDB在数据模型实现、接口、对象存储以及复制方法等方面有很多不同。

细节可以参见下面的链接:

MongDB vs CouchDB

CouchDB vs CouchBase