如何提升MongoDB的性能

53次阅读
没有评论

共计 2278 个字符,预计需要花费 6 分钟才能阅读完成。

自动写代码机器人,免费开通

如何提升 MongoDB 的性能?相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。

(1)文档中的_id 键推荐使用默认值,禁止向_id 中保存自定义的值。

解读:MongoDB 文档中都会有一个“_id”键,默认是个 ObjectID 对象(标识符中包含时间戳、机器 ID、进程 ID 和计数器)。MongoDB 在指定_id 与不指定_id 插入时 速度相差很大,指定_id 会减慢插入的速率。

(2)推荐使用短字段名。

解读:与关系型数据库不同,MongoDB 集合中的每一个文档都需要存储字段名,长字段名会需要更多的存储空间。

(3)MongoDB 索引可以提高文档的查询、更新、删除、排序操作,所以结合业务需求,适当创建索引。

(4)每个索引都会占用一些空间,并且导致插入操作的资源消耗,因此,建议每个集合的索引数尽量控制在 5 个以内。

(5)对于包含多个键的查询,创建包含这些键的复合索引是个不错的解决方案。复合索引的键值顺序很重要,理解索引最左前缀原则。

解读:例如在 test 集合上创建组合索引{a:1,b:1,c:1}。执行以下 7 个查询语句:

db.test.find({a:”hello”}) // 1
db.test.find({b:”sogo”, a:”hello”}) // 2
db.test.find({a:”hello”,b:”sogo”, c:”666”}) // 3
db.test.find({c:”666”, a:”hello”}) // 4
db.test.find({b:”sogo”, c:”666”}) // 5
db.test.find({b:”sogo” }) // 6
db.test.find({c:”666”}) // 7

以上查询语句可能走索引的是 1、2、3、4

查询应包含最左索引字段,以索引创建顺序为准,与查询字段顺序无关。

最少索引覆盖最多查询。

(6)TTL 索引(time-to-live index,具有生命周期的索引),使用 TTL 索引可以将超时时间的文档老化,一个文档到达老化的程度之后就会被删除。

解读:创建 TTL 的索引必须是日期类型。TTL 索引是一种单字段索引,不能是复合索引。TTL 删除文档后台线程每 60s 移除失效文档。不支持定长集合。

(7)需要在集合中某字段创建索引,但集合中大量的文档不包含此键值时,建议创建稀疏索引。

解读:索引默认是密集型的,这意味着,即使文档的索引字段缺失,在索引中也存在着一个对应关系。在稀疏索引中,只有包含了索引键值的文档才会出现。

(8)创建文本索引时字段指定 text,而不是 1 或者 -1。每个集合只有一个文本索引,但是它可以为任意多个字段建立索引。

解读:文本搜索速度快很多,推荐使用文本索引替代对集合文档的多字段的低效查询。

(9)使用 findOne 在数据库中查询匹配多个项目,它就会在自然排序文件集合中返回第一个项目。如果需要返回多个文档,则使用 find 方法。

(10)如果查询无需返回整个文档或只是用来判断键值是否存在,可以通过投影(映射)来限制返回字段,减少网络流量和客户端的内存使用。

解读:既可以通过设置 {key:1} 来显式指定返回的字段,也可以设置 {key:0} 指定需要排除的字段。

(11)除了前缀样式查询,正则表达式查询不能使用索引,执行的时间比大多数选择器更长,应节制性地使用它们。

(12)在聚合运算中,$ 要在 match 要在 $group 前面,通过 $ 前置,可以减少 match 前置,可以减少 $ group 操作符要处理的文档数量。

(13)通过操作符对文档进行修改,通常可以获得更好的性能,因为,不需要往返服务器来获取并修改文档数据,可以在序列化和传输数据上花费更少的时间。

(14)批量插入(batchInsert)可以减少数据向服务器的提交次数,提高性能。但是批量提交的 BSON Size 不超过 48MB。

(15)禁止一次取出太多的数据进行排序,MongoDB 目前支持对 32M 以内的结果集进行排序。如果需要排序,请尽量限制结果集中的数据量。

(16)查询中的某些 $ 操作符可能会导致性能低下,如操作符可能会导致性能低下,如 $ne,$,not,$exists,$nin,$or 尽量在业务中不要使用。

a) $exist: 因为松散的文档结构导致查询必须遍历每一个文档;

b) $ne: 如果当取反的值为大多数,则会扫描整个索引;

c) $not: 可能会导致查询优化器不知道应当使用哪个索引,所以会经常退化为全表扫描;

d) $nin: 全表扫描;

e) \$ 有多个条件就会查询多少次,最后合并结果集,应该考虑装换为 or: 有多个条件就会查询多少次,最后合并结果集,应该考虑装换为 $in。

(17)固定集合可以用于记录日志,其插入数据更快,可以实现在插入数据时,淘汰最早的数据。需求分析和设计时,可考虑此特性,即提高了性能,有省去了删除动作。

解读:固定集合需要显式创建,指定 Size 的大小,还能够指定文档的数量。集合不管先达到哪一个限制,之后插入的新文档都会把最老的文档移出。

(18)集合中文档的数据量会影响查询性能,为保持适量,需要定期归档。

Mongodb 性能优化

数据库性能对软件整体性能有着至关重要的影响,对于 Mongodb 数据库常用的性能优化方法主要有:

1、范式化与反范式化;

2、填充因子的使用;

3、索引的使用;

看完上述内容,你们掌握如何提升 MongoDB 的性能的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注丸趣 TV 行业资讯频道,感谢各位的阅读!

向 AI 问一下细节

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-12-04发表,共计2278字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)