MongoDB中regex如何使用

46次阅读
没有评论

共计 3431 个字符,预计需要花费 9 分钟才能阅读完成。

自动写代码机器人,免费开通

MongoDB 中 regex 如何使用,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面丸趣 TV 小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

Part1: 写在最前

使用 MySQL 或其他关系型数据库的朋友们都知道,使用模糊查询的用法类似于:

SELECT * FROM products WHERE sku like  %789

本文中介绍的 MongoDB 中的 regex 就是实现类似功能的,regex 为能使你在查询中使用正则表达式。本文会用简单的实例带您了解 MongoDB 中 regex 的用法~

Part2: 用法

使用 $regex 时,有以下几种用法:

{  field : { $regex: /pattern/, $options:  options  } } 
{  field : { $regex:  pattern , $options:  options  } } 
{  field : { $regex: /pattern/ options  } }

option 参数的含义:

选项含义使用要求
 i 大小写不敏感
 m

查询匹配中使用了锚,例如 ^(代表开头)和 $(代表结尾),以及匹配 \n 后的字符串

 x

忽视所有空白字符

要求 $regex 与 $option 合用 s 允许点字符(.)匹配所有的字符,包括换行符。要求 $regex 与 $option 合用

实战

Part1:$in 中的用法

要在 $in 查询中包含正则表达式,只能使用 JavaScript 正则表达式对象(即 / pattern /)。例如:

{ name: { $in: [ /^acme/i, /^ack/ ] } }

Warning: 警告 $in 中不能使用 $ regex 运算符表达式。

Part2: 隐式 and 用法

要在逗号分隔的查询条件中包含正则表达式,请使用 $ regex 运算符。例如:

{ name: { $regex: /acme.*corp/i, $nin: [  acmeblahcorp  ] } } 
{ name: { $regex: /acme.*corp/, $options:  i , $nin: [  acmeblahcorp  ] } } 
{ name: { $regex:  acme.*corp , $options:  i , $nin: [  acmeblahcorp  ] } }

Part3:x 和 s 选项

要使用 x 选项或 s 选项,要求 $regex 与 $option 合用。例如,要指定 i 和 s 选项,必须使用 $ options 来执行以下操作:

{ name: { $regex: /acme.*corp/, $options:  si  } } 
{ name: { $regex:  acme.*corp , $options:  si  } }

Part4: 索引的使用

对于区分大小写的正则表达式查询,如果字段存在索引,则 MongoDB 将正则表达式与索引中的值进行匹配,这比全表扫描更快。如果正则表达式是“前缀表达式”,那么可以优化查询速度,且查询结果都会以相同的字符串开头。

正则表达式也要符合“最左前缀原则”,例如,正则表达式 /^abc.*/ 将通过仅匹配以 abc 开头的索引值来进行优化。

Warning: 警告

1. 虽然 /^a/,/^a.*/ 和 /^a.*$/ 匹配等效字符串,但它们的性能是不一样的。如果有对应的索引,所有这些表达式就都使用索引; 不过,/^a.*/ 和 /^a.*$/ 较慢。这是因为 /^a/ 可以在匹配前缀后停止扫描。

2. 不区分大小写的正则表达式查询通常不能使用索引,$regex 无法使用不区分大小写的索引。

Part5: 实例

一个商品的集合中,存了以下内容

{  _id  : 100,  sku  :  abc123 ,  description  :  Single line description.  } 
{  _id  : 101,  sku  :  abc789 ,  description  :  First line\nSecond line  } 
{  _id  : 102,  sku  :  xyz456 ,  description  :  Many spaces before line  } 
{  _id  : 103,  sku  :  xyz789 ,  description  :  Multiple\nline description  }

如果想对该商品 products 集合执行一个查询,范围是 sku 列中的内容是 789 结尾的:

db.products.find( { sku: { $regex: /789$/ } } )

结合 MySQL 理解的话,上述查询在 MySQL 中是这样的 SQL:

SELECT * FROM products WHERE sku like  %789

如果想查询 sku 是 abc、ABC 开头的,且匹配时忽略大小写,可以使用 i 选项:

db.products.find( { sku: { $regex: /^ABC/i } } )、

查询结果为:

{  _id  : 100,  sku  :  abc123 ,  description  :  Single line description.  } 
{  _id  : 101,  sku  :  abc789 ,  description  :  First line\nSecond line  }

Part6:m 的使用

想查询描述中是包含 S 开头的,且要匹配 / n 后的 S 开头的,则需要加 m 选项

db.products.find( { description: { $regex: /^S/, $options:  m  } } )

返回的结果是:

{  _id  : 100,  sku  :  abc123 ,  description  :  Single line description.  } 
{  _id  : 101,  sku  :  abc789 ,  description  :  First line\nSecond line  }

如果不加 m 选项的话,返回的结果是这样的:

{  _id  : 100,  sku  :  abc123 ,  description  :  Single line description.  }

如果不使用 ^ 这类锚的话,那么会返回全部结果:

db.products.find( { description: { $regex: /S/ } } ) 
{  _id  : 100,  sku  :  abc123 ,  description  :  Single line description.  } 
{  _id  : 101,  sku  :  abc789 ,  description  :  First line\nSecond line  }

Part7:s 的使用

使用 s 选项来执行查询,则会让逗号. 匹配所有字符,包括换行符,下文查询了 description 列中 m 开头,且后面包含 line 字符串的结果:

db.products.find( { description: { $regex: /m.*line/, $options:  si  } } ) 
{  _id  : 102,  sku  :  xyz456 ,  description  :  Many spaces before line  } 
{  _id  : 103,  sku  :  xyz789 ,  description  :  Multiple\nline description  }

如果不包含 s,则会返回:

{  _id  : 102,  sku  :  xyz456 ,  description  :  Many spaces before line  }

Part8:x 的使用

以下示例使用 x 选项忽略空格和注释,用#表示注释,并以匹配模式中的 \ n 结尾:

var pattern =  abc #category code\n123 #item number  
db.products.find( { sku: { $regex: pattern, $options:  x  } } )

查询的结果是:

{  _id  : 100,  sku  :  abc123 ,  description  :  Single line description.  }

可以看出,其忽略了 abc 与 #category 的空格以及#category 与 code 的空格,实际执行的查询是 sku 是 abc123 的结果。

看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注丸趣 TV 行业资讯频道,感谢您对丸趣 TV 的支持。

向 AI 问一下细节

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-12-04发表,共计3431字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)