3分钟掌握MongoDB中的regex几种用法

数据库 其他数据库 MongoDB
本文中介绍的MongoDB中的regex就是实现类似功能的,regex为能使你在查询中使用正则表达式。本文会用简单的实例带您了解MongoDB中regex的用法~

[[221558]]

背景

Part1:写在最前

使用MySQL或其他关系型数据库的朋友们都知道,使用模糊查询的用法类似于: 

  1. SELECT * FROM products WHERE sku like "%789"

本文中介绍的MongoDB中的regex就是实现类似功能的,regex为能使你在查询中使用正则表达式。本文会用简单的实例带您了解MongoDB中regex的用法~

Part2:用法

使用$regex时,有以下几种用法: 

  1. { <field>: { $regex: /pattern/, $options: '<options>' } }  
  2. { <field>: { $regex: 'pattern', $options: '<options>' } }  
  3. { <field>: { $regex: /pattern/<options> } } 

option参数的含义:

选项 含义 使用要求
i 大小写不敏感  
m

查询匹配中使用了锚,例如^(代表开头)和$(代表结尾),以及匹配\n后的字符串

 
x

忽视所有空白字符

要求$regex与$option合用
s 允许点字符(.)匹配所有的字符,包括换行符。 要求$regex与$option合用


实战 

Part1:$in中的用法 

要在$in查询中包含正则表达式,只能使用JavaScript正则表达式对象(即/ pattern /)。 例如: 

 

  1. name: { $in: [ /^acme/i, /^ack/ ] } }  

Warning:警告 $in中不能使用$ regex运算符表达式。 

Part2:隐式and用法 

要在逗号分隔的查询条件中包含正则表达式,请使用$ regex运算符。 例如: 

 

  1. name: { $regex: /acme.*corp/i, $nin: [ 'acmeblahcorp' ] } }  
  2. name: { $regex: /acme.*corp/, $options: 'i', $nin: [ 'acmeblahcorp' ] } }  
  3. name: { $regex: 'acme.*corp', $options: 'i', $nin: [ 'acmeblahcorp' ] } }  

Part3:x和s选项 

要使用x选项或s选项,要求$regex与$option合用。 例如,要指定i和s选项,必须使用$ options来执行以下操作: 

 

  1. name: { $regex: /acme.*corp/, $options: "si" } } 
  2. name: { $regex: 'acme.*corp', $options: "si" } } 

Part4:索引的使用 

对于区分大小写的正则表达式查询,如果字段存在索引,则MongoDB将正则表达式与索引中的值进行匹配,这比全表扫描更快。如果正则表达式是“前缀表达式”,那么可以优化查询速度,且查询结果都会以相同的字符串开头。 

正则表达式也要符合“最左前缀原则”,例如,正则表达式/^abc.*/将通过仅匹配以abc开头的索引值来进行优化。 

Warning:警告  

1.虽然/^a/,/^a.*/和/^a.*$/匹配等效字符串,但它们的性能是不一样的。如果有对应的索引,所有这些表达式就都使用索引;不过,/^a.*/和/^a.*$/较慢。 这是因为/^a/可以在匹配前缀后停止扫描。 

2.不区分大小写的正则表达式查询通常不能使用索引,$regex无法使用不区分大小写的索引。 

Part5:实例 

一个商品的集合中,存了以下内容 

 

  1. "_id" : 100, "sku" : "abc123""description" : "Single line description." }  
  2. "_id" : 101, "sku" : "abc789""description" : "First line\nSecond line" }  
  3. "_id" : 102, "sku" : "xyz456""description" : "Many spaces before     line" }  
  4. "_id" : 103, "sku" : "xyz789""description" : "Multiple\nline description" }  

如果想对该商品products集合执行一个查询,范围是sku列中的内容是789结尾的: 

 

  1. db.products.find( { sku: { $regex: /789$/ } } )  

结合MySQL理解的话,上述查询在MySQL中是这样的SQL: 

 

  1. SELECT * FROM products WHERE sku like "%789" 

如果想查询sku是abc、ABC开头的,且匹配时忽略大小写,可以使用i选项: 

 

  1. db.products.find( { sku: { $regex: /^ABC/i } } )、  

查询结果为: 

 

  1. "_id" : 100, "sku" : "abc123""description" : "Single line description." }  
  2. "_id" : 101, "sku" : "abc789""description" : "First line\nSecond line" }  

Part6:m的使用 

想查询描述中是包含S开头的,且要匹配/n后的S开头的,则需要加m选项 

 

  1. db.products.find( { description: { $regex: /^S/, $options: 'm' } } )  

返回的结果是: 

 

  1. "_id" : 100, "sku" : "abc123""description" : "Single line description." }  
  2. "_id" : 101, "sku" : "abc789""description" : "First line\nSecond line" }  

如果不加m选项的话,返回的结果是这样的: 

 

  1. "_id" : 100, "sku" : "abc123""description" : "Single line description." }  

如果不使用^这类锚的话,那么会返回全部结果: 

 

  1. db.products.find( { description: { $regex: /S/ } } ) 
  2. "_id" : 100, "sku" : "abc123""description" : "Single line description." } 
  3. "_id" : 101, "sku" : "abc789""description" : "First line\nSecond line" }  

Part7:s的使用 

使用s选项来执行查询,则会让逗号. 匹配所有字符,包括换行符,下文查询了description列中m开头,且后面包含line字符串的结果: 

 

  1. db.products.find( { description: { $regex: /m.*line/, $options: 'si' } } ) 
  2. "_id" : 102, "sku" : "xyz456""description" : "Many spaces before     line" } 
  3. "_id" : 103, "sku" : "xyz789""description" : "Multiple\nline description" }  

如果不包含s,则会返回: 

 

  1. "_id" : 102, "sku" : "xyz456""description" : "Many spaces before     line" }  

Part8:x的使用 

以下示例使用x选项忽略空格和注释,用#表示注释,并以匹配模式中的\ n结尾: 

 

  1. var pattern = "abc #category code\n123 #item number" 
  2. db.products.find( { sku: { $regex: pattern, $options: "x" } } )  

查询的结果是: 

 

  1. "_id" : 100, "sku" : "abc123""description" : "Single line description." }  

可以看出,其忽略了abc与#category的空格以及#category与code的空格,实际执行的查询是sku是abc123的结果。  

总结 

通过这几个案例,我们能够了解到MongoDB中的regex用法,以及其可选参数$option每个选项的含义和用法。由于笔者的水平有限,编写时间也很仓促,文中难免会出现一些错误或者不准确的地方,不妥之处恳请读者批评指正。喜欢笔者的文章,右上角点一波关注,谢谢~ 

责任编辑:庞桂玉 来源: 51CTO博客
相关推荐

2017-01-10 09:07:53

tcpdumpGET请求

2021-06-07 09:51:22

原型模式序列化

2020-12-01 12:44:44

PythonHook钩子函数

2009-11-17 14:50:50

Oracle调优

2021-01-11 09:33:37

Maven数目项目

2020-12-17 10:00:16

Python协程线程

2021-01-29 11:25:57

Python爬山算法函数优化

2021-03-12 09:45:00

Python关联规则算法

2020-12-07 11:23:32

Scrapy爬虫Python

2021-03-23 15:35:36

Adam优化语言

2019-05-08 14:02:52

MySQL索引查询优化数据库

2011-04-19 09:27:25

Spring

2020-12-18 07:33:20

SpringSchedule组件

2009-11-05 10:55:22

Visual Stud

2020-10-27 10:43:24

Redis字符串数据库

2022-05-30 07:51:13

数据库MySQLQPS

2018-05-06 16:26:03

关联规则数据分析关联规则推荐

2018-01-30 05:04:06

2021-06-18 07:34:12

Kafka中间件微服务

2020-09-14 11:30:26

HTTP3运维互联网
点赞
收藏

51CTO技术栈公众号