Javascript 正则深入以及十个非常有意思的正则实战

开发 前端
熟悉我的朋友可能会知道,我一向是不写热点的。为什么不写呢?是因为我不关注热点吗?其实也不是。有些事件我还是很关注的,也确实有不少想法和观点。

[[433387]]

前言

熟悉我的朋友可能会知道,我一向是不写热点的。为什么不写呢?是因为我不关注热点吗?其实也不是。有些事件我还是很关注的,也确实有不少想法和观点。但我一直奉行一个原则,就是:要做有生命力的内容。

对于前端工程师来说, 正则表达式也许是javascript语言中最晦涩难懂的, 但是也往往是最简洁的.工作中遇到的很多问题,诸如搜索,查找, 高亮关键字等都可以使用正则轻松解决,所以有句话说的好:

正则用的好, 加班远离我.

今天笔者就复盘一下javascript正则表达式的一些使用技巧和高级API, 并通过几个实际的案例,来展现正则表达式的魅力.如果大家觉得正则表达式理解起来很麻烦,也可以使用如下在线网站, 只需要输入你的正则表达式, 它就能以图形的方式将你的正则展示出来:

你将收获

  • 模式匹配的用法(x)
  • 非捕获括号的模式匹配(?:x)
  • 先行断言x(?=y)
  • 后行断言(?<=y)x
  • 正向否定查找x(?!y)
  • 反向否定查找(?
  • 字符集合和反向字符集合的用法[xyz]/[^xyz]
  • 词边界和非单词边界匹配/b/B
  • 空白字符/非空白字符匹配/s/S
  • 单字字符/非单字字符匹配/w/W
  • 正则10大应用案例

正文

对于正则的基本用法笔者这里就不总结了,这里重点介绍一些比较有用且难懂的知识点.在最后笔者会写10个经典的正则案例, 供大家学习参考, 或者在工作中直接使用.

以上几点应用笔者在下文中会写几个例子来讲解.

模式匹配的用法(x)

模式匹配主要用来匹配某一类字符串并记住匹配项.

案例:

  1. let str = 'xuxi is xuxi is' 
  2. let reg = /(xuxi) (is) \1 \2/g 
  3. reg.test(str)  // true    (1) 
  4. str.replace(reg, '$1 $2')  // xuxi is  (2) 

解释: 其中括号被称为捕获括号, 模式中的 \1 和 \2 表示第一个和第二个被捕获括号匹配的子字符串,即 xuxi 和 is,匹配了原字符串中的后两个单词, 因此(1)中运行的结果为true. 当我们在字符串中使用replace时, 我们可以使用$1, $2这样的方式获取第n个匹配项,并用来替换字符串. 如(2)中的运行结果.

非捕获括号的模式匹配(?:x)

主要用来匹配某一类字符串但不记住匹配项.

案例:

  1. let str = 'xuxixuxi' 
  2. let reg = /(?:xuxi){1,2}/g 
  3. reg.test(str)  // true    (1) 

解释: 其中(?:)被称为非捕获括号, 我们可以使用它匹配一组字符但是并不记住该字符,一般用来判断某类字符是否存在于某字符串中.

先行断言x(?=y)

先行断言: 匹配'x'仅仅当'x'后面跟着'y'.

案例:

  1. let str = '王者融化' 
  2. let reg = /王(?=者)/ 
  3. reg.test(str)  // true    (1) 

解释: /王(?=者)/会匹配到"王"仅当它后面跟着"者".但是"者"不属于匹配结果的一部分.

后行断言(?<=y)x

后行断言: 匹配'x'仅当'x'前面是'y'.

案例:

  1. let str = 'xuxiA' 
  2. let reg = /(?<=xuxi)A/ 
  3. reg.test(str)  // true    (1) 

解释: /(?<=xuxi)A/会匹配到A仅当它前面为xuxi.但是xuxi不属于匹配结果的一部分.

正向否定查找x(?!y)

正向否定查找: 仅仅当'x'后面不跟着'y'时匹配'x'.

案例:

  1. let str = '3.1415' 
  2. let reg = /\d+(?!\.)/ 
  3. reg.exec(str)  // [1415]   (1) 

解释: 其中/\d+(?!.)/匹配一个或多个数字,当且仅当它后面没有小数点时, 所以(1)中执行后会匹配到1415而不是3.1415

反向否定查找(?

反向否定查找: 仅仅当'x'前面不是'y'时匹配'x'.

案例:

  1. let str = '3.1415' 
  2. let reg = /(?<!\.)\d+/ 
  3. reg.exec(str)  // [3]    (1) 

解释: /(?

字符集合和反向字符集合的用法 [xyz] / [^xyz]

[xyz]: 一个字符集合。匹配方括号中的任意字符,包括转义序列。你可以使用破折号(-)来指定一个字符范围。

[^xyz]: 一个反向字符集。也就是说,它匹配任何没有包含在方括号中的字符。你可以使用破折号(-)来指定一个字符范围。任何普通字符在这里都是起作用的

案例:

  1. let str = 'abcd' 
  2. let reg1 = /[a-c]+/ 
  3. let reg2 = /[^d]$/ 
  4. reg1.test(str)  // true    (1) 
  5. reg2.test(str)  // false    (2) 

解释: (1)中将返回true因为字符串中包含a-c中的字符, (2)中奖返回false, 因为字符串结尾为d, 但正则reg2需要匹配结尾不为d的字符串.

词边界和非单词边界匹配\b\B

\b 匹配一个词的边界。一个词的边界就是一个词不被另外一个“字”字符跟随的位置或者前面跟其他“字”字符的位置,例如在字母和空格之间。注意,匹配中不包括匹配的字边界。换句话说,一个匹配的词的边界的内容的长度是0。

\B 匹配一个非单词边界。匹配如下几种情况:(1)字符串第一个字符为非“字”字符 (2)字符串最后一个字符为非“字”字符 (3)两个单词字符之间 (4)两个非单词字符之间 (5)空字符串

案例:

  1. let str = 'xuxi' 
  2. let reg1 = /xi\b/ 
  3. let reg2 = /xu\B/ 
  4. reg1.exec(str)  // [xi]    (1) 
  5. reg2.exec(str)  // [xu]    (2) 

解释: (1)中匹配到了单词边界,即xi, 为该字符串的末尾.(2)中应为xu为非单词边界,所以会被其匹配到.

空白字符/非空白字符匹配\s\S

  1. \s: 匹配一个空白字符,包括空格、制表符、换页符和换行符. 
  2.  
  3. \S: 匹配一个非空白字符 

案例:

  1. let str = 'xuxi is' 
  2. let reg1 = /.*\s/g 
  3. let reg2 = /\S\w*/g 
  4. reg1.exec(str)  // [xuxi]    (1) 
  5. reg2.exec(str)  // [xuxi]    (2) 

解释: (1)和(2)中执行之后都将匹配xuxi, 一个是空白字符之前的匹配, 一个是非空白字符的匹配.

单字字符/非单字字符匹配\w/W

\w: 匹配一个单字字符(字母、数字或者下划线)。等价于 [A-Za-z0-9_]。

\W: 匹配一个非单字字符。等价于 [^A-Za-z0-9_]

由于以上2种模式比较简单,这里就不一一介绍了.

正则10大应用案例

接下来笔者将总结几个使用正则的实际应用,供大家学习和参考.

1. 去除字符串内指定元素的标签

  1. function trimTag(tagName, htmlStr) { 
  2.   let reg = new RegExp(`<${tagName}(\\s.*)*>(\\n|.)*<\\/${tagName}>`, "g"
  3.   return htmlStr.replace(reg, ''

2. 短横线命名转驼峰命名

  1. // 短横线转驼峰命名, flag = 0为小驼峰, 1为大驼峰 
  2. function toCamelCase(str, flag = 0) { 
  3.   if(flag) { 
  4.     return str[0].toUpperCase() + str.slice(1).replace(/-(\w)/g, ($0, $1) => $1.toUpperCase()) 
  5.   }else { 
  6.     return str.replace(/-(\w)/g, ($0, $1) => $1.toUpperCase()) 
  7.   } 

3. 实现一个简单的模板引擎

关于实现一个模板引擎, 实现中用到了大量的正则,建议感兴趣的可以直接看实现一个简单的模板引擎.

4. 去除字符串中的空格符

  1. function trimAll(str) { 
  2.   return str.replace(/\s*/g,""

5. 判断指定格式的数据输入合法性

  1. function numCheck(str, specialNum) { 
  2.   if(str.indexOf(',') > -1) { 
  3.       return str.splite(',').every(item=>this.numCheck(item)); 
  4.   } else { 
  5.       return str.split(specialNum).length === 2; 
  6.   } 

6. 去除url参数字符串中值为空的字段

  1. // 去除url参数字符串中值为空的字段 
  2. const trimParmas = (parmaStr:string = '') => { 
  3.   return parmaStr.replace(/((\w*?)=&|(&\w*?=)$)/g, ''

7. 将浏览器参数字符串转化为参数对象

  1. function unParams(params = '?a=1&b=2&c=3') { 
  2.   let obj = {} 
  3.   params && params.replace(/((\w*)=([\.a-z0-9A-Z]*)?)?/g, (m,a,b,c) => { 
  4.     if(b || c) obj[b] = c 
  5.   }) 
  6.   return obj 

8. 计算字符串字节数

  1. /** 
  2.  * 计算字符串字节数 
  3.  * @param str 
  4.  * @desc 一个中文占2个字节, 一个英文占一个字节 
  5.  */ 
  6. function computeStringByte(str) { 
  7.   let size = 0, 
  8.   strArr = str.split(''), 
  9.   reg = /[\u4e00-\u9fa5]/   // 判断是否为中文 
  10.   for(let i = strArr.length; i--; i>=0) { 
  11.     if(reg.test(strArr[i])) { 
  12.       size+= 2 
  13.     }else { 
  14.       size += 1 
  15.     } 
  16.   } 
  17.   return size 

9. 匹配是否包含中文字符

  1. function hasCn(str) { 
  2.   let reg = /[\u4e00-\u9fa5]/g 
  3.   return reg.test(str) 

10. 实现搜索联想功能

  1. function searchLink(keyword) { 
  2.   // 模拟后端返回数据 
  3.   let list = ['abc''ab''a''bcd''edf''abd']; 
  4.   let reg = new RegExp(keyword, 'i'); 
  5.   return list.filter(item => reg.test(item)) 

 

责任编辑:武晓燕 来源: 趣谈前端
相关推荐

2024-03-04 00:00:00

javascript正则字符串

2023-05-18 08:01:01

前端搜索javascript

2022-08-03 08:03:03

前端APIjavascript

2015-07-15 13:54:13

2021-07-26 10:33:54

Web开发项目

2015-10-28 13:57:29

融合架构华三UIS

2020-12-12 13:50:16

云开发

2021-01-27 13:54:05

开发云原生工具

2018-06-24 16:39:28

Tomcat异常线程

2022-06-29 09:43:14

SQL优化数据库

2021-03-25 06:12:55

SVG 滤镜CSS

2012-05-22 10:12:59

jQuery

2022-06-15 07:21:47

鼠标指针交互效果CSS

2022-08-15 22:34:47

Overflow方向裁切

2021-02-20 16:01:26

Github前端开发

2023-05-15 09:16:18

CSSCSS Mask

2022-07-11 13:09:26

mmapLinux

2021-09-26 07:57:15

Web项目GitHub

2017-12-12 14:50:33

数据库MySQL命令

2017-08-01 00:52:07

kafka大数据消息总线
点赞
收藏

51CTO技术栈公众号