为你解疑:VB.NET开发正则表达式bug原因

开发 后端
偶然间发现了关于VB.NET开发正则表达式的一个小bug,在文章中和大家一起来分析一下,看看大家是不是也遇到过,正文还有详细的代码。

很多朋友都喜欢找语言编程的bug,感觉有成就感,在用VB.NET开发正则表达式时我发现了一个bug!最近在使用正则表达式的时候发现:在忽略大小写的时候,匹配值从 0xff 到 0xffff 之间的所有字符,正则表达式竟然也能匹配两个 ASCII 字符:i(code: 0x69) 和 I(code: 0x49);但是仍然不能匹配其他的 ASCII 字母和数字。

比如以下的代码就是用来测试用VB.NET开发正则表达式匹配从 0xff 到 0xffff 的字符。而值范围在 0 到 0xfe 的所有字符是不能被匹配的。

  1. 1234567891011121314151617Regex regex = new Regex(@"[/u00FF-/uFFFF]+");   
  2. // The characters, whoes value are smaller than 0xff, are not expected to be matched.   
  3. for (int i = 0; i < 0xff; i++) {   
  4. string s = new string(new char[] { (char)i });   
  5. Debug.Assert(   
  6. !regex.IsMatch(s),   
  7. string.Format("The character was not expected to be matched: 0x{0:X}!", i));   
  8. }   
  9. // However, the characters whoes value are greater than 0xfe are expected to be matched.   
  10. for (int i = 0xff; i <= 0xffff; i++) {   
  11. string s = new string(new char[] { (char)i });   
  12. Debug.Assert(   
  13. regex.IsMatch(s),   
  14. string.Format("The character was expected to be matched: 0x{0:X}!", i));   
  15. }  

这时的运行结果是正常的,没有任何的断言错误出现。然而当使用忽略大小写的匹配模式时,结果就不一样了。将上面代码中的第一行改成:

  1. 1Regex regex = new Regex(@"[/u00FF-/uFFFF]+", RegexOptions.IgnoreCase);  


程序运行的时候就会有两处断言错误。它们分别是字符值为 73 和 105,也就是小写字母 i 和大写字母 I。 这个 bug 非常奇怪,别的字符都很正常!而且用 javascript 脚本在 IE (版本是6.0)里面运行也同样有这么 bug 存在(比如下面这段代码)。然而在 Firefox 中运行就是没有问题的。还是 Firefox 好啊,呵呵!

  1. 1234567891011121314151617var re = /[/u00FF-/uFFFF]+/;   
  2. // var re = /[/u00FF-/uFFFF]+/i;   
  3. for(var i=0; i<0xff; i++) {   
  4. var s = String.fromCharCode( i );   
  5. if ( re.test(s) ){   
  6. alert( 'Should not be matched: ' + i + '!' );   
  7. }   
  8. }   
  9. for(var i=0xff; i<=0xffff; i++) {   
  10. var s = String.fromCharCode( i );   
  11. if ( !re.test(s) ){   
  12. alert( 'Should be matched: ' + i + '!' );   
  13. }   
  14. }   

以上就是关于VB.NET开发正则表达式找出一个bug的分析。

【编辑推荐】

  1. 学习笔记之VB.NET删除文件夹案例
  2. 经验之谈VB.NET流操作文件两个案例解析
  3. 利用socket完成VB.NET文件传输案例剖析
  4. 针对VB.NET文件流读、写类文件演示实例
  5. 剖析讲解VB.NET分辩率案例
责任编辑:田树 来源: 赛迪网
相关推荐

2009-10-26 16:12:19

VB.NET正则表达式

2010-01-07 13:29:00

VB.NET正则表达式

2009-10-26 15:33:27

VB.NET正则表达式

2009-10-27 10:14:54

VB.NET正则表达式

2009-10-26 16:01:03

VB.NET正则表达式

2009-11-03 10:30:47

VB.NET继承

2009-10-26 16:49:27

VB.NET正则表达式

2009-08-07 14:24:31

.NET正则表达式

2012-05-08 13:29:01

VB

2009-10-27 13:05:37

VB.NET对象列表

2010-01-07 15:29:59

VB.NET表达式

2012-01-12 10:21:57

正则表达式

2009-08-07 14:31:40

.NET正则表达式基础

2018-09-27 15:25:08

正则表达式前端

2020-09-04 09:16:04

Python正则表达式虚拟机

2024-09-14 09:18:14

Python正则表达式

2010-01-05 17:46:04

.NET Framew

2009-03-24 08:56:15

正则表达式格式清理字符串

2009-08-24 17:14:41

正则表达式C#和.NET框架

2021-03-02 07:33:13

开发C#字符
点赞
收藏

51CTO技术栈公众号