python正则表达式如何整理的相关方案介绍-python 正则表达式替换

下面的文章就是对python正则表达式如何整理的实际操作方案的具体介绍，如果你在相关的资料中没有找到相关的文献可以参考的，你就可以点击以下的文章对python正则表达式的实际相关应用有所了解。

python正则表达式专题

<!--[if !supportLists]-->一、<!--[endif]-->

整理其应用于python的用到的正则表达式

<!--[if !supportLists]-->1.1 <!--[endif]-->

字符匹配元字符列表：

. ^ $ * + ? { [ ] \ | ( )

字符可以单个列出，也可以用“-”号分隔的两个给定字符来表示一个字符区间。例如，[abc] 将匹配"a", "b", 或 "c"中的任意一个字符；也可以用区间[a-c]来表示同一字符集，和前者效果一致。如果你只想匹配小写字母。那么 RE 应写成 [a-z].

你可以用补集来匹配不在区间范围内的字符。其做法是把"^"作为类别的首个字符；其它地方的"^"只会简单匹配 "^"字符本身。例如，[^5] 将匹配除 "5" 之外的任意字符。也许最重要的元字符是反斜杠"\"。做为 Python 中的字符串字母，反斜杠后面可以加不同的字符以表示不同特殊意义。它也可以用于取消所有的元字符，这样你就可以在模式中匹配它们了。举个例子，如果你需要匹配字符 "[" 或 "\"，你可以在它们之前用反斜杠来取消它们的特殊意义： \[ 或 \\。

PS：其中的\ 表示转义处理常用的字符：

\d 匹配任何十进制数；它相当于类 [0-9]。\D 匹配任何非数字字符；它相当于类 [^0-9]。\s 匹配任何空白字符；它相当于类 [ \t\n\r\f\v]。\S 匹配任何非空白字符；它相当于类 [^ \t\n\r\f\v]。\w 匹配任何字母数字字符；它相当于类 [a-zA-Z0-9_]。\W 匹配任何非字母数字字符；python正则表达相当于类 [^a-zA-Z0-9_]。这两种写法是等价的！

<!--[if !supportLists]-->1.2 <!--[endif]-->

重复

第一个重复功能的元字符是 *。* 并不匹配字母字符 "*"；相反，它指定前一个字符可以被匹配零次或更多次，而不是只有一次。另一个重复元字符是 +，表示匹配一或更多次。请注意 * 和 + 之间的不同；＊匹配零或更多次，所以根本就可以不出现，而 + 则要求至少出现一次。#p#

问号 ? 匹配一次或零次；

最复杂的重复限定符是 {m,n}，其中 m 和 n 是十进制整数。该限定符的意思是至少有 m 个重复，至多到 n 个重复。你可以忽略 m 或 n；因为会为缺失的值假设一个合理的值。忽略 m 会认为下边界是 0，而忽略 n 的结果将是上边界为无穷大 -- 实际上是先前我们提到的 2 兆，但这也许同无穷大一样。

PS：包括* ? + {m,n} 这样的重复标识

了解了常用的正则表达式之后就可以将其融入到python里面了。因为我发现不同的语言在正则上面还是有点差异的。故此我先将其能用到的正则内容整理完。

<!--[if !supportLists]-->二、<!--[endif]-->python

中应用正则使用正则对象

import re  
p = re.compile('^[1-9]\d*$',re.S)

以上的文章就是对python正则表达式的部分介绍。

【编辑推荐】