下面的文章就是对python正则表达式如何整理的实际操作方案的具体介绍,如果你在相关的资料中没有找到相关的文献可以参考的,你就可以点击以下的文章对python正则表达式的实际相关应用有所了解。
python正则表达式专题
- <!--[if !supportLists]-->一、<!--[endif]-->
整理其应用于python的用到的正则表达式
- <!--[if !supportLists]-->1.1 <!--[endif]-->
字符匹配元字符列表:
- . ^ $ * + ? { [ ] \ | ( )
字符可以单个列出,也可以用“-”号分隔的两个给定字符来表示一个字符区间。例如,[abc] 将匹配"a", "b", 或 "c"中的任意一个字符;也可以用区间[a-c]来表示同一字符集,和前者效果一致。如果你只想匹配小写字母。那么 RE 应写成 [a-z].
你可以用补集来匹配不在区间范围内的字符。其做法是把"^"作为类别的首个字符;其它地方的"^"只会简单匹配 "^"字符本身。例如,[^5] 将匹配除 "5" 之外的任意字符。也许最重要的元字符是反斜杠"\"。 做为 Python 中的字符串字母,反斜杠后面可以加不同的字符以表示不同特殊意义。它也可以用于取消所有的元字符,这样你就可以在模式中匹配它们了。举个例子,如果你需要 匹配字符 "[" 或 "\",你可以在它们之前用反斜杠来取消它们的特殊意义: \[ 或 \\。
PS:其中的\ 表示转义处理常用的字符:
\d 匹配任何十进制数;它相当于类 [0-9]。\D 匹配任何非数字字符;它相当于类 [^0-9]。\s 匹配任何空白字符;它相当于类 [ \t\n\r\f\v]。\S 匹配任何非空白字符;它相当于类 [^ \t\n\r\f\v]。\w 匹配任何字母数字字符;它相当于类 [a-zA-Z0-9_]。\W 匹配任何非字母数字字符;python正则表达相当于类 [^a-zA-Z0-9_]。这两种写法是等价的!
- <!--[if !supportLists]-->1.2 <!--[endif]-->
重复
第一个重复功能的元字符是 *。* 并不匹配字母字符 "*";相反,它指定前一个字符可以被匹配零次或更多次,而不是只有一次。另一个重复元字符是 +,表示匹配一或更多次。请注意 * 和 + 之间的不同;* 匹配零或更多次,所以根本就可以不出现,而 + 则要求至少出现一次。#p#
问号 ? 匹配一次或零次;
最复杂的重复限定符是 {m,n},其中 m 和 n 是十进制整数。该限定符的意思是至少有 m 个重复,至多到 n 个重复。你可以忽略 m 或 n;因为会为缺失的值假设一个合理的值。忽略 m 会认为下边界是 0,而忽略 n 的结果将是上边界为无穷大 -- 实际上是先前我们提到的 2 兆,但这也许同无穷大一样。
PS:包括* ? + {m,n} 这样的重复标识
了解了常用的正则表达式之后就可以将其融入到python里面了。因为我发现不同的语言在正则上面还是有点差异的。故此我先将其能用到的正则内容整理完。
- <!--[if !supportLists]-->二、<!--[endif]-->python
中应用正则使用正则对象
- import re
- p = re.compile('^[1-9]\d*$',re.S)
以上的文章就是对python正则表达式的部分介绍。
【编辑推荐】
- Python矩阵转置的实际应用操作方案与代码详解
- Python环境的实际应用方案介绍与代码详解
- 在PythonS60手机运行过程中的五大步骤
- Python矩阵转置中的二维数组的实际操作方案介绍
- Python复制文件的实际操作方案与代码详解