本文和大家重点讨论一下Perl模式匹配的概念,Perl模式的用法如结合函数split将字符串用某Perl模式分成多个单词:@array=split(//,$line),相信通过本文的学习你对Perl模式的用法有深刻的了解。
一、Perl模式匹配选项
选项描述
g匹配所有可能的Perl模式
i忽略大小写
m将串视为多行
o只赋值一次
s将串视为单行
x忽略Perl模式中的空白
1、匹配所有可能的Perl模式(g选项)
@matches="balata"=~/.a/g;#now@matches=("ba","la","ta")
匹配的循环:
- while("balata"=~/.a/g){
- $match=$&;
- print("$match\n");
- }
结果为:
ba
la
ta
当使用了选项g时,可用函数pos来控制下次匹配的偏移:
$offset=pos($string);
pos($string)=$newoffset;
2、忽略大小写(i选项)例
/de/i匹配de,dE,De和DE。
3、将字符串看作多行(m选项)
在此情况下,^符号匹配字符串的起始或新的一行的起始;$符号匹配任意行的末尾。
4、只执行一次变量替换例
$var=1;
$line=;
while($var<10){
$result=$line=~/$var/o;
$line=;
$var++;
}
每次均匹配/1/。
5、将字符串看作单行例
/a.*bc/s匹配字符串axxxxx\nxxxxbc,但/a.*bc/则不匹配该字符串。
6、在Perl模式中忽略空格
/\d{2}([\W])\d{2}\1\d{2}/x等价于/\d{2}([\W])\d{2}\1\d{2}/。
二、替换操作符
语法为s/pattern/replacement/,其效果为将字符串中与pattern匹配的部分换成replacement。如:
$string="abc123def";
$string=~s/123/456/;#now$string="abc456def";
在替换部分可使用Perl模式次序变量$n,如s/(\d+)/[$1]/,但在替换部分不支持Perl模式的特殊字符,如{},*,+等,如s/abc/[def]/将把abc替换为[def]。
替换操作符的选项如下表:
选项描述
g改变Perl模式中的所有匹配
i忽略Perl模式中的大小写
e替换字符串作为表达式
m将待匹配串视为多行
o仅赋值一次
s将待匹配串视为单行
x忽略Perl模式中的空白
注:e选项把替换部分的字符串看作表达式,在替换之前先计算其值,如:
$string="0abc1";
$string=~s/[a-zA-Z]+/$&x2/e;#now$string="0abcabc1"
三、翻译操作符
这是另一种替换方式,语法如:tr/string1/string2/。同样,string2为替换部分,但其效果是把string1中的第一个字符替换为string2中的第一个字符,把string1中的第二个字符替换为string2中的第二个字符,依此类推。如:
$string="abcdefghicba";
$string=~tr/abc/def/;#nowstring="defdefghifed"
当string1比string2长时,其多余字符替换为string2的最后一个字符;当string1中同一个字符出现多次时,将使用第一个替换字符。
翻译操作符的选项如下:
选项描述
c翻译所有未指定字符
d删除所有指定字符
s把多个相同的输出字符缩成一个
如$string=~tr/\d//c;把所有非数字字符替换为空格。$string=~tr/\t//d;删除tab和空格;$string=~tr/0-9//cs;把数字间的其它字符替换为一个空格。
四、扩展Perl模式匹配
PERL支持PERL4和标准UNIXPerl模式匹配操作所没有的一些Perl模式匹配能力。其语法为:(?pattern),其中c是一个字符,pattern是起作用的Perl模式或子Perl模式。
1、不存贮括号内的匹配内容
在PERL的Perl模式中,括号内的子Perl模式将存贮在内存中,此功能即取消存贮该括号内的匹配内容,如/(?:a|b|c)(d|e)f\1/中的\1表示已匹配的d或e,而不是a或b或c。
2、内嵌Perl模式选项
通常Perl模式选项置于其后,有四个选项:i、m、s、x可以内嵌使用,语法为:/(?option)pattern/,等价于/pattern/option。
3、肯定的和否定的预见匹配
肯定的预见匹配语法为/pattern(?=string)/,其意义为匹配后面为string的Perl模式,相反的,(?!string)意义为匹配后面非string的Perl模式,如:
$string="25abc8";
$string=~/abc(?=[0-9])/;
$matched=$&;#$&为已匹配的Perl模式,此处为abc,而不是abc8
4、Perl模式注释
PERL5中可以在Perl模式中用?#来加注释,如:
if($string=~(?i)[a-z]{2,3}(?#matchtwoorthreealphabeticcharacters)/{
...
}
【编辑推荐】