本文和大家重点学习一下Perl模式匹配的相关内容,主要包括Perl模式匹配选项,替换操作符,翻译操作符,扩展Perl模式匹配等内容,希望本文的介绍能让你有所收获。
一.Perl模式匹配选项
g匹配所有可能的模式
i忽略大小写
m将串视为多行
o只赋值一次
s将串视为单行
x忽略模式中的空白
1.匹配所有可能的模式(g选项)
@matches="balata"=~/.a/g;
此时@matches=("ba","la","ta")
匹配的循环:
while("balata"=~/.a/g)
{
$match=$&;
print("$match\n");
}
结果为:
ba
la
ta
当使用了选项g时,可用函数pos来控制下次匹配的偏移:
$offset=pos($string);
pos($string)=$newoffset;
2.忽略大小写(i选项)例
/de/i:匹配de,dE,De和DE.
3.将字符串看作多行(m选项)
在此情况下,^符号匹配字符串的起始或新的一行的起始;$符号匹配任意行的末尾.
4.只执行一次变量替换例
- $var=1;
- $line=<STDIN>;
- while($var<10)
- {
- $result=$line=~/$var/o;
- $line=<STDIN>;
- $var++;
- }
每次均匹配/1/.
5.将字符串看作单行例
/a.*bc/s匹配字符串axxxxx\nxxxxbc,但/a.*bc/则不匹配该字符串.
6.在模式中忽略空格
/\d{2}([\W])\d{2}\1\d{2}/x等价于/\d{2}([\W])\d{2}\1\d{2}/
二.替换操作符
语法为s/pattern/replacement/,其效果为将字符串中与pattern匹配的部分换成replacement.
例如:
$string="abc123def";
$string=~s/123/456/;#$string="abc456def";
在替换部分可使用模式次序变量$n,如s/(\d+)/[$1]/,但在替换部分不支持模式的特殊字符,如{},*,+等.
如:s/abc/[def]/将把abc替换为[def].
替换操作符的选项如下表:
g改变模式中的所有匹配
i忽略模式中的大小写
e替换字符串作为表达式
m将待匹配串视为多行
o仅赋值一次
s将待匹配串视为单行
x忽略模式中的空白
注:e选项把替换部分的字符串看作表达式,在替换之前先计算其值.如:
$string="0abc1";
$string=~s/[a-zA-Z]+/$&x2/e;#$string="0abcabc1"
三.Perl模式匹配中翻译操作符
这是另一种替换方式,语法如:tr/string1/string2/.
同样,string2为替换部分,但其效果是把string1中的第一个字符替换为string2中的第一个字符,把string1中的第二个字符替换为string2中的第二个字符,依此类推.如:
$string="abcdefghicba";
$string=~tr/abc/def/;#string="defdefghifed"
当string1比string2长时,其多余字符替换为string2的最后一个字符;
当string1中同一个字符出现多次时,将使用第一个替换字符.
翻译操作符的选项如下:
c翻译所有未指定字符
d删除所有指定字符
s把多个相同的输出字符缩成一个
如:
$string=~tr/\d//c;把所有非数字字符替换为空格.
$string=~tr/\t//d;删除tab和空格.
$string=~tr/0-9//cs;把数字间的其它字符替换为一个空格.
四.扩展Perl模式匹配
Perl支持Perl4和标准UNIXPerl模式匹配操作所没有的一些Perl模式匹配能力.
语法为:(?<c>pattern),其中c是一个字符,pattern是起作用的模式或子模式.
1.不存贮括号内的匹配内容
在Perl的模式中,括号内的子模式将存贮在内存中,此功能即取消存贮该括号内的匹配内容.
如:
/(?:a|b|c)(d|e)f\1/中的\1表示已匹配的d或e,而不是a或b或c。
2.内嵌模式选项
通常模式选项置于其后,有四个选项:i,m,s,x可以内嵌使用,语法为:/(?option)pattern/,等价于/pattern/option.
3.肯定的和否定的预见匹配
肯定的预见匹配语法为/pattern(?=string)/,其意义为匹配后面为string的模式,相反的,(?!string)意义为匹配后面非string的模式.如:
$string="25abc8";
$string=~/abc(?=[0-9])/;
$matched=$&;#$&为已匹配的模式,此处为abc,而不是abc8.
4.模式注释
Perl5中可以在模式中用?#来加注释,如:
- if($string=~/(?i)[a-z]{2,3}(?#matchtwoorthreealphabeticcharacters)/
- {
- ...
- }
【编辑推荐】