有时候系统管理员需要截取Unix字符串的自串来完成特定的任务。如现在系统工程师需要对某个文件根据系统的时间来进行命名,其命名的规则为年份(***两位)加月份的形式,即0906表示这个文件是09年6月份创建的。因为每个月创建一个独立的日志文件,为此按这个格式对其进行命名算是比较合理的。
但是在系统中实现起来有一定的困难。然后通过date命令加上一些可选项参数可以截取日期的年份、月份等信息。可是利用date命令截取的年份是四位数字(如 2009),而不是两位数字。这跟系统工程师的需求还有一定的距离。那么如果一定要采用年份的两位数字来对文件或者文件夹进行命名,该如何处理呢?
此时就需要用到expr命令的另一个功能,即截取Unix字符串的功能。一般来说,expr命令主要有三个功能,分别为求字符串的长度、截取字符子串、求一个字符在一个Unix字符串中的位置。当然如果这些功能跟其他命令结合使用的话,可以实现一些比较复杂的需求。在Unix系统中,如果需要截取字符串的话,笔者首先建议的是采用一些自带的命令。
如date %w则表示显示今天星期几。虽然expr命令也可以实现类似的功能,但是初期起来比较麻烦。为此对于截取Unix字符串笔者建议,能够使用系统自带功能来实现的,那么就使用系统自带的命令。如果没有的话,那么就只有用过expr命令来实现。也就是说,expr 是一个通用的命令,所有的Unix字符串截取工作其都可以完成。
只是代码书写起来没有那些系统自带命令那么简单。如果现在系统工程师需要截取年份的后两位数字,此时该如何处理呢?在系统转义字符的帮助下,可以完成这个功能。如下所示:$expr “2009” : ‘..\(..\)’
在实现这个功能的时候,笔者使用了\这个转义字符。这个正则表达式的含义就表示只考虑前面这个Unix字符串的***两个字符,而忽略其他的字符。若需要利用上面这个规则来进行文件命令的话,只需要先利用这个命令截取年份的***两位,然后再把月份加上去即可。
上面的Unix字符串2009系统工程师也可以使用变量来代替。系统工程师需要注意的是这个正则表达式的书写方法。在使用expr命令来对字符串进行处理,其难点就在于这个正则表达式的书写。
通常情况下,只要合理编写这个正则表达式,则其Unix字符串的处理功能,并不会比数据库系统中Unix字符串处理函数来的差,甚至有过之而不及。现在的主要问题是,由于经验有限,系统工程师往往很难根据用户需求来定义这个正则表达式。
就连笔者有时候也会在这里卡住。如果系统工程师想要提高自己正则表达式的书写能力,那么多看看其他系统工程师书写的脚本,往往能够在最短时间内提高自己正则表达式的书写水平。
【编辑推荐】