实例解析Perl命令行实用程序

开发 架构
本文向大家介绍一下Perl命令行参数的概念,通过Perl命令行,Perl仅用一行就可以实现大多数其它语言需要数页代码才能完成的任务。

本文和大家重点学习一下Perl命令行参数,Perl命令行实用程序那些将Perl用作编程语言的人经常忽视了:Perl用作Perl命令行操作的快速而又难看的脚本编制引擎时是很有用的。

Perl命令行实用程序

Perl命令行实用程序那些将Perl用作编程语言的人经常忽视了:Perl用作Perl命令行操作的快速而又难看的脚本编制引擎时是很有用的。通过Perl命令行,Perl仅用一行就可以实现大多数其它语言需要数页代码才能完成的任务。跟着Teodor,他会教给您一些有用的示例。

  为了完成这一篇how-to文章,您需要在系统上安装Perl5.6.0。您的系统最好安装比较新(2000或更新)的Linux或Unix,但是其它操作系统也能照样工作。所有的示例都使用tcshshell(尽管bash及其它shell也能工作)。虽然这些示例也许可以和较早版本的Perl、Linux及其它操作系统一起工作,但是如果它们不能一起工作,那么它们无法工作的原因可以作为练习,让读者去解决。

  我想说的第一点是:有经验的程序员不应回避快速而又难看的解决方案。在其它专栏文章中,我已经强调了文档编制和彻底性。本专栏文章将集中在编程的消极面,其中文档编制是可选的,而咖啡因却无从选择。因为我们已经身陷其中。

  第二点和第一点一样重要:快速而又难看的解决方案很难正确完成。如果您知道如何记录、测试和调试完整的脚本,那么您就非常有可能在一行程序中取得成功。如果您不知道怎样做,那么这就像是企图用鲱鱼来砍倒红杉树(而您的技能就是那条鲱鱼)。

  第一步,您应该学习shell的特性:Unix将Perl命令行参数传递给Perl的方式及这些参数的Perl解释方法。#p#

  Perl命令行的实质

  在Unix中您将看到可执行任务的概念,一个进程通常是装入内存的程序。除了初始进程外,进程都可以由其它进程来启动,初始进程通常是由内核(有时由内核进程)来启动的。就用户的观点而言,启动进程需要shell或启动程序。因此,当用户在shellPerl命令行输入"xeyes"或者从启动程序菜单(类似于GNOME任务栏)选择XEyes应用程序时,shell或启动程序创建新的进程以运行该程序。
  进程获得Perl命令行参数。因此,例如,"perl"和"perl-w"是对同一个程序的两种不同调用。在内部,Perl(类似于C)将参数传递给它用@ARGV数组解释的脚本。但是和C不同的是,Perl偷偷地从脚本中"窃取"其中一些参数以用于自己的用途。例如,正在解释的脚本看不到传给Perl解释器的"-w"参数,除非脚本看来需要它。shell用空格字符隔开参数。

  传给Perl的"-e"参数告诉Perl获取Perl命令行中"-e"后的任何内容并将它当作脚本来运行。"-M"参数表示获取其后的任何内容并将该内容作为模块导入,类似于正规脚本中的"useModuleName"。请参阅perldocperlrun页面以获取有关Perl必须从Perl命令行提供的开关的更多信息。
  可能最好在这里举些示例。根据本专栏文章的精神,让我们使用一行程序。脚本的-MData:umper-e'printDumper-@ARGV'部分只是打印出了@ARGV数组的内容。

  清单1.Perl命令行参数
  

  1. #atthecommandline,typeeachlineafterthe'>'  
  2.   #andyou'llgettheoutputthat  
  3.   #followsit  
  4.   #printthe@ARGVcontentswithnoprogramarguments  
  5.   >perl-MData:umper-e'printDumper\@ARGV'  
  6.   $VAR1=[];  
  7.   #printthe@ARGVcontentswitharguments"a"and"b"  
  8.   >perl-MData:umper-e'printDumper\@ARGV'ab  
  9.   $VAR1=[  
  10.   'a',  
  11.   'b'  
  12.   ];  
  13.   #printthe@ARGVcontentswithwarningson,andarguments"a"and"b"  
  14.   >perl-w-MData:umper-e'printDumper\@ARGV'ab  
  15.  
  16. $VAR1=[  
  17.   'a',  
  18.   'b'  
  19.   ];  
  20.   #printthe@ARGVcontentswitharguments"a","b",and"-w"  
  21.   #notehowthe-wisnotstolenbyPerlifitfollowsarguments  
  22.   #thatPerlknowsitdoesn'twant  
  23.   >perl-MData:umper-e'printDumper\@ARGV'ab-w  
  24.   $VAR1=[  
  25.   'a',  
  26.   'b',  
  27.   '-w'  
  28.   ];  
  29.   Hereisthefinallinethatincludessome  
  30.  

   除非您的shell限制了参数的数量或长度,不然您可以向Perl传递任意数量的参数。在Perl中打开神奇的文件句柄(filehandle)<>,这会将传送给Perl的每个参数作为文件名打开并逐行读取每个文件的内容。缺省情况下,$_变量会保存每一行。

  Shell使引号之间的所有内容都成为一个参数。这就是为什么在清单1中我们可以写成-e'printDumper\@ARGV'并且Perl可以将其看成单个一行程序脚本的原因。单引号更好,因为使用单引号后您可以在一行程序内使用双引号。Perl中的双引号用于解释双引号之间的任何内容。另一个示例或许会有助于进一步说明这一点:
  清单2.单引号vs.双引号
 

  1.  #printthePerlprocessID,followedbyanewline  
  2.   >perl-e'print"$$\n"'  
  3.   2063  
  4.   #error:thefirsttwodoublequotesgotogether,therestispassed  
  5.   #tothescriptdirectly  
  6.   >perl-e"print"$$\n""  
  7.   Barewordfoundwhereoperatorexpectedat-eline1,near"1895n"  
  8.   (Missingoperatorbeforen?)  
  9.   syntaxerrorat-eline1,nexttoken???  
  10.   Executionof-eabortedduetocompilationerrors.  

   用bash比用tcsh要好些,因为bash允许内部的双引号用\字符进行转义。但是shell仍然在将双引号内的$$传递给Perl之前对其进行解释。结论是:不要使用双引号来指定以-e开始的一行程序脚本参数。请参阅perldocperlrun以获取更多的详细信息,但是您主要应清楚什么在系统上有效并坚持下去。

  到目前为止您已经了解了-e和-M开关所起的作用:导入模块和运行语句。下面我列出了一些有用的其它开关;为了不把您搞糊涂,所以省略了那些更复杂的开关。请参阅perldocperlrun以获取完整的列表和一些使用想法。

  整洁性
  -w
  打开警告
  -Mstrict
  打开严格编译指示(pragma)
  数据
  -0
  (这是个零)指定输入记录分隔符
  -a
  将数据分割成名为@F的数组
  -F
  指定分割时-a使用的模式(请参阅perldoc-fsplit)
  -i
  在适当的位置编辑文件(请参阅perldocperlrun以获取大量详细信息)
  -n
  使用<>将所有@ARGV参数当作文件来逐个运行
  -p
  和-n一样,但是还会打印$_的内容
  执行控制
  -e
  指定字符串以作为脚本(多个字符串迭加)执行
  -M
  导入模块
  -I
  指定目录以搜索标准位置前的模块。#p#

  文件操作

  假定您在一个目录中有一些文件需要用特定的方式重命名。例如,所有包含单词"aaa"的文件应进行重命名,用单词"bbb"进行代替。我们将不使用Unix"mv"命令,因为用Perl的rename()函数来重命名文件已经相当不错了(请参阅perldoc-frename以获取当使用rename()出问题时的详细信息)。
请参阅清单3以获取将文件从aaa重命名为bbb的一行程序脚本。
  find.命令打印出当前目录下的所有文件和目录列表。如果您只想要查看文件,那么就给find添加"-typef"参数。获取find的输出(一个文件列表)并将其传递给一行程序。
  一行脚本使用-ne参数,该意味着它会被重写成:

  清单4.将文件从aaa重命名为bbb(已分解)
  

  1. while(<>)  
  2.   {  
  3.   chomp;#trimthenewlinefromthefilename  
  4.   nextunless-e;#thefilename($_)mustexist  
  5.   $oldname=$_;#$oldnameisnow$_  
  6.   s/aaa/bbb/;#changeall"aaa"to"bbb"in$_  
  7.   nextif-e;#thenewfilenamemustn'texist  
  8.   rename$oldname,$_;#renametheoldtothenewname  
  9.   }  

   正如您所看到的那样,这是个相当复杂的七行脚本。-n开关简化了很多东西。但是尽管如此,您还是必须知道$_变量和s///及-e运算符(请参阅perldocperlop页面以获取详细信息)。File::Find标准Perl模块本来可以代替Unixfind命令用于进行文件查找,但是脚本也会随之变得太大而不再是一行程序了。

  一行程序巧妙地平衡了有用性和复杂性,您必须准备好在需要时将它们重写成实际脚本,而不应让程序过于麻烦而无法控制。
  下面是文件处理的另一个示例:用已知的命名结构浏览MP3文件的目录并抽取专辑名。让我们假设文件名是"Artist-Album-Track#-Song.mp3"。
  清单5.查找Artist-Album-Track#-Song.mp3的专辑名
  >find.-name"*.mp3"|perl-pe's/.\/\w+-(\w+)-.*/$1/'|sort|uniq
  这个脚本非常简单。它依靠find的行为,总是在每个文件名前打印"./"。随后它仅用专辑名代替$_,并且-p开关自动打印专辑名。最后,按顺序的sort和uniq确保了重复的专辑名只打印一次。所有的find、sort和uniq调用都可以用Perl完成,但是在操作系统已经为我们编写了这一切时为何还烦恼呢?作为练习这会很有趣,但是实际上一行程序可能会变成20-30行不必要的代码。
  让我们分解Perl脚本(用一种简化的方式-省略-p开关的一些复杂性):

  清单6.查找Artist-Album-Track#-Song.mp3的专辑名(已分解)
  

  1. while(<>)  
  2.   {  
  3.   s/.\/\w+-(\w+)-.*/$1/;#extractthealbumnameinto$_  
  4.   }continue  
  5.   {  
  6.   print;#printthealbumname  
  7.   }  

  此外,请注意Perl是如何成为find、sort和uniq之间的中间工具的。不必尝试用Perl编写所有东西。您可以这么做,有时也必须这么做,但一行程序可以重用。还有,看看正则表达式是多么的简单。当然,如果MP3文件未正确命名,那么我们可能会获得一些异常的专辑名,但是这值得去尽力完善正则表
 

【编辑推荐】

  1. Perl命令行常见用法及技巧揭秘
  2. 常用Perl命令行参数应用介绍
  3. 浅析Perl命令行应用
  4. Perl命令行用法解析
  5. 五大常用Perl命令行参数应用介绍

 

 

责任编辑:佚名 来源: svn8.com
相关推荐

2010-07-15 10:58:23

Perl命令行程序

2010-07-15 10:47:22

Perl命令行

2010-07-15 11:08:23

Perl命令行

2010-07-21 14:08:28

Perl命令行

2010-07-15 12:45:30

Perl命令行

2010-07-15 09:37:47

Perl命令行

2010-07-20 14:18:22

Perl命令行

2010-07-26 09:32:41

Perl命令行

2010-07-20 14:02:38

Perl命令行参数

2010-07-26 09:22:05

Perl命令行

2010-07-15 09:27:25

Perl命令行

2011-04-15 13:36:03

2010-07-20 14:27:46

Perl命令行

2010-07-30 13:58:20

DB2 实用程序

2010-08-20 10:05:23

用户命令

2009-07-20 09:55:30

华为命令行解析华为认证

2011-07-11 13:20:13

linuxuniq

2010-01-27 14:01:19

Android命令行启

2017-09-05 08:57:02

Linux命令行技巧

2020-05-11 12:13:16

GNULinux
点赞
收藏

51CTO技术栈公众号