编写快速安全Bash脚本的建议-sh脚本编写命令

昨天我和一些朋友聊起Bash，我意识到：即使我已经使用Bash十多年了，现在还有一些基础的杂项，我理解的并不是很清晰。像往常一样，我认为我应该写一个博文。

我们会包含：

一些bash基础知识（“你怎么写一个for循环”）
杂项事宜（“总是引用你的bash变量”）
bash脚本安全提示（“总是使用set -u”）

如果你编写shell脚本，并且你没有阅读这篇文章中其他任何内容，你应该知道有一个shell脚本校验工具（linter），叫做 shellcheck 。使用它来使您的shell脚本更好！

我们会像讨论编程语言一样讨论bash，因为，怎么说呢，它就是。这篇文章的目标不是bash编程详解。我不会在bash中做复杂的编程，也真的不计划学习如何去做。但是，经过今天的思考之后，我认为明确整理下bash编程语言的一些基础知识是有用的。bash编程语言与我使用过的其他编程语言有着很大的不同。

我真的曾认为我已经知道这些东西了，但是通过写这篇文章我依旧学到了一些东西，也许你也会有所收获。

变量赋值

在bash中变量赋值按照下面的方式：

VARIABLE=2

并且你可以使用$VARIABLE（变量名）来引用变量。需要注意的是不要在=运算符的两边放置空格符，比如VARIABLE= 2、VARIABLE = 2、或者VARIABLE =2，这并不是语法错误，但是将会做完全不需要的事情（比如试图运行一个名字为2的程序，并将环境变量VARIABLE设置为空字符串）。

Bash变量并不要求全部大写，但是通常是大写的。

大多数你所使用的bash变量都是字符串。在bash中也有一些数组变量，但我并不是完全理解它们。

使用${}引用变量

有时某些变量，内容为file.txt，并且我想这样使用它：

mv $MYVAR $MYVAR__bak # wrong!

这段代码是无法工作的！它会去查找 MYVAR__bak变量，但这并不是一个真实存在的变量。

为了避免类似问题，你需要知道的仅仅是 ${MYVAR}和$MYVAR是一回事。所以你可以这样运行指令：

mv $MYVAR ${MYVAR}__bak # right!

全局变量，局部变量和环境变量

Bash有3种变量。我一般先想到（可能也是最常用）的是环境变量。

Linux上的每个进程实际上都有环境变量（您可以运行env查看当前设置的变量），但在Bash中，它们更易于访问。要查看名为MYVAR的环境变量，可以运行

echo "$MYVAR"

要设置环境变量，您需要使用export关键字：

export MYVAR=2

设置环境变量时，所有子进程将看到该环境变量。所以如果你运行export MYVAR=2; python test.py，python程序将MYVAR设置为2。

第二种变量是全局变量。同样像上面那样赋值。

MYVAR=2

在其他编程语言中他们表现得像全局变量。

还有局部变量，它们的作用域只能存在于bash函数中。我基本上从来没有使用过这样的函数（不像我写的其他编程语言），我从来没有使用过局部变量。

for循环

以下是我在bash中编写循环的方法。此循环将从1打印到10。

for i in `seq 1 10` # you can use {1..10} instead of `seq 1 10` 
do     
 echo "$i"
done

如果你想用一行代码写这个循环，可以这样写：

for i in `seq 1 10`; do echo $i; done

我觉得这是不可能记住的（你要怎么记住在 seq 1 10 之后有一个分号，但是在 do 之后却没有了），所以我不会去记它。

你也可以写while循环，但我从来没有这样写过。

有个很酷的事情是你可以遍历另一个命令的输出。seq 1 10 将数字从1到10（每行一个）打印，这个for循环只是提取该输出并遍历它。我就经常用这种方法。

您也可以使用反引号或$()来插入命令的输出。

OUTPUT=`command`
# or 
OUTPUT=$(command)

if 语句

在 bash 中的 If 语句是相当让人讨厌去记它。你必须放在这些方括号中，而在方括号之间必须有空格，否则它不起作用。[[ 和 [ 方括号(双/单) 都工作。这里我们真正进入 bash 的奇怪领域：[ 是一个程序(/usr/bin/[)但 [[ 是 bash 语法。[[ 更好。

if [[ "vulture" = "panda" ]]; then
 echo expression evaluated as true
else
 echo expression evaluated as false
fi

此外，您可以检查“此文件存在”，“此目录存在”等内容。例如，您可以检查文件 /tmp/awesome.txt 是否存在，如下：

If [[ -e /tmp/awesome.txt ]]; then
  echo "awesome"
fi

这通常是有用的，但我必须每次查找语法。

如果您想尝试用命令行，可以使用 test 命令，例如 test -e /tmp/awesome.txt 。它成功会返回0，否则返回错误。

***一件事是为什么[[比[好：如果你使用[[，那么你可以使用<做比较，它不会变成文件重定向。

$ [ 3 < 4 ] && echo "true"
bash: 4: No such file or directory
$ [[ 3 < 4 ]] && echo "true"
true

还有一个额外的***一件关于 if 的事：我今天学到是不需要通过[[或者[去使用 if 语句：任何有效的命令都会工作。所以你可以这样做

if grep peanuts food-list.txt
then
echo "allergy allert!"
fi

函数不是那么难

在 bash 中定义和调用函数（特别是没有参数）是非常容易的。

my_function () {
 echo "This is a function"; 
}
my_function #调用函数

总是引用你的变量

另一个 bash 技巧：绝不使用一个没有引用的变量。看看这个看似合理的 shell 脚本：

X="i am awesome"
Y="i are awesome"
if [ $X = $Y ]; then
 echo awesome
fi

如果你尝试运行这个脚本，你会得到不可理喻的错误消息 script.sh: line 3: [: too many arguments. 什么？

Bash 解释这个 if 语句为 if [ i am awesome == i are awesome]，这是6个字符串 (i, am, awesome, i, are, awesome) 无意义的 if 语句。正确的写法是

X="i am awesome"
Y="i are awesome"
if [ "$X" = "$Y" ]; then #我放置引号因为我知道bash会背叛我，如果我不放的话
 echo awesome
fi

有些情况下，只要使用 $ X 而不是 “$ X” 就可以，但是您可以知道何时可以，何时不行吗？我肯定不能。总是引用你的 bash 变量，你会更快乐的。

返回代码, &&, 和 `||

每个 Unix 程序都有一个“返回代码”，它是一个从0到127的整数。0表示成功，其他都意味着失败。这在 bash 中是有作用的，因为：有时我从命令行运行一个程序，并希望仅在***个程序成功的情况下运行第二个程序。

你可以用 && 实现！

例如：create_user && make_home_directory。这将运行 create_user ，检查返回代码，然后仅在返回代码为0时运行 make_home_directory。

这与 create_user; make_home_directory 不同，无论 create_user 的返回代码是什么，都将运行 make_home_directory。

你也可以使用create_user || make_home_directory，只有create_user运行失败才运行make_home_directory 。这在技术领域中非常巧妙。

后台进程

我不会在此谈及太多关于 job 控制的内容，但是：你可以像下面这样启动后台进程

long_running_command &

如果你后来后悔将进程放到后台，并希望把它带调回前台，你可以用 fg 来做到这一点。如果不止一个进程，您可以使用 jobs 查看所有后台进程。由于某种原因，fg 需要一个 “job ID”（这就是 jobs 打印输出的）而不是一个 PID。谁知道 Bash 为什么这样子呢。

另外，如果你在后台运行太多的进程，内置等待命令将等到它们都返回。

说到后悔 - 如果你不小心在错误的终端启动一个进程，Nelson Elhage 有一个很棒的项目叫做 reptyr ，可以保存你的进程并将其移到屏幕会话或者某些其他东西中。