不会出错的程序 是怎样炼成的

开发 前端
软件的使用者们经常抱怨遇到的种种bug,但程序毕竟都是人写的,在工程如此巨大的情况下,程序出错几乎是一个不可避免问题。但是真的就没有解决办法了吗?不是的!要制造不会出错的程序,数学家有办法。

相信每个人都见识过Windows那令人忧郁的蓝屏吧。有时因为它,很多天的工作毁于一旦,在这个时 候,你是否会在心中大骂那帮不细心的程序员呢?程序员不是上帝,他们也会犯错误。对于商业软件来说,在上市之前会进行大量的测试,即使有程序错误溜过去 了,大多也可以通过打补丁来修复。但是对于某些软件来说,情况就麻烦得多。

程序错误导致的无妄之灾

在1996年的一个日子,欧洲航天局***次发射了新研制的Ariane 5运载火箭。在起飞37秒之后,新火箭很想不开地开花了。这令砸了几亿欧元进去的欧洲航天局非常不爽。经过调查,专家组发现,事故的罪魁祸首竟然是短短的一段代码。

在Ariane 5的软件中,有一部分代码是直接从它的前辈Ariane 4上扒下来的。正是这行代码,在Ariane 4上没有问题,在Ariane 5上却发生了溢出错误。更为讽刺的是,这行代码所在的函数,对于Ariane 5来说是不必要的。这场事故完全就是人祸。

经过这场事故之后,欧洲航天局怒了,决定要一劳永逸地解决Ariane 5的问题。他们的要求相当大胆:Ariane 5的软件代码,正式使用前要证明它们不会出现毁灭性的错误,比如不会溢出,不会死循环等等。

但问题是,这其实不是一件容易的事情。

停机定理意味着神奇的检验程序不可能存在

假设有一个程序R,可以正确判定任意别的程序P在某个输入I上会不会死循环,而且它本身总是会停止的。那么,我写一个程序P1,它从6开始,逐一验 证每个偶数是不是可以分成两个素数的和,如果遇到某一个偶数不可以这样分解的话就返回退出。那么,当这个程序出现死循环,就能说明哥德巴赫猜想是对的。而 死循环我们只要用程序R就可以验证。同样道理,所有数学命题,只要能写一个程序验证,都可以用R来判断这些命题是对是错,我们的神奇程序R蕴含了一切数学 的秘密。

不过,世上不会有这么好的事情,因为这个程序R是不可能存在的。我们可以用反证法:假设R存在,我们来写一个程序RR,它接受一个输入I,这个I既 能看成程序,也能看成输入,然后用R去判断程序I在输入I上会不会停止。如果会停止的话,就进入死循环,否则就停止。简单的代码如下:

  1. RR(I){  
  2. if(R(I,I)=stop)  
  3. while(1);  
  4. else  
  5. return;  

所以,RR(I)停止当且仅当I(I)死循环。

那么,R(RR,RR)的结果会是怎么样呢?它判断的是RR(RR)是否会停止。但由上面结论可知,RR(RR)停止当且仅当RR(RR)死循环,这明显是矛盾的!所以,这样的神奇程序R并不存在。

这就是著名的停机定理。也就是说,不存在这样一个程序,自己总会停止,又可以判定别的程序会不会停止。这就说明了,要证明程序不会出错,不是一件看上去那么容易的事情。

那么欧洲航天局的任务是否完全不可能完成呢?也不是。停机定理只是说明了不存在程序能正确判定所有程序是否会停止,但欧洲航天局只需要证明Ariane 5的软件代码这个程序不会出错,所以这条路也没有完全被堵死。

那么,有什么办法呢?

用抽象释义方法吧

虽然我们不能判定所有程序是否不会出错,但我们能有效判定某些程序不会出错。

比如说如果一个程序没有任何循环语句或者跳转语句,那么这个程序是肯定会停止的,因为只能从头到尾顺序执行。那么,如果程序有循环语句,我们该怎么办呢?单靠这个信息,我们并不能确定程序会不会停止,那么最保险的办法就是说“我不知道”。

这就是抽象释义(Abstract Interpretation)方法的根本:我们抽象出程序的某些信息,对这些信息进行自动分析,来尝试确定程序是否有着我们想要的性质,比如不会死循 环、不会溢出等等。我们不强求这种分析能识别出所有符合我们要求的程序,但我们要求这种分析是可靠的,也就是说,如果分析的结果认为程序有我们想要的性 质,那么事实就确实是这样。正是因为这样的权衡取舍,抽象释义方法才能正确有效地实行。

根据抽象出来的信息多少,不同的抽象释义方法判断同一种性质的效果也不一样。一般来说,抽象出的信息越详细,能识别的拥有某种性质的程序就越多,相应地计算时间也越长。如何在性能和识别率之间做取舍,也是一门复杂的学问,需要开发不同的抽象方法和自动分析算法。

如果我们感觉某个程序有着我们想要的性质,但是手头上的抽象释义方法又不能确定这一点,那么我们可以换用别的更精细的、利用更多信息的抽象方法进行 分析。另一种途径就是直接改写程序本身。比如说我们想要证明某段代码不会溢出,但手头上的抽象释义方法指示在某句代码上可能会有溢出,那么我们可以通过修 改代码,换用更加谨慎的处理方法,来保证抽象释义方法能确认新的代码不会溢出。

抽象释义方法的奠基者是法国的Patrick Cousot和Radhia Cousot。这对夫妻档总结了一些对程序进行自动形式证明的方法,在此之上提出了抽象释义方法,将其形式化严格化。抽象释义方法的一个实际应用例子是空 中客车A380的控制代码,经过Patrick Cousot的一个小组开发的抽象释义软件Astrée验证,证明了这些控制代码运行时,不会产生像死循环、溢出或者被零除之类的一些软件问题,从而也给 安全系数多加了一层保险。

不过,抽象释义方法只能证明程序有着某种我们想要的性质,不能说明程序是否完成了我们希望的任务。有没有办法做到这一点呢?

用形式证明吧

有一种激进的做法:让程序员在编写代码的同时,给出这段代码确实完成了给定任务的数学证明。

要给出这种证明,首先要解决的就是如何将“代码完成了给定任务”转换成数学命题。程序代码可以相当容易用逻辑表达,而且也有软件可以自动地将代码翻 译成要处理的数学对象。但我们要代码完成什么任务,这个就只有我们才知道,这就是为什么要让程序员在编写代码的同时给出证明,这就是为了程序员能用逻辑的 形式确定这个函数的功能,这样才能得到要证明的命题。

但是,现在的程序动辄几十万行,要是用人力来证明的话,那恐怕要几个数学家花几个月的时间才能完成,那成本就很高了。能不能用电脑来帮我们做这个证明呢?

看起来不太可能,但的确有人在干这种事情。在法国的一帮计算机学者搞出来了一个数学证明辅助程序,叫Coq,在法语里边是公鸡的意思。本来他们开发 这个程序的本意,正是尝试用它来帮助程序员完成某些机械的证明过程。因为证明某个程序不会出错的过程也相当机械的,所以用它也没问题。Coq中有很多自动 证明的策略,可以在很大程度上帮助程序员快速完成这类证明。

贯彻这种设计理念的是由法国计算机科学家Xavier Leroy带头编写的,一个叫CompCert的C编译器。

编译器是将一种代码翻译成另一种代码的工具,它的任务就是进行忠实的代码翻译,确保源代码和目标代码的行为一致。但是编译器未必可靠,错误编译的情况时有发生,如果关键的系统出现问题,那么像Ariane 5那样的事故可能又会再次发生,而且问题更加隐蔽不易察觉。

而CompCert就解决了这个问题。在编写CompCert的时候,Xavier Leroy他们对于编译程序的每一步操作,都利用Coq给出了一个数学证明,确保代码的语义(也就是说代码应该干什么)在每一步都是不变的。合起来,他们 就证明了CompCert编译器在整个编译过程中保持了代码的语义,会将代码忠实地翻译成程序。

如果所有程序都有这样的数学保障的话,那么我们大概就再也不用受软件错误之苦了。但是,Coq的表达能力还相当有限,比如说C语言中的指针等概念,Coq还不能很好地表达出来。要想完全摆脱软件错误,我们还有很长的一段路要走。

有兴趣的同学可以去Astrée和Coq看看:

Astrée的官网是http://www.astree.ens.fr/ ,Coq的官网是http://coq.inria.fr/

 

[[34771]]

原文链接:http://www.guokr.com/article/47868/

【编辑推荐】

  1. 新手进入程序员世界的8个建议
  2. 如何从煤矿工成为程序员 你也可以
  3. 项目经理该如何培养优秀的程序员
  4. 程序员深思 八种级别八种人生
  5. 程序员如何纠正自身的七大坏毛病
责任编辑:陈贻新 来源: 果壳网
相关推荐

2012-12-03 10:22:24

程序员

2009-02-23 13:05:32

程序员学习方法

2010-03-24 15:40:39

网管运维管理摩卡软件

2015-09-06 09:09:13

2014-06-20 10:34:42

开源

2011-11-25 09:48:04

天线无线

2013-08-19 16:17:48

CIO

2015-11-10 09:09:23

代码程序员成长

2024-03-28 08:13:51

GPTsOpenAI人工智能

2018-02-26 18:54:37

2012-05-28 16:30:27

Web

2021-02-08 23:52:17

CISO安全主管首席信息安全官

2010-12-28 10:40:50

admin

2012-08-29 09:58:34

JavaScriptJavaScript模

2015-08-27 15:06:42

全能渠道华为

2014-06-17 09:35:14

量子计算机永不出错

2016-01-06 14:43:21

2021-06-29 08:45:55

逻辑变量法函数

2020-01-16 15:51:32

人脸识别面部识别报告

2010-06-08 15:45:58

PHP
点赞
收藏

51CTO技术栈公众号