王垠：从工具的奴隶到工具的主人-51CTO.COM

我们每个人都是工具的奴隶。随着我们的学习，我们不断的加深自己对工具的认识，从而从它们里面解脱出来。现在我就来说一下我作为各种工具的奴隶，以及逐渐摆脱它们的“思想控制”的历史吧。

当我高中毕业进入大学计算机系的时候，辅导员对我们说：“你们不要只学书本知识，也要多见识一下业界的动态，比如去电脑城看看人家怎么装机。”当然他说我们要多动手，多长见识，这是对的。不过如果成天就研究怎么“装机”，研究哪种主板配哪种 CPU 之类的东西，你恐怕以后就只有去电脑城卖电脑了。

本科的时候，我经常发现一些同学不来上数学课。后来却发现他们在宿舍自己写程序，对 MFC 之类的东西津津乐道，引以为豪。当然会用 MFC 没有什么不好，可是如果你完全沉迷于这些东西，恐怕就完全局限于 Windows 的一些表面现象了。

所以我在大学的时候就开始折腾 Linux，因为它貌似让我能够“深入”到计算机内部。那个时候，书店里只有一本 Linux 的书，封面非常简陋。这是一本非常古老的书，它教的是怎样得到 Slackware Linux，然后把它从二三十张软盘装到电脑上。总之，我就是这样开始使用 Linux 的。后来我就走火入魔了，有时候上课居然在看 GCC 的内部结构文档。后来我又开始折腾 TeX，把 TeXbook 都看了两遍，恁是用它写了我的本科毕业论文。

后来进了清华，因为不满意有人嘲笑我用 Linux 这种“像 DOS 的东西”，以及国内网站都对 Windows 和 IE 进行“优化”的情况，就写了个“完全用 Linux 工作”。确实，会 Linux 的人现在更容易找到工作，更容易被人当成高手。但是那些工具同样的奴役了我，经常以一些雕虫小技而自豪，让我看不到如何才能设计出新的，更好的东西。当它们的设计改变的时候，我就会像奴隶一样被牵着鼻子走。

这也许就是为什么我在清华的图书馆发现《SICP》的时候如此的欣喜。那本书是崭新的，后面的借书记录几乎是空白的。这些看似简单的东西教会我的，却比那些大部头和各种 HOWTO 教会我的更多，因为它们教会我的是 WHY，而不只是 HOW。当时我就发现，虽然自认为是一个“资深”的研究生，学过那么多种程序语言，各种系统工具甚至内核实现，可是相对于 SICP 的认识深度，我其实几乎完全不会写程序！在第三章，SICP 教会了我如何实现一个面向对象系统。这是我***次感觉到自己真正的在开始认识和控制自己所用的工具。

因为通常人们认为 Scheme 不是一个“实用”的语言，没有很多“库”可以用，效率也不高，而 Common Lisp 是“工业标准”，再加上 Paul Graham 文章的怂恿，所以我就开始了解 Common Lisp。在那段时间，我看了 Paul Graham 的《On Lisp》和 Peter Norvig 的《Paradigms of Artificial Intelligence Programming》。怎么说呢？当时我以为自己学到很多，可是现在看来，它们教会我的并没有《SICP》的东西那么精髓和深刻。开头以为一山还有一山高，***回头望去，其实复杂的东西并不比简单的好。现在当我再看 Paul Graham 和 Peter Norvig 的文章，就觉得相当幼稚了，而且有很大的宗教成分。

进入 Cornell 之后，因为 Cornell 的程序语言课是用 SML 的，我才真正的开始学习“静态类型”的函数式语言。之前在清华的时候，有个同学建议我试试 ML 和 Haskell，可是因为我对 Lisp 的执着，把他的话当成了耳边风。当然现在用上 SML 就免不了发现 ML 的类型系统的一些挠人的问题，所以我就开始了解 Haskell，并且由于它看似优美的设计，我把“***语言”的希望寄托于它。我开始着迷一些像 monads, type class, lazy evaluation 一类的东西，看 Simon Peyton Jones 的一些关于函数式语言编译器的书。以至于走火入魔，对其它一切“常规”语言都持鄙视态度，看到什么都说“那只不过是个 monad”。虽然有些语言被鄙视是合理的，有些却是被错怪了的。后来我也发现 monad, type class, lazy evaluation 这些东西其实并不是什么包治百病的灵丹妙药。

但是我很不喜欢 Cornell 的压抑气氛，所以***决定离开。在不知何去何从的时候，我发了一封 email 给曾经给过我 fellowship 的 IU 教授 Doug Hofstadter （《GEB》的作者）。我说我不知道该怎么办，后悔来了 Cornell，我现在对函数式语言感兴趣。他跟我说，IU 的 Dan Friedman 就是做函数式语言的啊，你跟他联系一下，就说是我介绍你来的。我开头看过一点 The Little Schemer，跟小人书似的，所以还以为 Friedman 是个年轻小伙。当我联系上 Friedman 的时候，他貌似早就认识我了一样。他说当年你的申请材料非常 impressive，可惜你***没有选择我们。你要知道，世界上最重要的不是名气，而是找到赏识你，能够跟你融洽共事的人。你的材料都还在，我会请委员会重新考虑你的申请。IU 的名气实在不大，而 Friedman 实在是太谦虚了，所以连跟他打电话都没有明确表态想来 IU，只是说“我考虑一下……”这就是我怎么进入 IU 的。

Friedman 的教学真的有一手。虽然每个人对他看法不同，但是有几个最重要的地方他的指点是帮了我大忙的。有人可能想象不到，在 Scheme 这种动态类型语言的“老槽”，其实有人对“静态类型系统”的理解如此深刻。也就是在 Friedman 的指点下，我发现类型推导系统不过是一种“抽象解释”，而各种所谓的“typing rule”，不过是抽象解释器里面的分支语句。我后来就通过这个“直觉”，再加上 Friedman 的逻辑语言 miniKanren 里面对逻辑变量和 unification 的实现，做出了一个 Hindley-Milner 类型推导系统（HM 系统），也就是 ML 和 Haskell 的类型系统。虽然我在 Cornell 的课程作业里实现过一个 HM 系统，但是直到 Friedman 的提点，我才明白了它“为什么”是那个样子，以至于达到更加优美的实现。后来经他一句话点拨，我又写出了一个 lazy evaluation 的解释器（也就是 Haskell 的语义），才发现原来 SPJ 的书里所谓的“graph reduction”，不过就是如此简单的思想。只不过在 SPJ 的书里，细节掩盖了本质。后来我在之前的 HM 系统之上做了一个非常小的改动，就实现了 type class 的功能，并且比 Haskell 的实现更加灵活。所以，就此我基本上掌握了 ML 和 Haskell 的理论精髓。

可是类型系统却貌似一个无止境的东西。在 ML 的系统之上，还有 System F，Fw, MLF，Martin Lof Type Theory，CIC，…… 怎么没完没了？我一直觉得这些东西过度复杂，有那个必要吗？直到 Amal Ahmed 来到 IU，我才相信了自己的感觉。然而，这却是以一种“反面”的方式达到的。

Amal 是著名的 Andrew Appel （“虎书”的作者）的学生，在类型系统和编译器的逻辑验证方面做过很多工作。可是她比较让人受不了，她总是显得好像自己是这里唯一懂得类型的人，而其他人都是类型白痴。她不时的提到跟 Bob Harper, Benjamin Pierce 等类型大牛一起合作的事情。如果你问她什么问题，她经常会回答你：“Bob Harper 说……”她提到一个术语的时候总是把它说得无比神奇，把它的提出者的名字叫得异常响亮。有一次她上课给我们讲 System F，我问她，为什么这个系统有两个“binder”，貌似太复杂了，为什么不能只用一个？她没有正面回答，而是嘲讽似的说：“不是你说可以就可以的。它就是这个样子的。”后来我却发现其实有另外一个系统，它只有一个 binder，而且设计得更加简洁。后来我又在课程的 mailing list 问了一个问题，质疑一个编译器验证方面的概念。本来是纯粹的学术讨论，却发现这封 email 根本没有发到全班同学信箱里，被 Amal 给 moderate 掉了！

看到这种种诡异的行为，我才意识到原来学术界存在各种“帮派”。即使一些人的理论完全被更简单的理论超越，他们也会为“自己人”的理论说话，让你搞不清到底什么好，什么不好。所以后来我对一些类型系统，以及 Hoare Logic 一类的“程序逻辑”产生了怀疑。我的课程 project 报告，就是指出 Hoare Logic 和 Separation Logic 所能完成的功能，其实用“符号执行”或者 “model checking” 就能完成。而这些程序逻辑所做的事情，不过是把程序翻译成了等价的逻辑表达式而已。到时候你要得知这些逻辑表达式的真伪，又必须经过一个类似程序分析的过程，所以这些逻辑只不过让你白走了一些弯路。当 Amal 听完我的报告，勉强的笑着说：“你告诉了我们这个结论，可是你能用它来做什么呢？”我才发现原来透彻的看法，并不一定能带来认同。人们都太喜欢“发明”东西，却不喜欢“归并”和“简化”东西。

可是这类型系统的迷雾却始终没有散去，像一座大山压在我头上。我不满意 Haskell 和 ML 的类型系统，又觉得 System F 等过于复杂。可是由于它们的“理论性”和它们创造者的“权威”，我不敢断定自己的看法就不是偏颇的。对付疑惑和恐惧的办法就是面对它们，看透它们，消灭它们。于是，我利用一个 independent study 的时间，独立实现了一个类型系统。我试图让它极度的简单，却又“包罗万象”。经过一番努力，这个类型系统“涵盖”了 System F, MLF 以及另外一些类似系统的推导功能，却不直接“实现”他们。后来我就开始试图让它涵盖一种非常强大的类型系统，叫做 intersection types。这种类型系统的研究已经进行了 20 多年，它不需要程序员写任何类型标记，却可以给任何“停机”的程序以类型。著名的 Benjamin Pierce 当年的博士论文，就是有关 intersection types 的。没几天，我就对自己的系统稍作改动，让它涵盖了一种***大的 intersection type 系统（System I）的所有功能。然而我却很快发现这个系统是不能实用的，因为它在进行类型推导的时候相当于是在运行这个程序，这样类型推导的计算复杂度就会跟这个程序一样。这肯定是完全不能接受的。后来我才发现，原来已经有人指出了 System I 的这个问题。但是由于我事先实现了这个系统，所以我直接的看到了这个结论，而不需要通过繁琐的证明。

所以，我对类型推导的探索就这样到达了一个终点。我的类型系统是如此的简单，以至于我看到了类型推导的本质，而不需要记住复杂的符号和推理规则。我的系统在去掉了 intersection type 之后，仍然比 System F 和 MLF 都要强大。我也看到了 Hindley-Milner 系统里面的一个严重问题，它导致了这几十年来很多对于相关类型系统的研究，其实是在解决一个根本不存在的问题。而自动定理证明的研究者们，却直接的“绕过”了这个问题。这也就是我为什么开始对自动定理证明开始感兴趣。

后来对自动定理证明, Partial Evaluation 和 supercompilation 的探索，让我看到那些看似高深的 Martin Lof Type Theory, Linear Logic 等概念，其实不过也就是用不同的说法来重复相同的话题。具体的内容我现在还不想谈，但是我清楚的看到在“形式化”的美丽外衣下，其实有很多等价的，重复的，无聊的东西。与其继续“钻研”它们，反复的叨咕差不多的内容，还不如用它们的“精髓”来做点有用的事情。

所以到现在，我已经基本上摆脱了几乎所有程序语言，编译器，类型系统，操作系统，逻辑推理系统给我设置的思维障碍。它们对我来说不再是什么神物，它们的设计者对我来说也不再是高不可攀的权威。我很开心，经过这段漫长的探索，让我自己的思想得到了解放，翻身成为了这些工具的主人。虽然我看到某些理论工具的研究恐怕早就已经到达路的尽头，然而它们里面隐含的美却是无价和永恒的。这种美让我对这个世界的许多其它方面有了焕然一新的看法。一个工具的价值不在于它自己，而在于你如何利用它创造出对人有益的东西，以及如何让更多的人掌握它。这就是我打算现在去做的。

原文链接：http://blog.sina.com.cn/s/blog_5d90e82f01018x95.html