探客网专栏作家斯特林·卡姆登开发了一个电子邮件过滤器。在本文中,作者将对其进行详细介绍。
我的朋友,专栏作家斯特林·“芯片”·卡姆登最近将主要工作站的操作系统从微软Windows迁移到FreeBSD上。由于知道我的主工作站也采用了FreeBSD操作系统,因此,他还询问我关于新平台上软件的选择、系统的配置以及其它各方面事情的建议。尽管,最终他并没有完全复制我的选择,但从看到的情况来说,他的设置和我的建议还是非常接近的。在窗口管理器方面,他选择的是XMonad,而我使用的AHWM,但它们都是以键盘为主要操作方式,并且,我自己选择AHWM的主要目的是进行尝试(有朝一日)。
此外,在电子邮件工具方面,我们选择的软件也是相同的。在笔记本计算机中,我们都使用Mutt作为邮件用户代理(MUA)来对邮箱进行设置,利用ssmtp(简单的SMTP)作为SMTP客户端,POP客户端采用的是getmail。
我们两个人在垃圾邮件误报处理方面都保持非常谨慎的态度。绝不让一封垃圾邮件出现在收件箱中是非常重要的,但误处理带来的问题,需要收到的正常电子邮件被垃圾邮件过滤器误判,足以让我们放弃选择大部分常见的垃圾邮件过滤软件。
从我在探客网信息技术安全栏目上发表的内容中你可以看到,Mutt让电子邮件的总体处理变得非常简单,只要对收件箱里的垃圾邮件进行分析,就可以了解当前垃圾邮件的趋势。我先了解到在垃圾和网络钓鱼类电子邮件出现的信息,然后就可以利用Mutt强大的排序和管理功能,来快速消除大量垃圾邮件。由于它还需要我的直接干预,所以,斯特林选择他认为更合理的方法,以便更快地消除大量垃圾邮件是毫不奇怪的。
斯特林的方法是自己开发了一个电子邮件过滤器。用他在芯片技巧网站《利用Ruby语言开发基于脚本的电子邮件过滤器》一文中的原话来说,就是:
自从上世纪90年代初,开始使用第一个互联网电子邮件帐户到现在,我已经使用过所有类型的电子邮件过滤器,它们都不能满足我的要求。我希望能够阻止和伟哥相关的所有信息,但一位朋友或者家庭成员使用这个词时应该属于例外。纯贝叶斯过滤器似乎总是在阻止我认识的人发送的内容,而让一些真正的垃圾邮件通过。而白名单和黑名单技术都存在“应该先采用什么规则”的问题。
于是,他决定自己开发电子邮件过滤器,为什么叫做“getlessmail”是因为最早的设计目的是用来支持getmail运行的。他采用的方法是建立一种嵌入式领域特定语言(EDSL),用来对自己的过滤器进行配置。这样也就意味着,如果其它人希望使用getlessmail的话,可以使用同样的EDSL为电子邮件过滤器创建易于撰写和阅读的简单配置。下面就是他提供的简单配置的例子:
keep if from “mybestfriend@example.com”
spam if from "@example.com"
spam if subject "viagra|cialis"
spam if body "(?m:bnudeb.*bpicsb)"
我已经浏览过它的说明文件了,这个小工具看起来非常有用。我将来可能会用它来管理一个利用Mutt作为邮件用户代理的帐户。毕竟,我并不需要从多个电子邮件帐户中获得垃圾和网络钓鱼类的样本。看起来它似乎更适合某些类型的电子邮件帐户(只有拥有实际地址的人才知道某些类型的私人帐户),而不是其它的(公共帐户,让互联网上任何随机的人都有可能发送给你一封正常的电子邮件)帐户。当然,这一问题现在还没有电子邮件过滤器可以完全解决。除了其它方面的好处外,该电子邮件过滤器采用的是开放工作授权(OWL),自由复制授权中的一种,经常看我的文章的读者应该已经知道这是我认为安全软件应该选择的正确授权方式。
现在,芯片技巧的文章中已经提供了getlessmail的下载。压缩安装包中提供了一份说明文档,关于OWL的授权文档license.txt采用的是文本格式,以及一个演示,告诉你如何利用getlessmail对getmail进行配置,作为电子邮件过滤器使用,当然还有的就是getlessmail.rb程序文件本身。
在斯特林的支持下,我创建了一个支持getlessmail的代码仓库(BitBucket)项目,这样的话,他就可以对项目进行管理,所有使用分布式版本控制系统Mercurial(也称为hg)的开发者也可以进行镜像或者添加自己需要的内容。他告诉我,在下一步,将对getlessmail进行 “更新并增加一些支持脚本”,发布后,这些内容将出现在代码仓库的Mercurial库中。
【编辑推荐】