为什么说Amazon的James Hamilton可遇不可求的?

云计算
2011年8月的一个雨天的星期一,弗吉尼亚州北部一个千万瓦变压器发生爆炸,爆炸在电网中造成一个庞大的突增电压。这场风暴袭击了Amazon维吉尼亚州Ashburn的一个数据中心,击穿了设备的主电源;大约15分钟后,James Hamilton驾车抵达。

James Hamilton曾兰博基尼和法拉利的专业汽修工,如今Amazon数据中心帝国的“国王”。曾效力于IBM和微软。Wired作者Robert McMillan最近带来了一篇关于Hamilton的文章,称其为文艺复兴式黑客,黑掉生活、黑掉一切,然后寻求焕然一新。下面看看IBM、微软以及Amazon都看上了这个“汽修哥”的何处。

以下为译文:

 

[[64634]]

 

Hamilton在自己的Dirona号上

2011年8月的一个雨天的星期一,弗吉尼亚州北部一个千万瓦变压器发生爆炸,爆炸在电网中造成一个庞大的突增电压。这场风暴袭击了Amazon维吉尼亚州Ashburn的一个数据中心,击穿了设备的主电源;大约15分钟后,James Hamilton驾车抵达。

而Hamilton的到达无疑是个意外的惊喜,Hamilton是个杰出的工程师,负责管理Amazon数据中心日益复杂的设计。AWS ——这个不亚于革命性的在线服务集合,用户包括Netflix、Pinterest、Dropbox等公司。Ashburn的设备是AWS数据中心帝国的一部分。一旦服务中断,类似NetFlix这些服务都会存在中断的危险,而Hamilton就是负责保证宕机不会发生的人。

当Hamilton和他的团队抵达时,备用发电机已经启动;然而基于某些原因,电子并不能成功的送达数据中心内部的服务器。而在Hamilton到达之前,这些服务器已经消耗了电池系统的大部分电力;介于只是断电时的备用电池,其储电量并不是很高。Hamilton在Amazon最近的拉斯维加斯会议上发表讲话说:“我们刚好在服务开始宕机之前抵达,非常烦。”

“非常烦”还是一个婉转的说法。然而Hamilton的工作是冷静的面对这种情况,并且指出在以后该如何避免。他的团队最终认识到,设施中的备份电力开关设计并不符合Amazon;而在Amazon,这种宕机时间是不能被容忍的。现在Amazon已经使用了自己的PLC电力装置。Hamilton在拉斯维加斯的会议上解释道:“我们现在拥有多家开关装置供应商,我们已经对所有的PLC程序设计进行了仔细检查,并且做了编码复核。”

Amazon的EC2和S3网络服务于2006问世,它们改变了计算业务。而大服务器制造商(比如Sun Microsystems)曾经企图使用类公用事业公司出售电力和水的方式去重铸这个行业,但是出乎所有人的意料,Amazon这个卖书和光盘零售商,建立起市场所需要的一套服务。7年后Amazon已经运转几十亿美元的云计算业务 —— 大约占整个互联网份额的1%,然后Rackspace、HP等公司纷纷效仿试图复制它的成功。

然而这个巨大的成功同样带来一系列的计算问题,而James Hamilton就是解决类似问题的一个关键人物,寻求重铸云时代数据中心的方法。就像另外两个云巨头微软和Google一样,Amazon对其数据中心技术也是相当的保密,把它作为最重要的商业机密;然而 Hamilton却反其道而行,他是Amazon为数不多被允许在博客中发表优秀想法的员工之一;而这个50多岁的加拿大人已经成为整个行业分布系统领域名副其实的专家,帮助Amazon建立为全球上万公司提供服务的分布式系统。

Netflix(Amazon最高调的用户)云架构总监Adrian Cockcroft说道:“他确实是个内行,已经制造了许多有趣的东西。”

对Netflix来说,Amazon的服务是完美的。Netflix在星期天晚上的访问量将达到峰值,而星期一则是低谷。通过Amazon,Netflix可以在在最需要的时候获得足够的资源,而在不需要的时候可以抛弃它们。但是Cockcroft和公司必须坚信Amazon可以承担它的主要操作,并且一直不会中断,同样开销必须比自己做来的低。这就是Hamilton的用武之地!

 

[[64635]] #p# 

 

从法拉利到数据库

我们于2012年11月(Asburn数据中心灾难发表讲话的前一天)在拉斯维加斯遇见Hamilton,他和他的妻子刚刚完成从旧金山到夏威夷的11天海上旅行。如照片所见,Hamilton并不是一个典型的数据中心工程师;他还是一个典型的船夫 —— 甚至在船上居住,他曾今还是一个兰博基尼和法拉利的专业汽修工。

在80年代,他从汽车转至数据库,开始在IBM的DB2和微软的SQL Server做一些创意设计。NetFlix的Adrian Cockroff在加利福尼亚Asilomar的高性能系统作坊(High Performance Transaction Systems Workshop)会议上遇见了Hamilton,这是极客界的Bohemaian Gorve,在那里你可以找到可以和你畅谈数据库的人。会议只有接到邀请函的人才能出席,联合创始人为Jim Gray —— 数据中心行业的传奇性专家,而在之后业界也经常把他与Hamiltion相提并论。Gray和Hamilton对大海有着同样的爱好,而不幸的是,Gray于6年前在加利福尼亚北部的海面失踪;在Hamilton去微软之前,他们曾共事于IBM的数据中心。

Hamilton在微软效力时,担任Data Center Futures的研究团队中担任架构师。在2009年他进入了Amazon负责类似的工作,然而其中的细节至今仍是秘密,因为Amazon和微软都不愿公布其数据中心秘密。当我们询问微软数据中心部门主管David Gauthier他是否认识Hamilton时,他回答:“是的,曾今与Hamilton共事了很长时间,直到他离开了微软。”然而他拒绝透露更多相关事宜。

然而我们还能间或的听到Hamilton在改善数据中心:当汉Hamilton效力微软时,曾有报道称其为微软发展模块化(使用自定制容器将服务器更好的组织在一起)数据中心背后的驱动力之一。而在一次与Hamilton共饮时,他证实:为了更好的节省成本,Amazon正在设计自己的服务器。

在他的博客中,Hamilton展示了他设计数据中心方法的冰山一角 —— 比如说他负责的巨大柴油引擎。他曾今还支持在服务器中使用类手机的超低功耗芯片,而在这个月早期Orleans Superdome第47界超级碗进行到一半停电时,他对如何阻止类似事情发生做一份详细的分析。

通过计算机科学教授Lazowska了解到:而在过去几年里,Hamilton一直在华盛顿大学发表客座演讲,内容涉及到数据中心设计和效率。Lazowska还强调这些只是他工作的一部分,他于以前的Gray同样的“广阔和深远”。

 

[[64636]] #p#

 

文艺复兴式的黑客

大约四年前,James夫妇卖掉了自己的房子、汽车和大多数身外之物,搬到了Dirona号。现在,当其停泊在西雅图时,他会骑自行车去Amazon总部,使用Amazon Prime,在当地的UPS处收邮件。然而他不会一直滞留在西雅图,有时他会驾船开往夏威夷,而后在那里工作。

简而言之,他黑了自己的生活。他会对生活方式进行重新思考,然后焕然一新。Hamilton是那种企图黑掉一切的人,这也是Amazon迫切需要他的原因。

Amazon已经在全球建立了诸多数据中心,从巴西到新加坡到爱尔兰。Amazon2011年在科技和内容领域上的投资达到45亿美元;虽然Amazon并未透露该公司在数据中心业务上的开销,然而在2012年新增的16亿美元支出中大部分被放在了服务器上。由于涉及数十亿美元的庞大资金,Amazon需要有人能维持数据中心的运作,还要尽可能高效的运作。

Ed Lazowska称这种人才是可遇而不可求的。“即使是在微软、Amazon和Google这样的大公司中,也只有少数人真正明白你需要聚焦何处。如果你把目标放在尽可能以高的成本效益来运营数据中心,只有他们知道需要做些什么。”

James Hamilton就是其中之一!

责任编辑:王程程 来源: Wired
相关推荐

2019-10-30 09:00:31

云计算行业科技

2023-05-29 08:03:41

代码Go语言

2021-05-19 16:21:16

比特币加密货币货币

2020-11-02 17:21:07

云计算

2021-04-20 10:33:27

云计算网络安全技术

2021-04-19 10:28:28

物理安全云计算云安全

2012-05-15 09:21:33

AmazonZynga云计算

2022-03-14 08:33:09

TypeScriptJavaScript前端

2020-07-03 14:05:26

Serverless云服务商

2021-11-29 18:27:12

Web Wasmjs

2015-10-12 08:56:27

Java不可变

2011-09-20 15:51:42

NoSQL

2021-04-07 06:58:32

边缘计算计算云计算

2016-04-06 11:29:58

JavaScriptDOM操作

2011-10-27 13:37:51

网页设计

2023-05-05 16:26:33

2018-08-01 13:59:44

区块链协议应用层

2022-09-23 10:58:44

谷歌员工生产力大O表示

2019-09-23 13:37:09

Anthos谷歌Kubernetes

2020-12-20 17:37:38

Java开发代码
点赞
收藏

51CTO技术栈公众号