极端环境下的系统部署——为好奇号进行系统升级

译文
系统
本文作者Andy Hawkins记录了美国宇航局对于好奇号火星探测器系统升级的基本过程。在极端环境下的系统部署是什么样的?美国宇航局又采用了那些神奇的架构与通讯手段呢?在地球上的系统环境搭建又将注意哪些方面呢?

【51CTO精选译文】美国宇航局正在着手准备为好奇号火星探测器进行系统升级。系统升级工作大家都知道,没啥技术含量——不过好奇号有点特殊。就在不久之前它刚刚成功登陆火星,因此传统的DVD或者USB启动盘之类升级方案显然无法奏效。而且出于成本考虑,找家快递公司把系统盘带过去的想法也被严谨的科学人员否决了。

面对一系列难题,我开始不禁设想美国宇航局的专家们会如何就此展开讨论:

“还有三个月好奇号探测器就要发射了,系统工作状态怎么样?”

“挺好,没啥大问题。虽然版本和功能有点落后,但应该能解决。”

“有点落后?什么意思?”

“别紧张,只不过是驱动程序有点小毛病。”

“哪些驱动有问题?”

“没多少,就是轮胎控制不太好使……激光发射装置也有故障。最关键的摄像机还是运转良好的,虽然目前只有黑白图像,但已经不错了。”

“好吧……你确定发射的时候一切都能恢复正常?”

“当然,放心吧,其实我们已经考虑过了,发射之后再给系统打补丁也是可行的。”

“打补丁?”

“对,就像给PC机升级一样,方便快捷。”

“你确定一切会进展顺利吧?”

“确定,咱们搞技术的经常做系统升级,老简单了。”

“但到时候这东西可就上火星了,你知道吧?这跟升级PC机能一样吗?”

“我知道,火星嘛,红的圆的那个。没事,我们已经准备了很好的方案构思。”

“说说看。”

“你说这东西要花多久才能上火星?”

“253天。”

“啊!那就没事了。有两百多天,我们可以慢慢完善远程升级模块。不怕跟你交个底,最坏的情况也不过是这东西需要重启、而且有那么几天不能正常工作。”

[[91584]]

好奇号成功于火星着陆时,我一直在收看由美国宇航局放出的直播影像,对高科技的赞叹以及自豪的情感给我带来很大冲击。技术人员为这次伟大计划所做出的不懈努力令我深深着迷。对于这样一个庞大的项目,任何一丁点偏差都会令巨额投入功亏一篑,它的成功也因此变得更加值得景仰。美国宇航局甚至专门制作了一部名为“恐怖七分钟”的短片,详细描述了此次太空探索活动所遭遇过的病毒侵袭。当好奇号终于踏上火星的瞬间,相信每位观众都在兴奋之余感到一丝宽慰。

“能用就行”的观念令人后怕

“能用就行”不是挺好吗?答案恰恰相反,一切未经严格审核的妥协都会给计划带来大量威胁与变数。好奇号探测器不仅是一台单纯的设备,它代表着人类无数科技结晶的综合体,而成功登陆则是各项技术完美契合的证明。但随后的消息却令人错愕——美国宇航局宣布其网站由于负载过重而陷入瘫痪。

这着实令我大吃一惊。我刚刚以观众的身份见证了人类历史发展中的又一里程碑式事件,创新、工程与技术的最高成就在此刻融为一体——然而小小的网站处理能力问题却难倒了这群技术天才。我们似乎有种习惯,就是在实现庞大规划的同时不可避免地犯下一些低级失误。只要与日常工作关系不大,这些环节就总会在关键时刻掉链子——就拿这次来说吧,美国宇航局为好奇号项目投入了25亿美元的巨额预算,而官方网站居然会在直播时瘫痪了!

刚开始,好奇号火星探测器与地球之间的数据传输能力仅为5Mb,目前则已经扩展到40Mb——等到火星端主天线设置完毕后,带宽还将进一步提升。还没布置好主天线就有40Mb的带宽,这已经比我们地球这边的大部分普通网站更强力了,因此操作系统部署工作应该很容易才对。不过事情真是这样吗?

对于好奇号而言,整个OS升级过程要如何实现?事情会完全按照预定步骤顺利完成,还是遭遇一系列突发情况?就算是在地球上,要将手头的计算机系统从WindowsXP升级到Windows7都是件麻烦事,换在火星上真能一次搞定?宇航局官网事件令我们心存疑问。接下来就是我个人最难理解的问题:一定要把设备放出去再升级系统吗?难道在地球上升级系统比遥控火星上的设备还费劲?

在地球上进行操作系统部署比在火星上还难?

在发射之前,好奇号火星探测器无需在不允许停机的前提下进行系统部署,可以说升级活动虽然是项目中的关键环节,但却不会对既定任务造成影响,完全可以当作一项普通流程对待。除此之外,在地球上进行升级还可以大大降低项目开支。由于远程升级会带来诸多人力、时间及精力的额外投入,随之而来的部署成本也将呈直线上升趋势。根据项目规划,系统迁移工作需要涉及大量关键数据,同时要保证不能造成业务中断以及应用程序与信息丢失。这绝对是种费力不讨好的方案,真不知道美国宇航局是怎么想的。

在地球上进行系统部署显然要比在火星上容易得多

与美国宇航局的判断不同,我们一向会把系统升级工作提前做好。事实上,为身边的设备进行系统升级对于每位技术人员都不是难事。我们非常了解系统部署工作与基础设施中的难题,所以我们会使用像Nomad2012这样集成了微软SystemCenter配置管理工具(简称SCCM)的软件,以完成自动的形式完成高度优化且流程快捷的电脑系统迁移工作。在过去一个月中,我们已经靠这套方案成功实现了近四万台计算机的Windows7系统升级任务。

这才是处理任务的正常方式。

这才是系统部署的最佳方案。

不必中断正常工作,应用程序及用户数据都会正确保存在升级后的新系统中。

整个系统部署过程比遥控火星端容易得多,Nomad与SCCM会以自动化方式完成任务。

[[91585]]

为什么要使用Nomad2012?

Nomad2012如何控制我们的SCCM带宽管理?

Nomad2012是一款纯软件式解决方案,能够以动态方式管理IT业务中涉及的带宽资源,保证当业务流量与IT流量相冲突时,系统能够优先处理业务类数据信息。ReverseQos™正是令Nomad2012拥有这项能力的核心因素。

利用Nomad对SCCM中的分支设计及SCCM带宽管理加以规划,我们将不必再为将哪站点设为区域核心而浪费脑细胞。与微软SSCMWAN那充满局限性的带宽管理机制相比,与Nomad完整整合的分支设计功能使我们能在不添加任何额外SCCM分支设计限制的前提下定位应用程序及软件包。由于Nomad2012的设计初衷在于增强SystemCenter功能而非与之竞争,因此将其引入SCCM分支设计完全不会带来任何风险。

在评估Nomad2012及其它类似的SCCM分支设计客户管理系统时,许多企业都会针对自身运行环境提出一系列处理原则。

在不造成单点故障的前提下,它们能减少多少服务器使用量?Nomad通过微软配置管理器所减少的服务器基础设施数量远远超过市场上的同类产品。大家完全不用担心“该不该部署它”或者“这会不会造成单点故障”等问题,Nomad2012会对一切可能发生的情况做好准备。

在不造成单点故障的前提下减少网络基础设施

Nomad同时拥有字节层差异化、客户端缓存管理以及点对点冗余等功能,另外Nomad2012的分布式体系允许企业以难以置信的幅度(95%)削减基础设施服务器规模,而且不会带来任何单点故障之类的风险、不必要的客户端或者内核驱动。

出于管理政策、设施地理位置或者提高可用性及灾难恢复效果的考虑,大多数企业都希望内部设施能够以多点方式运行,而Nomad2012则是同类产品中惟一能满足这些需求的佼佼者。

除此之外,Nomad2012的系统部署工具还允许企业以超载形式处理迁移项目,这样一来我们就能够在不添加额外技术人员的基础上,最大程度通过自动化方式完成客户系统迁移。总而言之,Nomad2012值得一试,它让你的各类分支业务聚合成统一的整体——一套方案、通吃全部。

原文链接:Extreme OSD – Upgrading the OS of the Curiosity Rover on Mars

【编辑推荐】

  1. 升级至Ubuntu 12.04 Server的二三事
  2. Linux内核升级方法详解
  3. Mac升级Mountain Lion大概需要多久?
  4. Linux系统升级的经验之谈
  5. 微软详解Windows 8升级计划
责任编辑:张浩 来源: 51CTO.com
相关推荐

2012-07-06 15:31:29

Linux系统

2020-02-28 15:43:31

iOS系统苹果升级

2010-01-07 09:20:06

Ubuntu Serv

2013-10-11 10:22:02

Linux Deepi系统升级

2013-05-23 09:45:54

2010-04-14 11:11:00

2010-06-12 12:29:16

Grub Rescue

2009-12-16 09:56:30

Fedora Gnom

2013-09-30 09:57:16

企业监控系统升级

2021-08-01 22:15:11

Windows 10Windows 7微软

2013-05-16 15:04:55

系统升级

2016-12-04 15:08:05

NetApp

2014-10-29 17:25:26

Android 5.0Google

2011-03-11 21:24:47

系统升级

2010-10-09 16:39:40

系统升级

2013-02-08 01:00:45

Google广告系统升级

2014-04-30 15:44:11

2011-07-12 01:47:55

Windows 7企业信息化金融行业

2014-06-19 13:59:55

2021-11-24 22:39:03

手机系统功能
点赞
收藏

51CTO技术栈公众号