曾经演绎千年等一回传奇爱情故事的杭州,近日再次上演了一场举国瞩目的爱情故事。不过这次却是活生生的爱情悲剧,男主人公在饱受夜以继日加班加点的摧残下,还遭受着爱情失意的重击。男主人最终将心中怒火发泄在了服务器身上,对服务器进行“格式化 ”处理,并将其视作爱情的陪葬品而踏上不归之路。
近日,一则有关“运维小伙因加班失恋 格式化所有服务器后自杀”的消息在微博上不胫而走。该消息的曝光,不仅凸显了IT从业人士身心健康的问题,而且也暴露出IT运维、尤其是服务器的管理存在着重大漏洞。
援引该微博原文:“杭州某高新技术开发公司,一名运维,长期以来饱受公司加班的摧残 ,近段时间,女友应无法忍受他长期加班,遂与之分手。此男悲痛欲绝,伤心之余,格式化并关闭所有服务器之后跳楼自杀。”
从以上内容我们可以做以下解读:男主人公饱受长期加班劳累之苦;男主人公承受因此带来的失恋之苦;男主人公不堪忍受、泄愤至服务器并踏上不归之路。在这则故事的背后,虽然有着令人扼腕长叹的怜惜和无奈,但勾起人们反省的却更多的是警示和教训:
长期加班缘何成为了IT运维人员的工作常态?身为运维人员是如何取得服务器“生杀”大权的?报警系统在服务器被格式化、关闭操作之时缘何失灵?要知道,如果报警系统能及时响应,就极有可能挽救一条生命!当然,成为爱情陪葬品的服务器(包括基于该服务器上的应用)在被格式化、被关闭后,也极有可能通过异地容灾备份来恢复被删除被关闭的服务。但我们同样要知道,如果没有事先采取这种异地灾备方案,那么后果是不堪设想的;而且身为普通IT运维人员,就能随随便便获得服务器root级别权限并进行格式化、关闭等非常规操作,其暴露出来的漏洞更是令人匪夷所思。#p#
毫无疑问,这位运维小伙没有走出爱情失意带来的阴影,而问题的根本貌似出现在长期的加班问题上。对于IT行业来说,加班是家常便饭的事。笔者此前也曾经讲过,加班是份内的事,这个社会尤其是这个行业,特别需要有奉献精神的人存在。但如果经常加班或者说长期加班成为了常态化,那就需要值得警惕了。
值得警惕的,并不仅仅是对工作抱以抵触的情绪,更应该注意的是如何平衡好工作和生活,如何在长期加班带来痛苦之余调理好身心健康。当然,更应该注意并值得反思的是,作为支撑各行各业、最具创新和高效活力的IT基础设施,缘何没有实现IT所倡导的智能化、自动化、标准化甚至是开放化。正所谓“己所不欲勿施于人”,身为IT行业的企业自身,其实更应该“以身作则”实现高效化、智能化、自动化的IT运维和管理。也许这些“化”真正落地并融入到了IT运维中,对IT职员来说,需要的就不会是夜以继日的加班,而是彰显IT高效智能、开放创新引来的一阵阵惊羡欢呼。
IT运维不应该寄托于长期加班来实现本应有的高效、灵活,在此强调的本意并不在工作职责,而是凸显IT系统在设计、部署、管理、维护方面存在的问题:
IT标准化,顾名思义就是要设计、部署基于标准的IT架构平台。具体表现在采用成熟、可靠的服务器、存储、网络模块,并根据企业自身业务的应用情况,配置和部署不同规格的系统平台。在由贴合用户自身应用场景的各个子系统(包括处理器、内存、磁盘、电源等)组成的平台上,形成一套可经受验证并符合公司统一标准流程的IT平台。IT标准化,能够带来高效、快速并且丰富的解决方案,无论在运维管理还是在升级配置,都能轻易实现预期目标。
大数据时代,是一个更加强调数据价值的时代。IT运维对应的平台,无论出乎何种目的,都是为了支撑某项服务。智能化也就是在不断发展的平台和需求不断提高的双层背景下,成为了未来趋势的价值载体。
另外,IT运维也特别需要引入自动化工作流程。众所周知,IT运维80%的工作量都可通过系统实现自动监测、诊断、修复、报警、通知管理员等工作,其他小部分时间都是可以通过远程异地实现人工干预或者亲临现场进行配件更换等工作。杭州这家高新技术开发公司,既然其业务本身就是高新技术开发,就更应该重视这种自动化运维所发挥的作用了。#p#
此次事件其实更多的凸显IT运维中的安全管理问题。身为运维人员,他是如何取得服务器“生杀”大权的?在拥有服务器root级别权限,对其进行格式化和关闭操作时,报警系统缘何失灵?
一般来说,IT系统运维的主要任务是在确保服务器性能和功能的前提下,提高系统的安全性。而要做到这一点,服务器的访问权限控制策略无疑是其中的一个重要环节。在访问权限控制策略方面,尽量遵循“授予其所需要的最小权限”,也就是给用户提供“刚好够用 ”的访问权限,而不能提供目前不用、未来可用的访问权限。由于本文所关注的这位IT运维人员,其具体职责不明,因此,并不能具体分析其权限的类型和大小。
不过,我们完全可以推导出他在IT运维中的管理员属性。在IT系统中,管理员是泛指,既包括系统管理员,也包括数据库管理员,当然也包括公司IT部门的最高管理员一职,等等。在系统配置、数据备份与还原等不同工作职责范围内,应该有相应的管理员账户。
根据介绍,这位IT运维人员对服务器进行了格式化和关闭操作,这种操作级别在所有的管理员访问权限中是最高一级的,而且通常也需要通过一个流程实现层层报备才可实现。这位男主人公将个人恩怨发泄在服务器身上,将服务器运行的应用和数据内容格式化处理,想必是利用了系统管理中的漏洞,包括root级别访问权限和报警监测系统的漏洞。而这些漏洞,在通常的IT系统运维中,是至关重要、最需要加以避免的。
另外,此次事件也进一步凸显出异地容灾备份的重要性。异地灾备,在金融、电信、能源等领域的重要性尤为重要,每一分每一秒的宕机事故,都会给企业带来沉重的财产损失和难以挽回的良好声誉。对于事件中的高新技术开发公司来说,服务器上跑的应用可能更多的是基于测试、开发、模拟等更贴近实验性的业务,这些业务应用(甚至其中的某些测试结果、数据等)都直接关系到公司产品的开发和推广,进而影响到企业的整体利益。
异地灾备,首先要满足“异地”和“备份”的最基本要求。需要在一定距离以上,甚至可能需要跨区域进行数据备份。其次,可以根据业务应用情况选择定期全局备份或者增量备份。而且,也需要关注系统主机本身的备份。比如该事件中,服务器被强行关闭,即可视作是“主机系统”彻底宕机。在这种情况下,还需要有备份服务器,而这些都应该基于“ 异地”来实现。
在事已至此的情况下,我们只能寄希望于“事先”的“万事俱备”,并希望借此悲剧事件折射出来的管理漏洞,能让其他企业用户加强服务器的管理和IT员工的职责分工,同时也希望更多的IT运维人员了解,服务器不应该成为爱情的陪葬品。
【编辑推荐】
- 专访运维架构师刘鑫:我的运维技术人生
- 微软MVA征文大赛季军孙亮:合格的运维人员是什么样?
- Linux系统运维应用工具的使用和实战
- Linux系统运维的重要原则和方法详解
- 自动化运维在中交兴路的应用
- 企业IT运维人员在变革的云环境下该如何生存?
【责任编辑:黄丹 TEL:(010)68476606】