Travis Morrison 是科罗拉多州柯林斯堡的 New Belgium 啤酒厂(高品质啤酒酿造商,尤以 Fat Tire Ale 啤酒闻名)的高级系统管理员,他对全面网络可见性的强大功能有直接的了解。New Belgium 是一个不小的知名企业,但它肯定不是我们所说的“企业”,它需要能够持续可靠地访问其 IT 基础结构。该公司通过其服务器和工作站处理客户事宜、确保产品交付和管理复杂的生产计划。
不久前,Morrison 一直忙于处理 New Belgium 的一个销售应用程序中反复出现的问题,该应用程序是一个复杂的解决方案,集成了 SQL Server、IIS 和内部批处理功能。
该销售应用程序遇到问题时就会停止运行,经常需要 IT 部门花费一整天的时间恢复其服务。New Belgium 员工无法处理客户事宜。销售团队无法查看销售记录,也找不到提醒客户注意趋势变化所需的数据。显然,这对企业来说不是一件好事。经过一连串痛苦且代价高昂的停工事件后,Morrison 认为,他需要在用户注意到问题之前主动从根本上解决问题。对多个产品进行调研后,他决定使用 System Center Operations Manager 2007 R2。“实际上,这个系统在 24 小时内为我们创造的价值就抵消了它的成本。通过一点帮助,我们在一天之内就完成了启动并运行服务器、在整个网络中安装代理,以及启用寻呼机警报的任务,”Morrison 说。
“就在那天夜里大约凌晨 3 点,我们收到呼叫,结果发现销售应用程序数据库空间不足。原来这就是一直以来存在的问题。不同的是,这一次我们能够关闭 SQL Server,为它提供需要的更多空间,啤酒厂没有付出再次全天停工的代价,”Morrison 这样说,以说明 New Belgium 马上从 Operations Manager 获得了投资回报。
对非企业环境的主动监视
Morrison 的经历特别让人感兴趣的原因如下。New Belgium 并不是典型的 System Center 企业客户。尽管销售人员会出差至全美各地,New Belgium 只在一个地方经营一个啤酒厂。因此,它不是通常意义上的企业 IT 组织,而是更接近中小型企业,具有中小规模需求。不过,从需要高可用 IT 基础结构这一点来说,New Belgium 与典型企业非常相似。它要求接近 100% 的运行时间,以便实现核心服务,如电子邮件、文件服务器和客户数据库。它需要知道问题是何时发生的,最好在用户来电抱怨之前就发现问题。它需要一套全面的监视解决方案,能在其异构(虽然大部分是 Microsoft 产品)IT 环境中正常运行。
Operations Manager 软件包正好能实现适合 Morrison 环境的解决方案。Operations Manager 创建一个平台,用于监视服务器、工作站以及其他终结点(如存储和网络)的系统行为。Operations Manager 基础结构可进行扩展,以满足任何规模的网络的需要。Operations Manager 最大的优点在于,它仅仅是 Microsoft 的 System Center 产品组合中的一个部分。其他部分包括 System Center Configuration Manager(用于配置管理)、System Center Virtual Machine Manager(用于统一虚拟机管理)以及 System Center Data Protection Manager(用于企业质量备份和恢复)。
对于 Morrison 的环境(350 个用户、40 个服务器的规模),在一台服务器上安装 Operations Manager 就能满足性能需要。在环境中同一台服务器或另一台服务器上安装 SQL Server 的一个实例,以存储 Operations Manager 监视数据。其他大多数监视解决方案使用一个中心位置来合并和分析事件日志和系统性能数据,Operations Manager 与这些解决方案大为不同。Operations Manager 通过使用管理包 (MP),在处理这一过程时更进了一步。这些 MP 是 Microsoft 和其他产品供应商为自己的硬件和软件设计的,它们实际上是一些规则集,用于筛选传入的原始数据,以便仅提醒管理员注意他们感兴趣的行为。
请尽快考虑您的 IT 组织需要了解哪些类型的行为。服务器的磁盘存储空间是否不足?事件日志条目是否包含关于发生故障的应用程序的信息?重要服务器的性能是否已降至可接受的阈值以下?在这些行为发生时及时了解情况可帮助您的组织在问题影响到业务之前解决这些问题。
但是,如今的 IT 基础结构极其复杂,对于 IT 团队较小的非企业组织来说,这尤其是个问题。这就意味着,各 IT 专业人员必须精通基础结构涉及的很多技术,而不只是专于少数技术。对于任何 IT 专业人员来说,要查出每个问题的根本原因几乎是不可能的,虽然人们希望这样。
这就是 MP 的真正作用所在。MP,通常由产品开发团队或有过成百上千次成功经验的顾问创建,用于从原始数据中筛选出对管理员而言很重要的行为。通过使用覆盖和阈值,IT 组织可以自定义 MP,以传递它最需要的信息种类。例如,如果不是非常关心处理器使用率是否超过 80%,但希望在使用率达到 95% 时立即获知,则可在 Operations Manager 监视器中自定义一个阈值来实现这一灵敏度。通过设置警报特征覆盖并对各服务器或整个环境应用该覆盖,可以调整针对服务器行为的特定警报。
IT 专业人员甚至可使用 Operations Manager 来监视非 Microsoft 组件,如网络本身。在 Bynet Data Communications Ltd.,通过 Operations Manager 网络集成,量化地反驳了用户抱怨网络太慢这一问题,该公司的管理解决方案专家 Idan Yona 这样说。“我们刚部署好 Operations Manager 安装,它就帮了我们的大忙。我们部署 Operations Manager 是为了一个特定的目标,那就是估计远程办公室用户的网络体验。系统启动之后,我们很快就收集到用于比较总部站点和分支办公室用户体验的网络统计信息。这些数据表明,远程用户认为网络太慢的说法是不正确的,我们因此取消了一项重大的 WAN 升级项目。结果是公司节省了 60,000 多美元,”他说道。
您可以联机获取 Microsoft MP 目录,该目录提供关于每个 MP 支持的监视类型的详细信息。MP 的数量和类型都很多,即使是异构程度最高的组织,也能找到符合其需要的适当集成(即使集成到通常与 Microsoft 没有关联的第三方技术)类型。许多 MP 都可免费下载,另一些 MP 可从其特定供应商处购买。每个 MP 都可向 Operations Manager 基础结构提供一组数据,以便在发生问题时主动发出警报。
要实现完全控制的目标,监视环境只是完成了部分工作。第二项重要功能是以可跟踪、可重复和可预测的方式在服务器和工作站上进行更改。如果组织向用户帮助台安排技术人员来解决软件安装、常见故障排除或补丁管理问题,会发现在小网络扩展时无法成功进行管理。这需要太多手动操作,而无法对大量计算机重复执行。所需要的是一些集中化工具,用于将软件、更新甚至是完整的操作系统同时部署到任何数量的计算机。
Eric Schmidt 是科罗拉多州一个中型国防承包商的高级系统工程师,对于他来说,System Center Configuration Manager 为包含近 2,000 个桌面系统的环境实现了安全性,假如不使用该产品,这种环境不会是安全的,他这样说。
“在使用 [Configuration Manager] 之前,我们尝试了很多不同的修补解决方案,收效各不相同。部分解决方案非常适合修补 Microsoft 产品,但无法部署非 Microsoft 软件的更新。我们的环境中有多个所有者和多个 IT 组织,它们都在同一个网络上。因此,这些解决方案都不适合我们的组织模型。某些解决方案需要大量手动操作,并且没有统一报告功能,这些是最无用的解决方案。我们认为,在最糟糕的情况下,我们只满足了 20% 的补丁需求。情况必须有所改变。”Configuration Manager 通过实现一种自动更新管理基础结构,与公司的多个 IT 团队进行协作,解决了 Schmidt 的问题。“使用 [Configuration Manager] 后,我们能够创建多个计算机集合,每个集合都由一组指定的 IT 管理员进行管理,”他说道。“因为 [Configuration Manager] 与 Windows Server Update Services 进行本机集成,所以每个 IT 团队都能够轻松确定哪些补丁对他们的计算机有用。如果我们发现极重要的更新需要立即部署到所有计算机,只需将它们推送到‘所有计算机’集合即可。”
为此,Configuration Manager 通过所谓的集合创建一个动态计算机组。在其他解决方案中,管理员按计算机名称或其他静态指标创建组,Configuration Manager 有所不同,它根据每台计算机的动态特性创建集合。根据计算机在 IP 子网中的位置创建计算机组和为“安装了 Microsoft Office Word 2007 的所有计算机”创建计算机组一样简单。当某台计算机的特性随时间变化时,管理员可以定期在集合中添加和删除该计算机。这一动态性正是 Configuration Manager 的主要优点。集合是分层的,因此管理员可创建使用更多约束的子集合。在 Schmidt 的案例中,顶级集合与计算机的 IT 团队所有者相关,每个团队都有权在其下创建子集合。
Brita Rood 是华盛顿州贝尔维尤市的 IT 系统分析专家,他也使用 Configuration Manager 对非 Microsoft 产品进行部署。“我们使用 Configuration Manager 的软件分发功能将第三方软件产品推送到计算机。举例来说,手动安装某个产品可能需要一个小时。我们能够使安装自动进行,在一夜之间将它推送到 70 多个客户端。这样节省了时间和大量资金,因为我们不必聘请外部服务供应商来协助安装,”她说。
Configuration Manager 更改管理解决方案是可扩展的,因此它可用于小型环境,也可用于具有数万用户和数百个站点的大型企业环境。无论环境多大,在部署更改时,都采用同样的流程和操作。是否需要将软件或整个操作系统部署到一组计算机?只需使用本机或第三方工具创建安装包,然后将该包注入 Configuration Manager 基础结构即可。通过使用控制台,将部署包与播发和集合进行组合以创建更改事件。此时,集合定义要将包部署到哪些计算机,而播发则确定部署时间表。通过在 Configuration Manager 中使用播发及其关联维护窗口,管理员可将部署只安排在非活动时间段(如下班后)进行。
部署软件之后,要成功进行管理,需要知道软件安装位置,还应知道在软件发生故障时如何排除故障。对于中型 IT 环境,通常在很多被动模式环境中反复试验,并用纸和笔进行记录来了解其硬件和软件清单。将 Configuration Manager 的清单功能与软件计数和资产智能功能配合使用,几乎可以使这一过程完全自动进行。
现在的许多工具都可询问服务器和工作站以确定其硬件和软件构成。虽然有用,但这些信息只是一种静态表示形式。Configuration Manager 的软件计数功能还可以确定实际上哪些用户和计算机在使用已安装的软件。通过软件计数,IT 组织可以找到未使用的软件许可证,回收这些许可证以供其他人使用,而不是再去购买许可证。通过将此功能与 Configuration Manager 的内置资产智能数据库相集成,IT 组织可将已安装软件的各特性与特定产品、版本号和版本相匹配。结果就形成了一个可用的报告引擎,用于准确确定所管理的所有计算机上安装了哪些类型的软件。
使用这些功能,贝尔维尤市快速“校准”其许可情况,避免了浪费未使用的许可证,Rood 这样说。“通过使用资产智能和软件计数实现的报告功能可以帮助我们确定特定软件(尤其是第三方软件)的使用情况,以确定我们对许可证的需要。”
很多组织还使用 Configuration Manager 将整个操作系统部署到所管理的工作站。对于想迁移到现代 Microsoft 操作系统的很多组织来说,这项复杂且通常耗资巨大的活动可能是很大的障碍。如此复杂的原因在于部署本身。传统的升级操作需要技术人员逐个处理工作站,他们通常使用映像软件或基于脚本的解决方案。无论哪种方式,旧系统安装中的用户数据,都不会保存到新安装的系统。因此,技术人员必须与用户协作,以确保完整正确地迁移用户的特定设置(如果是工作站,则为“个人设置”)。
Configuration Manager 的操作系统部署 (OSD) 功能内置于基本产品中,为操作系统的管理部署提供了全面的方法。管理员可使用 OSD 创建 Windows 操作系统的常规安装,这种安装差不多可以安装在任何桌面计算机、便携式计算机或服务器上。使用每个现代 Windows 操作系统提供的内置即插即用组件,设备驱动程序可专门面向每一类硬件。
设备驱动程序只是操作系统部署的一部分。如前所述,升级操作系统或刷新损坏的工作站时,维护用户的个人信息也非常重要。Configuration Manager 的 OSD 功能可以在计算机刷新之前自动卸载用户设置。操作系统安装完成后,会重新应用这些用户设置。从用户角度看来,最终的操作系统看起来与“旧”操作系统实例很相似,用户可以很快继续工作。
Cleber Marques 是圣保罗的 2S Inovações Tecnológicas 的技术顾问,他说,他已多次使用这一级别的自动化技术。“通过使用 Configuration Manager,我们的客户可将 Windows Vista 分发到他们全部 1,000 台或更多桌面计算机上,几天之内完全可以与总部办公室协调一致,”他说。
自动化虚拟管理
Operations Manager 和 Configuration Manager 适用于物理服务器领域,现在很多 IT 组织也需要处理虚拟服务器问题。目前,虚拟化似乎无处不在,任何规模的环境都盛行从物理计算机转向虚拟机。早期采用虚拟化的企业在虚拟平台上并无太多选择,但现在,对虚拟化的兴趣剧增,可选的虚拟平台相应也增多了。您可能认为,说到虚拟机监控程序提供的功能集本身,平台供应商的虚拟之战难分高下。现在,最激烈的竞争还是用于帮助管理虚拟基础结构的工具。
因此,Microsoft 选择在其虚拟管理解决方案 System Center Virtual Machine Manager (VMM) 中采用多平台方法。使用 VMM,环境不限于只管理单个虚拟机监控程序之上的虚拟机。IT 管理员可在同一个控制台屏幕中管理由 Microsoft Hyper-V、VMware 的 ESX 和 vCenter 产品组成的虚拟基础结构。
这意味着,早期使用 VMware 产品转向虚拟化的环境也可在同一个 VMM 管理控制台中轻松管理 Hyper-V 基础结构。连接 Hyper-V 和 ESX 主机时的控制台视图。可以看到,这两个虚拟机监控程序显示“主机组”时并无差别。在 VMM 中,管理员调用操作时无需考虑基础虚拟平台。
本机 Windows 故障转移群集可为混合环境实现高可用性。该功能是为参与集群的虚拟服务器提供的独立 Hyper-V 组件。通过集群,在发生问题时,多个 Hyper-V 主机的 VM 可以向备用主机执行故障转移。如果尚未在一些操作系统版本中使用过 Windows 故障转移群集,现在就该进行了解了。由于对安装和管理进行了改进,在环境中设置好集群后就无需再关注它。
Windows 故障转移群集和 VMM 都不是管理 Hyper-V VM 所必需的。使用它们只是为了使管理更为容易,尤其是在 Hyper-V 主机数量增加时。通过 VMM,可将 Hyper-V 主机及其 VM 作为单元进行管理,可对一个主机或 VM 执行操作,也可同时对所有主机及其 VM 执行操作。实际上,对于虚拟环境,VMM 提供支持的自动化类型与 Configuration Manager 和 Operations Manager 对单独的服务器实例提供的自动化类型相同。
Tim Clauson 是俄勒冈州罗斯堡市的 IT 经理,他说很早以前,在尝试另一个解决方案但最终未能成功之后,就很欣赏 VMM 的灵活性。“在两周的 [现场] 工作后,[另一个虚拟平台供应商] 的两个顾问仍不能使任何虚拟机成功启动。我们最后请他们打道回府,转而关注 Hyper-V 和 VMM。实际上,六小时之后,我们就启动并运行了我们的第一批虚拟机。作为本市仅有的两名 IT 工作人员之一,我不得不成为技术通才但不精通任何门类。VMM 不难理解,还易于使用,”他说。
事实证明,即使是在 Beta 版本中,VMM 的内置“物理到虚拟”(P2V) 功能也极为有用,Clauson 说。“我们喜欢 VMM 的 P2V 功能,它用起来太完美了。我们希望及早采用这项技术。所以我们使用了 VMM Beta 版本的 P2V 功能将 Exchange 2007 生产服务器虚拟化到 Hyper-V 上。首次 P2V 非常成功,从那时起,我们就在 Hyper-V 上运行邮件服务了,”他补充说。
Clauson 说,自从第一次安装后,他已成功将该市的 SQL Server 和其他服务虚拟化到 Hyper-V 和获得完全许可的 VMM 实例上。此外,既然省下了原计划购买其他虚拟化技术的资金,他可以将这些资金用到真正需要的项目上。对于弥补税收缺口、降低城市预算而言,这很有好处,他补充说。
面向非企业环境的企业备份功能
IT 组织尚未广泛使用的第四个 System Center 解决方案是 Data Protection Manager (DPM)。该产品相对较新,最近刚发布了重要的 R2 版,它提供一个平台来备份整个 IT 环境中的服务器和桌面计算机。DPM 与其他 Microsoft 和 System Center 产品集成,还可灵活地将服务器数据备份到磁盘和磁带,这是它胜过其他备份解决方案的地方。
DPM 侧重于磁盘到磁盘的备份,这对非企业环境尤其有用,在这种环境中,使用支持机器人的大规模磁带阵列太过昂贵,也没有必要。现在,磁盘驱动器的成本每天都在急剧下降,将重要服务器备份到磁盘而不是磁带有很多独特的优势,包括可以直接从磁盘备份快速恢复单独的文件或整个服务器。
通过与 Microsoft 和第三方应用程序(如 Exchange Server、SQL Server 或 SharePoint Server 等)的持续数据保护集成,DPM 几乎可实时保护数据以免损坏或被删除。IT 经理可设置短期和长期的数据保护目标,可根据需要启用多个数据保护目标。此外,因为 DPM 是 System Center 系列的一员,所以管理员可在本机通过 Operations Manager 监视其行为。
虽然磁盘到磁盘的备份似乎有利于快速恢复,但是大多数组织需要将数据归档到非现场存储。通常,这意味着将磁带转到非现场存储设备。DPM 支持磁盘到磁盘、再到磁带介质的备份,改变了此工作流程。
“出于性能考虑,很多人使用 DPM 创建磁盘到磁盘再到磁带的体系结构。这样,可以立即从磁盘备份恢复丢失的文件,因为这些文件在备份磁盘中直接可用,”Conrad 说。“这就不必再费力查找并装入正确的磁带了。如果需要长期非现场存储数据,可通过 DPM 自动执行磁盘到磁带的备份,将数据复制到磁带以用于其他目的。这种多步骤方法消除了纯磁带解决方案中常见的性能瓶颈。”
适当的可见性和控制能力
System Center 的这四个主要组件提供监视、配置控制、虚拟平台管理和备份支持,真正满足几乎所有 IT 操作的需要。尽管 System Center 侧重于在大型企业环境中使用,该产品仍然适用于在行业中占重要比重的中型企业。如果贵组织希望成为反应迅速的 IT 组织,能在问题发生之时处理问题,在用户来电抱怨之时查明问题,请考虑使用 Microsoft 的 System Center 解决方案,实现完全的可见性和控制能力。
Greg Shields 是一位 MVP,也是 Concentrated Technology 的合伙人。ConcentratedTech.com 提供 Greg 的“万事通”提示和技巧。
文章来源:微软TechNet中文网
【编辑推荐】