泛达实验室持续针对数据中心关键领域进行广泛研究。这些领域包括网络和基础设施/有效的服务器和储存配置。通过研究泛达可以为市场提供全面的数据中心解决方案,无论是财务 .医疗市场还是政府和教育市场。本白皮书将说明为您的业务构建可靠数据中心基础设施所需考虑的各个事项。
导言
数据中心是业务的核心,日益增加的传输速度和活动数据中心设备密度不断给物理层提出更高要求。企业网络所储存的和移动的数据量正大幅增加。部署在数据中心用于处理这些工作的高密度刀片服务器和储存设备的能源消耗和热量产生也在加速增长。
运用强大的综合基础设施来处理这些需求并支持未来数据中心的扩展此时比以往任何时候都要重要。本白皮书将展示如何平衡能源、冷却和布线结构实用性与业务优先性来构建一个综合全面的数据中心支持系统。“容量规划”流程通过保证性能的稳定和灵活来优化网络投资,以适应将来的业务和技术需求。
优先事宜
基于泛达实验室对于数据中心的研究,下列是在构建和升级数据中心战略规划中重复出现的问题。因此,设备和 IT经理应该在数据中心项目过程中自始至终地时刻牢记这些问题:
•容量规划: 决定数据中心设计和未来能源、冷却空间和空间管理的增长。这些问题的考虑被统称为“容量规划”。如能有效地对这些核心资源进行部署和管理,则数据中心就能够高效运行,并按照要求进行扩展。
•可靠性: 可靠的基础设施由充足的能源和冷却空间、有效的系统组件接线和接地以及保护、安排和管理布线结构的路径组成。通过由优质部件和材料组成的强大系统,您可以将网络中断可能性降至最低,且运行时间和业务连续性达到最大化。
•预算: 数据中心运营所产生的巨大成本在今天竞争激烈的商业社会中是无法回避的一个问题。设备经理承担每年数据中心大部分运营成本的责任。如何有效部署基础设施资源关系到每年成本节省和降低总拥有成本( TCO)。
•美观: 传统上,设备经理只会考虑“它放在了正确的位置上吗?它能正常运行吗?”。但是数据中心是一笔很大的财务投资,不仅包括功能也包括外形。今天的数据中心已成为了向客户展示公司视觉形象的区域。因此,设备经理希望基础设施能拥有体现高度职业化的外观。
开发数据中心设施解决方案
数据中心规划可想象成一个需要多个业务团队相互合作的地方。事实上,它要求业务、 IT和设施管理团队的紧密合作来制定出一个综合解决方案。了解这些规划中的联系可以帮助您将业务要求转换为实际的数据中心设施解决方案。
业务规划与设施规划
数据中心的一般寿命为 10-15年。如进行日常维护,则基础设施和线缆都能达到这一寿命。而常用设备一般在 3-5年中进行更新,因此基础设施必须至少规划三代 IT设备的供电、冷却和支持。
所有这些数据中心规划决定都最终取决于业务要求。从实际层面上来说,这些要求直接影响公司所采用的应用设备种类和服务等级协议 (SLAs)。
核心设施性能标准中有一项是运营时间,这一般由 SLA决定。当确定运营时间要求和支持应用的运行设备时,则可以预测支持带宽、电源和冷却负载,并且数据中心所占空间的大小也能够确定。图 1显示数据中心相关人员合作制定综合设施解决方案的流程。
图1. 数据中心解决方案所涉及的多方人员
#p#
数据中心各等级
设施规划同样涉及定义数据中心各等级标准。 TIA-942 Annex G根据站点基础设施等级将数据中心分成 1至 4等级来维持特定运营时间长短所需的。尽管该标准是根据报告对各等级模型进行分类(如非强制性),但将运营时间目标与数据中心基础设施冗余等级相连已成为了标准的等级划分方法。
单点故障被消除时,系统级别上升。达到第二级标准的数据中心含有至少一套完整的冗余容量元件(如 N+1容量),如不间断电力系统(UPS)单元和冷却制冷装置。第三级数据中心将冗余容量分配至多个路径,包括电源和冷却部件,第四级系统将故障容差延伸到所有支持 IT运营的系统。系统级别会影响到数据中心所占空间,由于单点故障被消除,更多的设施设备将支持冗余容积和分配。必须指出的是,数据中心本身的级别根据影响站点运营的最低子系统级别而定。比如,第二级数据中心可向上升级为双重动力计算机硬件和第三级电路来增强运营时间。然而,该数据中心的等级仍是第二级。
相关标准 (TIA-942)
设施规划流程现有多本出版材料可供参考。《数据中心电信基础设施标准》 (TIA¬942)是其中最为全面的一本。该标准明确了电信和基础设施的最低要求,并建立了这些部件的连接和访问的构造。除此之外,该标准还介绍了如何达成结构、机械和电气设计各因素之间达成可控的平衡。其他已出版了设施规划材料的机构包括: BICSI, Uptime Institute和American Society of Heating,Refrigerating and Air-Conditioning Engineers (ASHRAE)。
为今天和明天升级电源
电源系统是基础设施中的关键部件,它要不断为现在供应电能并符合未来增长的电能需求。不断增加的高密度计算机环境同时极快地提高了电能的消耗(和运营成本)。最近的一次预测表明服务器所使用的总电能(美国和全世界)在 2000年至 2005年 1月翻了一倍。当今数据中心供电所面临的重大挑战为:
1. 符合当今数据中心电力要求
2. 部署稳定系统来满足运营时间要求
3. 保证灵活性,满足未来电力要求
4. 成本降至最低
满足现今电力需求
数据中心电力使用由 IT负荷(主要为服务器)和设施负荷(主要为冷却设备)组成。北美数据中心使用 AC电源,将公共电压 480V降至 208或 120V(美国)供设施分配。电源的可用性和价格以及不动产成本在美国各州都是不同的。达成这些因素间的最佳平衡将帮助相关人员为数据中心确定位置并供应电力。欲预估您的数据中心电力负载,请参考泛达白皮书“数据中心设施考虑事项”中的工作表。
图 2. 数据中心电源系统结构实
数据中心电力分配系统一般包括发电机、不间断电源(UPS)系统、蓄电池、转换开关、浪涌电压吸收器、变压器、断流器、电力分配装置( PDUs)和电源插座装置(POUs)(见图 2)。传统的 POUs包括配电盘、插头盘和 PDUs。UPS系统配有蓄电池储存电能,以保证运行的数据中心设备不会受到电源中断或电源线故障的过度影响。POUs部署在机架和机柜内将电力分配至运行设备。无论是模块电源系统还是固定容量电源系统都能够帮助设备经理能将每平方空间的数据中心电力输送增至最大。这些电源系统可以轻松升级,并适应不断变化的电源要求,也可在必要时以低容量运行以节省能源。而且,使用标准化、热插拔并且用户自行维护的模块式电源系统可减少平均修复时间( MTTR)长度以提高可靠性。然而,模块式电源系统需沿着运行设备一边的机架进行部署;该系统会占据较大的机架空间,并且大幅增加冷却负荷。而固定容量系统一般是中等和大型数据中心的首选,它是独立的电源装置,可节约空间。
设备经理与 IT经理合作使用运行设备节能技术。一般的节能技术包括部署节能服务器和高效电源、整合并虚拟化服务器以及排除不运行的服务器。同样,美国 EPA正在制定企业服务器的新产品标准,并已向国会递交了数据中心和服务器能源效益的草案报告。
部署可靠的电源基础设施
为数据中心配备可靠的电源十分昂贵,但毫无疑问您还必须承担额外的成本来满足业务需求和网络运营时间目标。许多因素都将影响系统的可用性,包括人为失误、组件可靠性、冗余、维护计划和恢复时间。带错误校正功能(如模块、智能和 /或可插拔式)和单点故障降低(如旁路功能)的电源系统可通过精简维护任务并尽可能减少计划外停机时间来提高系统可用性。
电源系统拥有许多冗余以满足 N+1可靠性要求,包括电源转化、并行控制、静电转换开关和旁路连接。 PDUs经常连接至冗余 UPS装置以达到更高的可用性,以防止单台 UPS出现故障或需要进行维修。除了 UPS冗余,服务器电源自身也拥有冗余,每一个服务器盒中都有 2个甚至 3个电源,能够在一部或多部电源故障的情况下为服务器供电。
通过额外电力容量保证未来运行
设备经理和其他数据中心相关人员一般都会在一开始就建立最大预计容量来保证未来的运行。设备经理与 IT经理一起确定现今和设备寿命周期(如 2至 3次设备更新)内运行和冷却设备所需的电量来预计负荷。如果下一代交换机和服务器的电源消耗超过了室内电源设备的容量,则经理有必要使用模块式电源结构阶段性地部署额外的容量。
二级设备系统
数据中心其他部件由数个设备系统支持。这些重要的二级系统包括制冷水、接合和接地系统以及架空活动地板。它们都应根据数据中心寿命周期来决定尺寸,因为这些系统并不是模块式或阶段性的部署。
#p#
架空活动地板
架空活动地板的安装经常用来布置冷却用空气和管理数据中心接线,并使房间变得美观。二级系统主体(如管道、线缆、电源线)应安全部署在架空活动地板下,以最大程度地利用上方空间来布线和移动、增加及改变( MACs)运行设备.所有数据中心相关人员应协力保证不同的地板下基础设施部件可沿着预先设计的路径顺利整合。当部署架空活动地板时,应慎重考虑其高度、预期负荷要求以及抗震要求。现今的趋势及最佳实践表明架空地板为 24-36英寸的架空活动地板能保证足够的冷却空间(见图 3)。如站点的架空活动地板高度不够,则会造成空气流通不足,并且之后很难再达成空气流动的平衡。
图3. 架空活动地板和底座实例
除此之外,架空活动地板制造商应提供符合天花板和室内系统建筑协会(CISCA’s)”架空活动地板推荐测试程序”认证的地板机械强度数据,以确定该地板符合数据中心设计要求。
接地和接合系统
当架空活动地板放置好后,安装接合和接地系统。正确的接地和接合对于数据中心运行效率十分重要。接地系统是可将设备运行时间最大化、维护系统性能并保护人员安全的活动功能网络。
接地与接合系统的主要目的是为电涌和瞬变电压创建稳健的路径来将其导入原有电力系统或地下。电涌和瞬变电压一般是由闪电、电路故障、电路转换(马达开和关)、浪涌保护装置( SPD)激活和静电释放( ESD)引起的。有效的接地和接合系统可以将这些事故的不利影响降至最低甚至消除。
图 4 接合及接地系统实例
根据 TIA-942, J-STD-607-A-2002和 IEEE 1100(绿宝书)标准 ,正确的接地系统设计如图 4所示,并具有以下特征:
1. 连接明确: 每一个连接都必须正确设计,因为接地系统的可靠性取决于其中最薄弱的连接
2. 可通过视觉检查确认
3. 空间足够处理故障电路
4. 阻断损坏电路流向敏感的电子设备
5. 所有数据中心金属部件与接地系统相连(如设备架、机柜、梯架、外壳、线缆槽、水管、导管、建筑钢等)。
6. 保证机架和机柜构件的电路连续性。
7. 提供静电释放( ESD)保护带的接地路径。
除了符合上述标准外,所有接地和接合部件应列出国家认证的测试实验室(如美国保险商实验室公司 UL) 并且必须符合所有当地电气法规。泛达 STRUCTUREDGROUND™系统为数据中心提供强有力的接地连接。其电阻低、易于安装且每年的检查十分方便。
制冷水管
如果制冷水回路要求提供冷却,则需要规划制冷水管。该系统应在数据中心构建流程早期部署以保证管道被正确放置并在必要时进行调整。如果一个设备需要水循环提供额外的冷却,建筑制冷水供应须可以使用。地板上的空间应留给冷却液分配装置(CDU),CDU是建筑制冷水和设备水循环的控制界面。地下空间应能够容纳将水从 CDU传输到冷却设备的软管。
标识系统
基础设施应正确标识和记录以使经理能够快速查找所有电信和设施部件,减少维护窗口并优化 MACs时间。 TIA-942建议数据中心的识别应从架空活动地板开始。每一块 2英尺*2英尺的架空活动地板都应标上数字字母网格标识符,从而构成横排的字母系统(AA, AB, AC, 等)和竖排的数字系统( 01, 02, 03,等),通过特定位置(如机架位于 AB03架空活动地板)用来查找数据中心部件。网格标识符范围置于计算机打印不干胶标签或刻印标志牌等。
全面的标识策略应包括:布线基础设施标签(线缆、面板、机架、机柜和路径);运行设备标签(交换机、服务器、储存器);冷却管道标签,电气标签和接地系统标签;地面网格标识,电压标识、防火设备和其他安全标志。
TIA/EIA-606-A是布线标志和管理的标准, TIA-942附录 B为数据中心提供了补充意见。“TIA/EIA-606-A标识规定”讨论了如何运用基于标准的标识解决方案。
#p#
数据中心冷却和空气流通
冷却系统对于数据中心可靠性和总拥有成本( TCO)十分重要。每一件设备都很会因热量而导致运行时间的缩短和成本的上升并且需要保养、维修或更换。冷却系统应包括计算机室空调( CRAC)和计算机室空气处理( CRAH)装置、制冷机、冷却塔、冷凝机、通风管、泵组、管道和备用机架或天花板冷却和空气流通设备。
基于 Uptime Institute所收集的数据,冷却系统的电力消耗预计约相当于运行设备的电力消耗 2。因此,冷却系统要求精密的设计和频繁的检查以合理的成本来保持其性能符合要求。请参考泛达白皮书“数据中心设备考虑事项”工作表预测您的数据中心冷却负荷。
热通道/冷通道布局
数据中心冷空气通过策略性的 CRAC装置布局和物理层部件进行流动。各行设备的热通道/冷通道布局可以参照 TIA-942和 ASHRAE的“数据处理环境导热指南”。在这一布局中,CRAC装置将冷空气分散至架空活动地板下方,通过预先放置的开孔架空活动地板进入房间。
运行设备面向冷通道放置,设备风扇使冷空气通过机架和机柜并且将废气排入后方的热通道(见图 5)。
孔面积占 25%的开孔架空活动地板和每分钟 150-200立方英尺(cfm)的空气流通率大约可排出 1kw的热量。对于更大的负荷或运行设备热负荷的增加超过了数据中心生命周期内的预计,可采取多种方法扩大冷却容量,包括增加架空活动地板开孔面积(从 25%至 60%)、将漏气量降至最低、增加额外的 CRAC容量等。同时,补充性冷却装置如制冷水机架和天花板空调 /风扇也可在增加或更新运行设备时进行部署。
图 5. 热通道/冷通道布局中的线槽放置
旁路空气最少化达到冷却最大化
冷气有时会绕过欲进行冷却的设备,而直接进入热通道。行业数据显示开孔架空活动地板和 CRAC/CRAH不正确的放置以及机架和机柜下的架空活动地板切断了地下布线空间,从而产生了旁路气流,导致 60%的可用冷却容量被浪费。
计算机流体力学( CFD)软件是分析通过数据中心气流的有效工具。基本的 CFD程序可创建通过开孔架空活动地板的气流路径并计算气流速度和温度,因此设备经理可以看到设备机柜是否拥有的足够的冷空气。最新的 CFD程序可对地板温度的分配和空间进行建模。
减少空气旁路的策略(因而通过防止运行设备过热增加运行时间)包括在不用的机架空间安装空面板和使用空气密封设备对活动架空活动地板的线缆线路进行密封。这些策略可以促进气流沿着预定路线流动,同时保证地下线缆能够进行更换。并且,空气密封索环可在线缆经过架空活动地板锋利边缘时为线缆提供磨损保护和从线缆到地板的静电释放导电路径。如此一来,导热保护管理就能大幅节约成本。
布线的潜在影响
结构化布线系统可在数据中心 10-15年生命周期内进行更新及更换。有效的线缆管理被认为是数据中心网络基础设施可靠性的关键。然而,布线与设施系统之间的关系常被忽略。这主要在于结构化布线系统应沿着设施系统路径进行成功部署。有效的线缆路径可保护线缆以达到最大网络运行时间并且展现您对数据中心的投资成果。
计算路径尺寸和成本
数据中心路径的主要价值在于为密集线缆环境中的结构化布线基础设施提供了功能性和保护性的空间。可更换的通用路径能适应数据中心的发展和变更,并且保护线缆免受物理损伤。设计良好的线缆路径也能增加您数据中心的视觉冲击。对于线缆数量和容量的精确估计以明确路径尺寸是容量规划中的关键。最初的部署应在 25-40%以留下未来扩展的空间。50-60%的部署率将会填满整个路径,这是因为线缆之间存在空隙及随意的放置。泛达网上部署计算工具将帮助您在明确线缆数量和直径时确定所需的路径尺寸。线缆路径系统的 TCO同样必须在作出最终采购决定之前予以确定。安装、维修、可进入性和物理保护和安全成本都应作为 TCO的一部分予以考虑。降低拥有成本的措施包括:
•需要使用工具最少的组合部件
•可轻松更换并提供线缆保护的挂盖
•弯曲半径控制和平滑边缘保证线缆性能
•整合接地 /接合系统
#p#
线缆路径设计
数据中心的多样性和密集性意味着在规划线缆路径时“没有一个方案可以通用”。设计师通常会制定多个路径方案的组合。设计师可选择多种类型和尺寸的钢丝笼、梯架、 J形钩、管道、固体金属托盘和光缆布线系统。房间高度、设备线缆进入口、机架和机柜密度以及线缆种类、数量和直径也是决定路径设计的因素。
使用上走线光纤布线系统来部署水平光缆,并且使用地下金属网格式桥架安放水平的铜缆和主干光缆也是一项有效的路径策略。这一策略有以下几项优势:
•上走线和地下的布线组合保证了铜缆和光缆的隔离,符合 TIA-942的建议。
•上走线系统如泛达 PANDUIT® FIBERRUNNER® 系统,可在一个牢固密闭的通道中保护光纤接件、带状互连线和多芯光纤,并且具备弯曲半径控制,该路径位置不会干扰架空活动地板的冷却功能 (见图 6)。
•地下路径可隐藏最庞大的布线;同时,铜缆的捆扎可松散一些以节省安装成本,每一个地下路径能服务两排设备。
•整体视觉效果错落有序,稳健牢固,令人印象深刻。
图 6. 上走线线缆路径系统实例
地下布线路径应辅助热通道 /冷通道布局保持冷空气的流动。 TIA/EIA-942和-569¬B注明线缆槽的空间最大填充比例应为 50%,内部深度最大为 5英尺(150毫米)。 TIA-942进一步建议数据线缆的线缆槽悬置在热通道下的地面上,同时电力分配线缆应置于架空活动地板下或平板之上的冷通道内。
这一地下路径策略的优势在于:
•电源线和数据双绞线能尽可能地分开放置(如 6-18英尺)以使线缆之间的纵向耦合(如干扰)降至最低。
•铜缆和光缆路径悬置与热通道之下,朝着大部分服务器端口
•线缆路径不会阻挡气流由开孔架空活动地板进入冷通道。
线缆捆绑和路径
当线缆路径设置好后,应开始将线缆放置在路径中。线缆捆绑策略可将电缆有效整齐地放置在路径中,并保持运行的灵活性来进行频繁的 MACs同时不会阻碍空气。根据 TIA/EIA-568-B.1 10.1.1节和 GR-1275-CORE 13.14节,这一策略包括线缆扎带的使用、保护和管理高性能铜缆和光缆的路径配件以保证网络的完整性。线缆束带和配件必须运行安全,不带有可能切断或磨损线缆的尖锐末端及边缘。根据国家电气规程 (NEC)300-22 (C)和(D)节规定,Plenum认证的线缆束带设计可用于空气处理空间的线缆捆绑,如天花板空间和地下区域。在高密度数据中心布线环境中(见图 7),有多种有效的线缆捆绑解决方案。比如泛达粘扣式电缆扎带可用于上走线区域和机架机柜内的线缆捆绑,并且根据 NEC规范(美国国家电气规范)可用于空气处理空间。它可以进行调节、释放、能重复使用并且十分柔软,使安装着可以美观快捷地部署线缆束。
泛达线缆机架间隔装置是用于梯架的一个可叠放线缆管理配件,它保证适当的线缆弯曲半径,将线缆束内的压力降至最低。同时,当线缆从梯架或管道转移至下方的机柜和机架时,泛达瀑布型配件提供弯曲半径控制。
带粘扣式电缆扎带的网格式桥架带可叠放式线缆机架间隔装置和瀑布式配件的梯架
图7. 线缆捆绑策略实例 机柜和机架实
#p#
现被动式冷却解决方案
下一代的服务器和交换机(如刀片服务器技术)正不断增加数据中心设备和布线的密度。这也增加了热负荷,给传统的冷却系统带来了挑战。机架和机柜硬件的策略性部署无论是在现在还是在数据中心整个生命周期中都能大幅提高数据中心冷却效率。
服务器和交换机柜中未使用的空间可能会引起两个问题——热废气循环与冷空气旁路。设备所排出的热废气可能会再循环并回到设备吸气口,这将快速引起设备过热,并降低系统运行时间。冷空气可能绕过吸气口,这会降低系统效率并增加成本。
泛达的机柜、机架以及线缆管理解决方案带来卓越的线缆和设备管理,同时增强空气流通,造就专业的数据中心形象。NET-ACCESS™机柜的被动式冷却功能通过在高密度的交换机环境中加速空气流动优化导热性能。排气扇将空气从设备一端流动至另一端。垂直机柜空间中的管道直接将废气导入热管道,减少热空气的再循环(见图 8)。
被动式冷却解决方案组合同样有效地排除热量并将空气导入服务器区域。这些区域中更多的是电源线,而数据线较少,其密度低于交换机区域。在垂直和水平空间中应放置填充板防止冷空气旁路和暖空气在机箱和设备中的再循环。宽机柜的使用和有效的线缆管理通过保持服务器排气区域的畅通防止机柜后部的静压力。同时,门孔应保证最大的冷气流进入设备进气口。机架和机柜的部署应遵守 TIA/EIA-310-D标准。
图8. 泛达NET-ACCESS™ 机柜促进被动式冷却
总结
下一代的数据中心运行设备将比以往耗费更多的电力,产生更多的热量并且传送更大容量的信息。必要的电力和冷却系统必须与结构式布线紧密结合,组成一个综合基础设施来满足日益增长的运营时间需求和多种设备更新。
成功地规划这些系统的容量是一个需要所有数据中心相关人员齐心协力才能达成的过程。特别是设备经理处于一个特殊位置,需要检查整体数据中心规划蓝图来确定电力、冷却、接地、线缆路径和部署策略,以达成最低的 TCO。设备经理、 IT经理和高层之间的交流将保证业务需求与电力、冷却和布线实用性之间的平衡,最终创建一个强大、稳定且美观的数据中心。
参考书目
1. Koomey, Jonathan G. 2007. “Estimating Total Power Consumption by Servers in the U.S. and the World.” 最终报告 2月 15日摘自 :http://enterprise.amd.com/Downloads/svrpwrusecompletefinal.pdf
2. Brill, Kenneth G. 2007. “Data Center Energy Efficiency and Productivity.” The Uptime Institute: Santa Fe, NM. 摘自: http://www.upsite.com/cgi-bin/admin/admin.pl?admin=view_whitepapers.