数据中心核心交换机业界动态
核心交换机是数据中心网络最为关键的节点。随着云计算、虚拟化和大数据等趋势逐渐走俏,数据中心网络的建设也出现新的变化。因为企业需要不断面对IT系统日益复杂、设备数量日益增多,数据大集中和计算能力走高的诸多挑战。核心交换机面临很大的数据交换压力,由此也推动了核心交换机技术在近几年的跨越式发展,关于技术标准、性能、架构、大二层网络构建、虚拟机网络策略迁移、SDN的讨论,更是呈现百家争鸣的态势。在这期间,万兆技术标准成为主流,40G、100G逐渐走向商用;Spine-Leaf架构已经赢得共识;SDN、NFV还未尘埃落定。每年我们都能看到技术标准博弈的不断演进,性能不断超越的惊艳,数据中心网络市场走向繁荣的步伐,以及各家战略、策略和产品的角力。
从2008年开始,业界主流的网络设备供应商“你争我赶”的推出了自己的数据中心核心交换机产品。迄今为止,4家在数据中心网络市场举足轻重的供应商,思科、华为、H3C和Arista先后推出了新一代数据中心核心交换机产品,分别是Nexus 7700系列、CloudEngine 12800系列、H3C S12500-X系列、Arista 7500E系列。与上一代各家的数据中心核心交换机产品,华为S9700、思科N7000、H3C S12500、ARISTA 7500相比较,这4大系列产品在硬件架构、性能、功能等各方面都有了质的飞跃,共同站在了目前核心交换机产品的最前端。同时,数据中心网络市场所酝酿的火药味越来越浓,所涉及的话题,已不是局限于谈谈趋势,聊聊技术标准那么简单,因为真正决定客户选择的,是技术、创新、质量和服务等硬条件。
在各大企事业的招标设备技术规格要求中,核心交换机的性能、通风散热、系统可扩展性要求首当其冲:
在性能要求方面,要求核心交换机能够支持足够大的交换容量,在业务槽位数、单板带宽等方面也有具体的要求;
在通风散热方面,要求核心交换机遵循数据中心机房前进风、后出风的严格散热风道建设规范,以保证在长期高速运行下的可靠性;
在系统可扩展性方面要求核心交换机具有持续的带宽升级能力以及相匹配的散热方面的扩展能力,从而保护其在数据中心方面的投资。
如果单从性能上看,思科、华为等四家的核心交换机似乎没有太多的区别,不论在线卡、整体交换容量等方面都可以满足客户网络建设的需求,甚至还可保证未来5-10年的扩展性需求。但如果我们深入到产品内部,看一看各家核心交换机内部的实现,就会发现各家在基础架构的散热风道、冷热风道隔离、带宽扩展性等实现方面存在细节上的不同,那么给用户所带来的价值也就不同。
正交架构下的散热通道设计理念
正交架构已经成为数据中心核心交换机设计的共识,上述4大系列产品都不约而同的选择了正交架构。正交架构可将背板高速链路走线长度有效降低,以获得更加理想的误码率,从而在性能方面有了很大的提升。
但正交架构带来性能优势的同时,也带来散热设计的难度。因为在正交架构中,线卡与网板垂直对插,整个机框通过背板被分隔成两个独立的空间,散热时两个空间需要绝对隔离,并都保持前进后出的风道,这对散热设计带来了挑战。而交换机遵循数据中心机房的前进风、后出风的散热通道标准是国际数据中心通行做法,更是各大企事业标书明确提到的指标要求。如何实现在正交架构下做到冷热风道隔离,并适配数据中心机房的前进风、后出风的散热通道的设计,是对各家设备供应商的基础架构设计能力的考验。
为了更好的落地正交基础架构的设计理念,这4大系列产品在实现细节和技术上都采用了不同的做法。主要包括三大类:1)直通风前后风道/级联风道解决方案,思科Nexus 7700系列和Arista 7500E系列采用这样的做法;2)直通风前后风道/区域独立散热风道,华为CloudEngine 12800系列所采用的专利方案;3)直通风Z型散热风道/横向散热通道混合使用,H3C S12510-X和S12516-X分别采用了不同的散热通道做法。接下来让我们详细了解下4款系列产品,采用不同设计理念下的差异。
直通风前后风道/级联风道
Nexus7700系列是思科最新一代的数据中心核心交换机产品,采用正交架构设计,为了遵循严格的前进风、后出风的散热风道,思科大胆的采用了直通风/级联风道的散热方案,即直接在线卡面板上开孔进风,在背板上打孔,风流直接穿过背板到达网板,网板的面板上开孔,风扇框安装在机箱的后面,进行抽风散热。同时,风扇系统可根据设备温度自动调速,允许风扇系统热插拔。当网板故障时,要拔出风扇框更换网板,但严格要求用户在3分钟内更换完网板,以免风扇停止散热后造成系统掉电。而这样的直通风设计,使得线卡散热和网板的散热风道并未隔离,交换网板始终处于高温工作状态,不得不面对级联风道热积累效应带来的可靠性问题。
Arista 7500E也采用了直通风/级联风道的散热方案,但设计上更加大胆,直接将风扇集成在了交换网板上,而风扇属于机械容易损坏部件,如果风扇出现故障需要更换,意味着交换网板也要随之进行更换,这样的集成无疑将使用户的后期维护成本大大提高。
直通风前后风道/区域独立散热风道
华为CloudEngine 12800系列采用了直通风前后风道/区域独立散热风道的解决方案,在风道设计上拥有专利技术。将交换机的散热区域分成了线卡区域和网板区域,线卡区域的散热是面板进风,后面出风;网板区域的散热是机箱前面下部进风,机箱后面上部分出风;两个区域经过背板严格的隔离,这样形成了两个完全独立的前进风、后出风的散热风道。严格遵循风道设计的前提下,可有效规避风道级联所带来的可靠性问题。
直通风Z型散热风道/横向散热通道混合
H3C在正交架构的散热风道设计上,尝试了两种解决方案。H3C S12510-X采用了Z型散热风道,遵循前进后出风道和冷热风道分离原则,进风口集中在机箱下部,出风口在机箱的后上部,线卡竖插,风道从下到上问题不大,但交换网板和主控板横插,阻碍了风道流向,因此需要在交换网板和主控板上两边开孔形成风道,这样做会造成单板面积浪费,同时孔洞叠加形成的风道会产生风阻,导致散热效率降低。思科也曾在其上一代的Nexus 7000系列产品中使用过Z型风道设计,但在Nexus 7700系列中并未沿用这一风道设计思路。H3C S12516-X在散热风道设计上反其道而行,并未遵循目前主流的前进风、后出风的通道设计,而是采用了“复古”的横向散热通道,横向散热通道会带来热风回流和走线空间不足的问题,目前并不适用于数据中心的机房环境,值得商榷。
带宽、散热能力的可扩展性
之所以大笔墨的详述了4家厂商正交架构下散热风道的设计思路,是因为正交架构代表了目前核心交换机基础架构的方向,基于正交架构的散热风道设计、正交连接器的选择决定了交换机单板的散热和带宽扩展能力。这些不仅代表了厂家在核心交换机研发的技术领先性,更关乎用户在未来的数据中心网络整体的扩展性、维护成本和系统可靠性。
连接器是核心交换机的基础架构部件,伴随着产品的整个生命周期,因此连接器选择至关重要。在具有正交架构的交换机中,正交连接器决定了交换机的带宽可扩展性和单板兼容性,因为正交连接器决定高速链路能不能升级到更高速率的重要因素,目前这4款最前沿产品的正交连接器选择分成了两个方向。思科Nexus 7700系列和华为CloudEngine 12800系列都选择了ATCS的Xcede正交连接器;H3C S12500-X系列和Arista 7500E系列都选择了Molex的上一代Impact正交连接器。Xcede正交连接器是新一代的连接器,是面向25G高速链路设计的,在高速连接、串扰和连接密度等方面已经考虑了更高速率的支持,所以可以应用在演进到更高速率的核心交换机上。
同时,每槽位的散热能力的高低决定了单板端口密度的高低,而这与散热通道设计的领先性息息相关。最具优势的散热风道设计,将直接影响交换机是否能支持48*40GE单板和48*100GE单板所带来的千瓦功耗,单板的扩展能力越高则需要首先考虑系统能否带来更好的散热设计。所以,就目前的散热风道设计而言,华为的直通风前后风道/区域独立散热风道思路,对于单板散热可扩展性最具竞争优势。
结语:
正交架构,前进风、后出风的散热风道设计标准已经成为了数据中心核心交换机的标准,而在技术的细节实现上,不同厂商各显其能。作为数据中心基础架构的核心组件,它每一个细微的技术实现差异,也许就会给数据中心网络的整体性能、未来的扩展性、可靠性,甚至是业务实现带来差异。所以在企业数据中心网络建设中,将供应商在硬件基础架构方面的技术积累、设计理念和用户投资、运维成本等方面的价值体现作为考量因素至关重要。