说起X86服务器,相信你一定会想到英特尔及其针对服务器、工作站的处理器平台:至强(Xeon),毕竟X86服务器芯片这块市场十之八九的份额都在英特尔的手中。而且,更重要的是,在一定程度上,至强代表了X86服务器的技术核心。
众所周知,英特尔的CPU先后经历了8086、80286、80386、80486以及此后的奔腾系列、赛扬系列和至强系列,奔腾系列又包括奔腾1、2、3、4,其中,具有里程碑性质的是8086、80486和奔腾。1993年,英特尔公司推出“奔腾”Pentium芯片,被称为586或P5,含有310万个晶体管,速度达60 MHz。1995年11月,英特尔推出“新奔腾”Pentium PRO,这是自从1979年以来的芯片家族的第六代,代号为P6,有550万个晶体管,第一批芯片运行速度为150-200 MHz。这种“新奔腾”就是至强的前身,目标直接定位于商业用高性能计算机、服务器等企业级计算领域。
翻开至强处理器12年的发展历史,我们看到,这款处理器已经发生了巨大的变化:经过了P6(奔腾III)、Netburst(奔腾4)、酷睿、Nehalem等几代微架构的变迁,制造工艺从最早的250纳米提升了现在的45纳米,CPU内核数量从单核发展到了6核,主频从400MHz提升到3.8GHz,前端总线带宽从100MHz发展到了1.6GHz,并最终转换到了全新的QPI直联架构,指令集和诸如超线程、智能节能、虚拟化等功能不断推陈出新……
至强的商标虽然经历了几代x86和x86-64处理器,但仍然保留了下来,旧型号是将至强放到对应的处理器名字的末尾,如奔腾II至强,奔腾III至强,但2001转换到奔腾4架构上之后,新型号则一率直接叫至强,这似乎也意味着基于至强的PC服务器正一步步脱离PC的色彩,更加强大,也更加独立。比较而言,至强 CPU除了多重处理能力、在同一主板上支持多颗处理器外,比对应的桌面级CPU拥有更多的缓存。
笔者按照处理器微架构的不同,将至强这12年的历史分成了四个阶段,分别加以阐述。#P#
1998-2000年 P6微架构时代
包括250纳米的奔腾II至强Drake、奔腾III至强Tanner以及180纳米工艺的奔腾III至强Cascades,共20多款处理器,插座接口是Slot 2,指令集只有MMX和SSE。
P6时代,CPU主频几乎完全代表了产品高低档的不同——型号中的数字与主频是一致的,不过,主频都很低,直到2000年的8月22日才出现了1GHz的“奔腾III至强1000”;前端总线带宽也很低,只有100MT/s或133MT/s。
也许最让今天人们感慨的是,P6处理器的功耗低得惊人,最高也不过46.7瓦特,最低的一款只有23瓦特。比较来看,从250纳米到180纳米制造工艺的进步对于P6主频提升和功耗降低都是非常明显的:250纳米时代,主频在400-550MHz之间徘徊,而到了180纳米的奔腾III至强Cascades,主频已经跃升至1GHz,功耗则下降了10瓦特左右,跟今天八九十瓦、甚至100多瓦的CPU相比,只有20-30瓦特的Cascades真的是相当“凉快”!
#p#2001-2006年 NetBusrt微架构时代
这是至强历史上持续时间跨度最长的一代架构了,甚至到2007年一季度还发布了一款基于Netburst架构的产品,包括的处理器型号非常多:180纳米的至强Foster,130纳米的至强Prestonia和Gallatin,90纳米的至强Nocona、Irwindale、Paxville、Cranford、Potomac,以及65纳米的Dempsey和Tulsa,一共有70多款处理器,CPU插座有LGA 771、Socket 603。
这时至强已经开始逐渐摆脱PC的影响,型号前面也不在加上“奔腾III”、“奔腾4”的标称,正在朝面向企业计算的独立平台转化,至强出现了按UP(单路系统)、DP(双路系统)和MP(多路系统)的划分方式。可以说,在NetBurst时代,至强发生了脱胎换骨式的蜕变,企业计算的特征越来越明显,同时在2003年也直接受到了AMD皓龙处理器的强有力挑战。
在这六年当中,至强的主要特性变化特点有:
1)能效计算:制造工艺从180纳米提升到了65纳米;伴随着制造工艺的进步,主频和功耗之间的关系变得微妙起来,“要获得高主频往往得付出高功耗的代价”——180纳米(1.4-2GHz,48-77W)、130纳米(1.5-3.2GHz,30-90W)、90纳米(2.6-3.8GHz,55-165W)、65纳米(2.5-3.7GHz,95-150W),比如主频3GHz的双核至强7040(Paxville MP)的TDP功耗就高达165W,“每瓦特性能”的概念开始出现并广泛流行,同时,英特尔也开始通过一系列技术创新如制造工艺改进、低功耗版处理器、EIST等,来保证平台更新时“在功耗不变的条件下提升性能”。英特尔甚至在2006年还尝试动用了用于笔记本电脑的处理器微架构,推出基于Pentium M (Yonah)架构的双核至强DP处理器(Sossaman),TDP功耗为31W,使用Socket M插座,不过,主频最大仅2.166GHz。
2)唯主频论过时:由于唯主频论开始过时,至强的命名型号也发生了大的变化,从2006年开始,英特尔不再用“至强UP/DP/MP+主频”来的方式来命名、区别不同型号,而是分为针对双路平台的至强5000系列和针对多路平台的至强7000系列,如至强50XX(Dempsey)、至强70XX(Paxville MP)、至强71XX(Tulsa),后面两位数用来标识CPU的不同,一般数字越大,表示性能越高;而且,由于这一阶段还开始出现核心数量、功耗的区别,所以有些产品前面也开始加上Dual Core(双核)、后面加上Low-voltage(低功耗)等字样。
3)64位计算:2004年6月,在AMD64位皓龙的竞争推动下,英特尔放弃过去单纯依靠安腾主打64位计算市场的策略,推出EMT64的Nocano,走上32位/64位兼容型计算道路;
4)多核计算:2005年开始出现双核芯,多核计算开始走上快车道;
5)多功能:指令集和CPU的功能得到了频繁更新,跟P6架构相比,新增了SSE2、SSE3指令集,以及许多过去闻所未闻的新技术,如超线程、EIST(Enhanced Intel SpeedStep Technology)智能降频节电技术、EMT64兼容32位和64位计算、XD bit(No eXecute)防病毒防恶意攻击技术、intel-vt硬件辅助虚拟化技术等。
6)均衡计算:随着处理器的性能越来越强,但前端总线的带宽提升幅度却不大,从400、533、667、800提升到1066MT/s,I/O瓶颈也越来越突出,尤其是对于四路以上的系统。在这一阶段,虽然AMD已经在2003年推出了“直连架构,集成内存控制器”的皓龙,但英特尔仍然坚持FSB架构。于是,我们看到,为了缓解CPU“吃不饱”的状况,这一时期英特尔主要是不断进行大容量L2缓存设计,甚至开始引入大容量L3缓存,如针对多路系统、FSB带宽仅有667 MT/s的双核至强7150N(Tulsa)就拥有2x1MB二级缓存和高达16MB的三级缓存。
7)虚拟化:随着X86服务器虚拟化的流行,英特尔在2006年5月份发布的Dempsey处理器中开始引入其硬件辅助虚拟化技术intel-vt,以缓解VMware等虚拟化软件的性能损耗,提高虚拟化的效率,此后,英特尔VT得到了长足的发展,直至今天。
总之,这是新旧交替的六年,也是英特尔历尽蜕变的六年,不仅要面对功耗攀升的棘手问题,还要面对来自AMD的挑战,期间双方在64位、双核、功耗等方面多次交手,虽然各有胜负,但总体来说,英特尔在这一时期失误颇多,最终让AMD皓龙在市场中占稳了脚跟。
#p#2006-2008年 酷睿(Core)微架构时代
2006年其实是Netburst和酷睿两种架构并存的一年。差不多也是从这一年开始,英特尔引入了其新的产品更新策略:Tick-Tock,这其实也是英特尔对市场的一种承诺,即当年更新微架构,下一年更新制造工艺,依次类推,不断推动处理器技术的发展。于是我们看到2006年是酷睿微架构年,2007是45纳米工艺Penryn,2008是Nehalem微架构,2009是32纳米工艺的Westmere,2010年是Sandy Bridge全新架构......
Core架构尽管历时才3年左右,但英特尔一共推出了近90款CPU,包括:65纳米针对单路平台的的双核Allendale(至强3000系列)、双核Conroe(至强3000系列)、四核Kentsfield(至强3200系列),针对双路平台的双核Woodcrest(至强5100系列)和四核Clovertown(至强5300系列),针对四路以上平台的Tigerton(双核至强7200系列、四核至强7300系列),以及45纳米针对单路平台的双核Wolfdale(至强3100系列)和四核Yorkfield(至强3300系列),针对双路平台的双核Wolfdale-DP(至强5200系列)、四核Harpertown(至强5400系列),还有针对四路平台的四核/六核Dunnington(至强7400系列)等十来个类别。
和Netburst微架构相比,Core时代至强处理器的变化主要有:
1) 制造工艺从65纳米升级到了45纳米(统称为Penryn),使用了高K材料,这一工艺的进步为英特尔在CPU中集成更多的晶体管、提高主频、降低功耗、进行下一代微架构创新等提供了基础;
2) 多核计算得到进一步发展,出出四核(最早出现在Clovertown至强5300系列中)与六核(最出现在Dunnington至强7400系列中)产品;
3) 指令集得到进一步发展,新增SSE4.1,在虚拟化、智能节能等方面也得到了进一步增强;
4) 针对单路服务器的处理器统一到至强3000系列名下;
5) 为了将CPU功耗控制在可接受的范围以内,英特尔一方面通过多核设计来提升性能,另一方面通过工艺进步来实现主频与功耗的平衡,跟Netburst相比来看,主频甚至有所降低,但功耗基本得到了有效控制,65纳米(1.6-3GHz,35-150瓦特)45纳米(1.866-3.5GHz,20-150瓦特);
6) 由于Core时代仍然采用前端总线结构,为了提升I/O带宽,降低I/O延迟,英特尔一方面提升总线带宽(1066、1333、1600 MT/s),另一方面继续采用大容量L2和L3缓存设计,如六核心的至强7460主频为2.667GHz,FSB为1066MT/s,L2缓存为3x3MB,L3缓存为16MB。
7) 这一时期的CPU插座也发生了变化,主要有LGA 771、LGA 775和Socket 604。
#p#2009年 Nehalem微架构时代
虽然Nehalem微架构在2008年就已经在个人电脑的i7处理器上得到采用,但在服务器上的应用却是今年3月30日Nehalem-EP至强处理器的发布——包括45纳米的针对单路系统的双核/四核Bloomfield(至强3500系列)以及针对双路系统的双核/四核Gainestown(至强5500系列)。
对英特尔而言,基于45纳米的Nehalem代表了一个全新时代的到来:放弃传统前端总线架构,转向QPI直连架构,打破传统I/O瓶颈的束缚,QPI带宽高达4.8-6.4 GT/s,远远高于FSB时代的1.6 GT/s!
如果说当年的奔腾Pro开创了X86工业标准服务器大批量生产和普及的时代,那么,至强5500则是15年来性能提升幅度最显著的一代,其性能是2005年单核至强的9倍,是上一代至强5400的2.5倍,同时空闲状态下的平台功耗降低了50%,其背后采用了一系列技术包括45纳米工艺、全新内存子系统、快速通道互联技术(QPI)、智能节能技术、全新I/O子系统。在性能方面,智能加速技术可以满足对CPU主频比较敏感的应用需求,超线程技术则可以满足高度并行的应用需求,针对能耗方面,则有集成功率门限、自动低功耗、节点管理器等等。这些创新的技术使得今天的用户“可以在需要的时候提高性能,也可以在不需要性能的时候自动降低功耗。”
针对四路以上的系统,英特尔将在今年下半年投产、明年初上市八核心Nehalem-EX(估计命名为至强7500,代号Beckton)。Nehalem-EX将拥有23亿晶体管,拥有4个QPI链接,可以让服务器从双路一直轻轻松松地扩展到8路,且无须第三方芯片组技术支持,从而最高可以支持到64核、128个线程,拥有24MB共享L3缓存,每个处理器支持16个内存插槽,引入了原来只在安腾上采用的RAS特性:MCA(机器检验体系结构)功能。根据英特尔的测试,Nehalem-EX与上一代的至强7400相比,在性能和带宽两方面都实现了“前所未有”的飞跃:内存带宽高达9倍,数据库性能超过2.5倍,整数吞吐量超过1.7倍,浮点吞吐量超过2.2倍!
【编辑推荐】