时间进入到了2010年的下半年,距离至强5600系列的发布已经经历了半年多的时间。在这段时间里,各个服务器厂商的产品都已经从原有的至强5500升级到了5600,由于接口标准及主板芯片组等多个平台因素并未进行更新,本次升级过程进行得非常顺利,原有的Nehalem产品已经无缝升级到了新一代。最近,我们收到了一台曙光公司送测的I620r-G服务器,该服务器搭载的处理器型号为至强X5650,也是处理器升级之后的新产品。下面,就让我们一起来看一看该产品的构造及升级之后的性能如何。
使用了Xeon X5650处理器的曙光I620r-G服务器送测样机
从前方面板部局中可以看到,曙光I620r-G服务器最多可以支持12个3.5英寸热插拔硬盘
曙光I620r-G服务器面板细节,这里提供了简单的服务器状态指示灯
曙光I620r-G服务器面板细节
从图中可以看到,这次送测的曙光I620r-G服务器样机采用了双电源配置,提供了冗余
#p#
刚才,我们看过了曙光I620r-G服务器的外部结构,值得一提的就是这台服务器并没有配备光驱位,12个SATA硬盘位提供了更大的存储能力。接下来我们就进入服务器的内部,看看它的内部构造如何。
在主要部件位置使用了透明的塑料导风罩,这种设计可以使其形成风洞以加强散热性能
曙光I620r-G服务器所配置的AVC风扇
想要接触到CPU等部件需要先将导风罩卸下
送测的曙光I620r-G服务器使用了双CPU、12条内存以及2块阵列卡
做工精良的三热管散热器
#p#
CPU插槽开启状态
Intel Xeon X5650 处理器
至强X5650处理器是至强5600系列的高端型号。我们知道,按照Intel英特尔对于至强处理器的定义,X系列是高端应用版本,E系列是普通版本,而L系列是节能版本。本次,服务器搭配的至强X5650处理器主频为2.67GHz,也算是比较高的频率了。和许多Nehalem-EX处理器一样,至强X5650的L3达到了12MB,内部整合了内存控制器,支持SMT(超线程)技术。它的QPI为3200MHz,是一颗6核心12线程的产品。
来自LSI的阵列卡,其型号为MegaRAID SAS 8708ELP
阵列卡内存颗粒
LSI MegaRAID SAS 8708ELP阵列卡想必大家也是非常的熟悉,之前我们测试过的多款产品都在使用这块阵列卡。它可以提供对于8块硬盘的支持,同时支持RAID 5和RAID 6等常用RAID阵列。这次,曙光使用两块阵列卡支持12块硬盘,在测试中我们组建的是常用的RAID 5阵列,兼顾了性能和可靠性。
#p#
服务器使用了12条SAMSUNG 4GB 内存,内存总容量达到了48GB
此次送测的曙光I620r-G服务器使用了Seagate硬盘
Seagate ST31000340NS硬盘单块容量1TB,其拥有7200转的转速与32M缓存
虽然在刚才的介绍中,我们看到了MegaRAID SAS 8708ELP阵列卡的身影,但是曙光为这台服务器配置的却是SATA硬盘,而且是企业版的SATA。对于这种面向存储应用的服务器来说,磁盘性能是我们需要考察的重要内容,而使用企业级SATA硬盘+阵列卡的配置,不但可以保证存储的可靠性,还可以尽可能大的增加存储空间,毕竟目前SAS硬盘的最大容量落后SATA硬盘一大截。
配置了2个3Y POWER服务器模块化电源
单个电源的最大总功率为720W
#p#
看过了服务器的基本配件,最后我们来了解一下服务器主板及配套芯片的信息。
主板共提供了4条PCI Express 2.0 x8插槽
Intel JL82576EB 千兆网卡芯片
整合了显示芯片的多功能控制芯片
用于远程网络管理的Realtek RTL8201N百兆网络芯片
从至强5500升级到5600,除了处理器变更之外,主板芯片组并未进行更多的更新,我们看到的这台曙光I620r-G服务器依然使用的是Intel 5520芯片组,也就是我们常说的Tylersburg-36D,这也是成熟的双路Nehalem-EP平台,提供了三通道模式。可别以为处理器内部整合了内存控制器就万事大吉了,我们就见过Nehalem-EP处理器搭配双通道平台的事情,很明显对性能没有提供完全的支持。
#p#
本次评测的曙光I620r-G服务器配置的是双路Westmere-EP Xeon X5650处理器,测试结果并会与我们IT168评测中心的DELL PowerEdge 2900 III服务器进行对比,测试对比平台的详细参数如下:
测试平台、测试环境
|
|||||
测试分组
|
|||||
类别
|
Dawning I620r-G服务器 双路Intel Westmere-EP Xeon X5650 |
DELL PE2900 III服务器 双路Intel Harpertown Xeon E5430 |
|||
处理器子系统
|
|||||
处理器
|
双路Intel Xeon X5650
|
双路Intel Xeon E5430
|
|||
处理器架构
|
Intel 32nm Westmere | Intel 45nm Penryn | |||
处理器代号
|
Gulftown | Harpertown | |||
处理器封装
|
Socket 1366 LGA | Socke 771 LGA | |||
处理器规格
|
六核 | 四核 | |||
处理器指令集
|
MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,SSE4.2,EM64T,VT |
MMX,SSE,SSE2,SSE3,SSSE3, SSE4.1,EM64T,VT |
|||
主频 | 2.67GHz | 2.66GHz | |||
处理器外部总线 | 2xQPI 2673MHz 6.4GT/s 单向11.73GB/s(每QPI) 双向23.46GB/s(每QPI) |
FSB 333MHz 1333MT/s 10.6GB/s |
|||
L1 D-Cache
|
6x 32KB 8路集合关联 |
4x 32KB 8路集合关联 |
|||
L1 I-Cache
|
6x 32KB 4路集合关联 |
4x 32KB 8路集合关联 |
|||
L2 Cache
|
6x 256KB 8路集合关联 |
2x 6144KB 16路集合关联 |
|||
L3 Cache
|
12MB 16路集合关联 |
||||
主板
|
|||||
主板型号
|
Dawning Tylersburg-36D
|
DELL PE2900 III
|
|||
芯片组
|
Intel Tylersburg-EP IOH:Intel 5520(Tylersburg-36D) ICH:Intel 82801JR(ICH10R) |
MCH:Intel 5000X ICH:Intel ESB6321 |
|||
芯片特性 | 2xQPI VT-d |
2xFSB1333 12MB Snoop Filter VT-d |
|||
内存控制器
|
每CPU集成三通道R-ECC DDR3 1333 | 北桥集成四通道FBD DDR2 667 | |||
内存
|
4GB R-ECC DDR3 1333 SDRAM x12 | 2GB FBD DDR2 667 SDRAM x4 | |||
系统磁盘子系统
|
|||||
磁盘控制器
|
LSI Embedded MegaRAID SAS RAID Controller
|
DELL Perc 5/i RAID Controller
|
|||
磁盘控制器规格
|
8xSAS 3Gbps | 8xSAS 3Gbps | |||
磁盘控制器设置
|
RAID 5
|
-
|
|||
磁盘控制器驱动
|
LSI MegaSR 13.06.0212.2009 |
LSI SAS 3.8.0.64 |
|||
磁盘 |
Seagate
Barracuda ES.2 ST31000340NS x3 |
Seagate
Cheetah 15K.5 ST314655SS |
|||
磁盘规格
|
7200RPM 1000GB SATAS 3Gbps 32MB Cache |
15000RPM 146GB SAS 3Gbps 16MB Cache |
|||
磁盘设置
|
SATA 3Gbps 100GB系统分区 |
SAS 3Gbps 20GB系统分区 |
|||
网络子系统
|
|||||
网卡
|
Intel 82576 Gigabit Dual Port Network Controller | Broadcom BCM5708C PCI-E千兆网卡 x2 |
|||
网卡设置
|
PCI Express x4 I/OAT Intel Teaming Load Balancing |
PCI Express x1 Broadcom NIC Teaming Load Balancing |
|||
网卡驱动
|
Intel PRO Set 10.3.49.00 |
Broadcom NetXtreme 2 11.04.01 |
|||
软件环境
|
|||||
操作系统 | Microsoft Windows Server 2008 R2 Enterprise Edition x64 |
Microsoft
Windows Server 2008 Enterprise Edition SP1 x64 |
#p#
▲Westmere-EP Xeon X5650处理器,主频2.67GHz。QPI总线频率3200MHz
Westmere-EP缓存方面相比Nehalem-EP来说有50%提升
Intel Tylersburg芯片组,采用Intel 5520 + ICH10R芯片组
48GB R-ECC DDR3 1333内存,三通道设置
每条内存4GB,总共12条Micron PC3-10700内存
#p#
下面是Everest软件对主板芯片组信息的扫描。
至强X5650处理器信息,这里可以看到24个核心,其中12个为超线程
处理器QPI相关信息
内存相关信息,大内存就是好,感慨一下
Tylersburg-36D芯片组信息
南桥信息,依然是我们熟悉的ICH10R
#p#
SPEC CPU 2006整数运算主要包含编译、压缩、人工智能、视频压缩转换、XML处理等,此外,各种日常操作也主要是基于整数操作。SPEC CPU 2006的整数运算包含了400.perlbench PERL编程语言、401.bzip2 压缩、403.gcc C编译器、429.mcf 组合优化、445.gobmk 人工智能:围棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:国际象棋、462.libquantum 物理:量子计算、464.h264ref 视频压缩、471.omnetpp 离散事件仿真、473.astar 寻路算法、483.xalancbmk XML处理共12项。
从主频上来看,至强X5650和至强E5430基本接近,两者0.01GHz的频率差距不会造成如此强烈的差距。而对于SPEC CPU 2006这款软件来说,最依赖的还是处理器性能,所以我们可以看出32nm的Westmere-EP核心性能非常强大,多数项目中都领先E5430一倍以上,最大的幅度差距甚至达到了近16倍,这是一个非常恐怖的数字。由此说明,至强X5650性能很强悍,这不仅仅体现在核心数量和缓存容量上,更是由于核心架构的先进决定的。
#p#
SPEC CPU 2006的浮点运算测试包括的全部都是科学运算,科学运算需要用到大量的高精度浮点数据,如410.bwaves 流体力学、416.gamess 量子化学、433.milc 量子力学、434.zeusmp 物理:计算流体力学、435.gromacs 生物化学/分子力学、436.cactusADM 物理:广义相对论、437.leslie3d 流体力学、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 线形编程、优化、453.povray 影像光线追踪、454.calculix 结构力学、459.GemsFDTD 计算电磁学、465.tonto 量子化学、470.lbm 流体力学、481.wrf 天气预报、482.sphinx3 语音识别共17项测试。
浮点测试的成绩依然是一边倒,至强X5650以绝对的优势领先。虽然差距幅度不如整数运算那么大,也足可以说明新款的Westmere-EP性能之强悍。
#p#
SiSoftware Sandra是一款可运行在32bit和64bit Windows操作系统上的分析软件,它可以对于系统进行方便、快捷的基准测试,还可以用于查看系统的软件、硬件等信息。SiSoftware Sandra所有的基准测试都针对SMP和SMT进行了优化,最高可支持32/64路平台。我们利用了其中多个性能测试模块对于被测系统的性能进行了快速的测试。
SiSoftware Sandra Pro Business 2010
|
|||
测试对象
|
Dawning I620r-G Westmere-EP服务器 双路Intel Gulftown Xeon X5650 2.67GHz |
DELL PE2900 III 双路Intel Harptown Xeon E5430 2.66GHz |
|
Processor Arithmetic Benchmark
处理器架构测试 |
|||
Dhrystone ALU |
246530MIPS
|
91006MIPS | |
Dhrystone ALU vs SPEED | 88.27MIPS/MHz | 34.21MIPS/MHz | |
Whetstone iSSE3
|
177840MFLOPS
|
78385MFLOPS | |
Dhrystone iSSE3 vs SPEED | 63.67MFLOPS/MHz | 29.47MFLOPS/MHz | |
Processor Multi-Media Benchmark
处理器多媒体测试 |
|||
Multi-Media Int x16 iSSE4.1
|
461.57MPixel/s
|
||
Multi-Media Int x8 iSSE4.1 | 199.33MPixel/s | ||
Multi-Media Int x16 iSSE4.1 vs SPEED
|
165.26kkPixels/s/MHz | ||
Multi-Media Int x8 iSSE4.1 vs SPEED | 74.94kPixels/s/MHz | ||
Multi-Media Float x8 iSSE2
|
348.85MPixel/s
|
||
Multi-Media Float x4 iSSE2
|
|
108.69MPixel/s | |
Multi-Media Float x8 iSSE2 vs SPEED
|
124.90kPixels/s/MHz | ||
Multi-Media Float x4 iSSE2 vs SPEED
|
40.86kPixels/s/MHz | ||
Multi-Media Double x4 iSSE2
|
188MPixel/s
|
||
Multi-Media Double x2 iSSE2
|
|
55.75MPixel/s | |
Multi-Media Double x4 iSSE2 vs SPEED
|
67.29kPixels/s/MHz | ||
Multi-Media Double x2 iSSE2 vs SPEED
|
20.96kPixels/s/MHz | ||
Multi-Core Efficiency Benchmark
|
|||
Inter-Core Bandwidth
|
84.43GB/s
|
20.54GB/s | |
Inter-Core Bandwidth vs SPEED
|
30.95MB/s/MHz | 7.91MB/s/MHz | |
Inter-Core Latency(越小越好)
|
20ns
|
90ns | |
Inter-Core Latency vs SPEED
(越小越好) |
0.01ns/MHz | 0.03ns/MHz | |
.NET Arithmetic Benchmark
.NET架构测试 |
|||
Dhrystone .NET
|
46250MIPS
|
10562MIPS | |
Dhrystone .NET vs SPEED
|
28.93MIPS/MHz | 3.97MIPS/MHz | |
Whetstone .NET
|
115370MFLOPS
|
45399MFLOPS | |
Whetstone .NET vs SPEED
|
41.31MFLOPS/MHz | 17.07MFLOPS/MHz | |
.NET Multi-Media Benchmark
.NET多媒体测试 |
|||
Multi-Media Int x1 .NET
|
87.13MPixel/s
|
31.28MPixel/s | |
Multi-Media Int x1 .NET vs SPEED
|
31.19kPixels/s/MHz | 11.76kPixels/s/MHz | |
Multi-Media Float x1 .NET
|
36.56MPixel/s
|
8.68MPixel/s | |
Multi-Media Float x1 .NET vs SPEED
|
13.09kPixels/s/MHz | 3.26kPixels/s/MHz | |
Multi-Media Double x1 .NET
|
66.35MPixel/s
|
24.75MPixel/s | |
Multi-Media Double x1 .NET vs SPEED
|
23.76kPixels/s/MHz | 9.30kPixels/s/MHz |
和之前看到的结果类似,两款平台的性能差距依然是在几何倍数。看来如果您使用的还是老款的至强5400甚至更老的平台,升级已经是势在必行了。
#p#
SiSoftware Sandra缓存内存测试主要包括内存带宽、内存延迟等性能的测试。
SiSoftware Sandra Pro Business 2010
|
|||
测试对象
|
Dawning I620r-G Westmere-EP服务器 双路Intel Gulftown Xeon X5650 2.67GHz |
DELL PE2900 III 双路Intel Harptown Xeon E5430 2.66GHz |
|
Memory Bandwidth Benchmark
内存带宽测试 |
|||
Int Buff'd iSSE2 Memory Bandwidth
|
35.6GB/s | 6.13GB/s | |
Int Buff'd iSSE2 Memory Bandwidth vs SPEED
|
27.41MB/s/MHz | 9.43MB/s/MHz | |
Float Buff'd iSSE2 Memory Bandwidth
|
35.55GB/s | 6.13GB/s | |
Float Buff'd iSSE2 Memory Bandwidth vs SPEED
|
27.37MB/s/MHz | 9.43MB/s/MHz | |
Memory Latency Benchmark
内存延迟测试 |
|||
Memory(Random Access) Latency
(越小越好) |
86ns | 108ns | |
Memory(Random Access) Latency vs SPEED
(越小越好) |
0.06ns/MHz | 0.16ns/MHz | |
Speed Factor(越小越好)
|
60.20 | 95.20 | |
Internal Data Cache
|
4clocks
|
3clocks | |
L2 On-board Cache
|
9clocks
|
18clocks | |
L3 On-board Cache
|
51clocks
|
||
Cache and Memory Benchmark
缓存及内存测试 |
|||
Cache/Memory Bandwidth
|
167GB/s
|
68.88GB/s | |
Cache/Memory Bandwidth vs SPEED
|
61.20MB/s/MHz | 26.52MB/s/MHz | |
Speed Factor(越小越好)
|
27.20 | 111.90 | |
Internal Data Cache | 560.14GB/s | 421.23GB/s | |
L2 On-board Cache | 462.3GB/s | 122.68GB/s |
从结果来看,两款平台最大的差距在于内存带宽测试,这是因为从Nehalem-EP处理器开始,Intel英特尔就已经在处理器中内置了内存控制器。这样一来,无论是提供的贷款还是读取速度,从处理器内部运算都要比通过北桥传输的至强5400平台快很多。在内存延迟上,两款平台并没有表现出太明显的差距,缓存及内存测试中的差距幅度也仅有几倍,说明这两项测试,特别是前一项还是比较看重内存本身的特点。
#p#
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同时测试处理器子系统、内存子系统以及显示子系统,我们的平台偏向于服务器多一些,因此就只有前两个的成绩具有意义。和大多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
CineBench R10
|
|||
处理器
|
Dawning I620r-G Westmere-EP服务器 双路Intel Gulftown Xeon X5650 |
DELL PE 2900 III 双路Intel Harpertown Xeon E5430 |
|
显卡 | 集成 | 集成 | |
CPU Benchmark
|
|||
Rendering (1 CPU) | 4437 CB-CPU | 2931 CB-CPU | |
Rendering (x CPU) |
32151 CB-CPU
|
16806 CB-CPU
|
|
Multiprocessor Speedup
|
7.25x
|
5.73x
|
|
OpenGL Benchmark
|
|||
OpenGL Standard
|
202 CB-GFX
|
176 CB-GFX |
CineBench软件主要考察的是单处理器和多处理器运算的能力。从结果来看,单处理器下至强X5650平台的性能提升了50%左右,而多处理器下(主要是多核心)的性能提升达到了100%,MS值也达到了7.25,这个成绩也得益于至强X5650处理器6核心12线程的贡献。
#p#
我们的测试服务器采用了三块Seagate Barracuda ES.2 ST31000340NS硬盘组建了RAID 5阵列,使用的是MegaRAID SAS 8708ELP阵列卡。我们介绍过,ES系列的希捷硬盘虽然也是SATA接口,但是却是针对企业级应用的,能够提供7*24小时的不间断运行。而基准平台并没有准备阵列,只是普通的单磁盘服务器。
IO读
IO写
读吞吐量
写吞吐量
借助于MegaRAID SAS 8708ELP阵列卡的优势,即便是7200rpm的SATA硬盘也达到了比较高的速度,读取IOps达到了80000以上,写入IOps接近100000。吞吐量方面,被测服务器的读取速度达到了500MBps以上,写入速度接近450MBps,这个成绩即便是对于15000rpm的硬盘来说也很难得了。可以说,这些都是阵列卡的功劳。
相比之下,我们的基准服务器就逊色得太多了,没办法,单磁盘服务器也就是这个水平。
#p#
我们在被测服务器上安装了Microsoft SQL 2005 SP1,按照测试要求建立了数据库。BF在测试之前会在数据库中生成9个表,其中包括4个500万行的表格,每行包括100字节的数据,因此每个表格容量大约是476MB,整个数据库容量为1.86GB。我们用60个客户端模拟1000个用户,在这个数据库中进行查询、添加、删除、修改等操作。
又是一个差距明显的项目。我们可以看到,被测服务器的TPS非常高,峰值TPS超过了180000,也只有Westmere-EP能够有这样高的水平。相比之下,基准服务器的成绩只有50000多一些,差距在3倍以上。
#p#
至强5600自发布以来,已经成为了行业的热点,掀起了继Nehalem-EP之后的又一轮处理器性能提升。从我们本次的测试来看,曙光送测的I620r-G服务器借助于新处理器的支持,已经全面超过了老一代的至强5400系列,而且性能提升幅度惊人。
使用了Xeon X5650处理器的曙光I620r-G服务器送测样机
正如我们在文章最初提到的,从Nehalem-EP过渡到Westmere-EP,Intel英特尔已经实现了处理器的无缝升级。而且包括主板及其他配件在内,也无需更换任何的设备,可以直接支持最新的处理器,这对于经常变换处理器接口的Intel英特尔来说已经是难能可贵,毕竟服务器这样的企业级设备并不是需要经常更新的。
抱着探索的目的,我们对于这台曙光I620r-G服务器进行了全面的测试,测试结果既在我们的预料之内,又超乎了我们的想象。作为新一代的平台,搭配至强X5650的曙光I620r-G服务器理所应当超过原有的老款产品,这点是毫无疑问的;但是让我们没想到的是两代产品的差距居然如此明显,达到了最大近16倍差距的地步,而一般的测试项目也有至少3倍以上的性能提升。
应该说,本次评测的曙光I620r-G服务器是一款性能强劲的产品。如果您的公司还在使用老款的至强5400甚至更老规格的服务器,我们觉得您应该尝试一下新一代32nm Westmere-EP所带来的提升,绝对可以让你的工作事半功倍。
【编辑推荐】