【IDCC2017】专访金山云曹锡刚 看IaaS前三甲的数据中心布局

企业动态 IaaS
不久前,IDC发布的2017上半年中国公有云市场追踪报告中,中国公有云IaaS市场排名,金山云以报告期内营收6839万美元,占有6.5%份额位居中国公有云IaaS市场第三位。金山云合伙人曹锡刚认为:“底层基础决定上层建筑,金山云云计算平台的稳定性、可扩展性离不开数据中心的支撑。”在接受中国IDC圈采访时,他从国内本土化设计、全球差异化布局以及数据中心选址理念三方面解析金山云数据中心配置策略。

不久前,IDC发布的2017上半年中国公有云市场追踪报告中,中国公有云IaaS市场排名,金山云以报告期内营收6839万美元,占有6.5%份额位居中国公有云IaaS市场第三位。金山云合伙人曹锡刚认为:“底层基础决定上层建筑,金山云云计算平台的稳定性、可扩展性离不开数据中心的支撑。”在接受中国IDC圈采访时,他从国内本土化设计、全球差异化布局以及数据中心选址理念三方面解析金山云数据中心配置策略。

 

金山云-曹锡刚

 

自主研发Netbench系统 提供有中国特色的优质网络覆盖

曹锡刚认为,在美国等IT前沿国家,云计算已经有相对较长时间的发展,对基础设施的建设、运维也有了比较丰富的经验。而中国目前处于云计算高速发展期,因为其速度快,与之带来的是基础设施建设的井喷式发展。

相比于国外,国内整体基础设施环境、尤其是基础网络环境,在跨地域、跨运营商访问质量上以及国际间互访,都要逊色。怎样为用户提供优质的网络覆盖,这是国内云计算公司共同面临的问题。金山云凭借对云计算网络的深入理解,以及和国内外各个运营商良好的合作关系,很好地解决了这个问题。

中国地域辽阔,金山云对大跨度的物理地域按Region进行划分,Region间使用高速、高冗余的传输网络互连,提高了异地部署高可用以及灵活的网络调度,避免区域性故障导致业务受损。

另外,金山云在同Region内进行Transit Center + Available Zone分工设计,带来了接入类节点和生产节点的区分,通过同城(近郊)自建大容量传输环网系统将Region内的TC/AZ进行带保护式互联,在提供超大带宽的基础上进一步提高了Region内网络容灾能力,并进一步明确分工,合理化网络架构及更好的优化成本。

曹锡刚坦言,在整体基础网络落地的过程中金山云也遇到了许多困难,例如BGP带宽的精细化覆盖、运营商故障时的流量调度、城域传输系统的流量发展速度超预期等问题,通过自主研发的Netbench系统,在监控到运营商大网故障时,可以根据金山云的网络覆盖情况,进行自动化流量调度,***程度上减少运营商故障对网络的影响。

数据中心差异化布局 国内全覆盖,国外划重点

云计算市场是一个全球性市场,金山云整体布局上采用国内全覆盖,同步发展国外重点区域的策略,在满足国内公有云资源需求的同时也可以支持用户出海的需求。

曹锡刚表示,在国内规划数据中心时,除了考虑电力、制冷等基础指标外,并不忽视网络覆盖质量,金山云会优先确定网络资源是否满足要求,在满足要求的范围内,寻找高等级的数据中心。

北上广是各大运营商的核心节点,网络覆盖质量优于其他城市,金山云核心节点都部署在北上广,为客户提供优质稳定的云计算服务。

以视频云为例,根据其本身的业务特性,金山云采用本地覆盖的方式,全球共建设600+CDN节点,20T+全网带宽,覆盖20余家国内外运营商,每天承载50PB互联网流量,请求次数百亿次,覆盖网民3亿。

金山云的数据中心及运营机构已经扩展到全球各地,已建和在建的有北京、上海、广州、成都、香港、美国、新加坡、俄罗斯、印度、德国等地。

区别于传统IDC 全方位考察更适合云计算的数据中心

云计算数据中心,在基础设施方面与传统IDC并没有本质的区别,但是在规模、容量、网络、光纤管道等方面会有更严格的需求。曹锡刚表示,金山云选择数据中心会从多方面多角度考察数据中心选址,比如:地理位置、地质情况、市政水电、设计规划、电气架构、制冷架构、网络管道、消防设施、安防等级、测试验证、运维能力等因素。

他认为,地理位置,不仅仅是一个地址的问题,它引申出的问题如:交通道路情况、是否为自然灾害高发区域、周边有无化工厂、垃圾填埋厂等;地质情况,周围是否为山地、对外排水情况如何。金山云之前考察过的一些数据中心,有的就是建在半山腰或者山下,而且还是雨水多的城市,这种地方都会有山体滑坡、泥石流等风险。

从市政水电方面来说,电是整个数据中心唯一的动力来源。因此金山云选择数据中心的标准一定是“双站双路”或者“多站多路”,尽可能地降低电力源头故障的风险。水源问题同样重要,一般金山云会要求市政水主管道、园区内要求双环形或者双回路设计。

电气架构方面,目前IDC业内主流的数据中心,电气架构基本类似--2N系统,但有些数据中心往往忽略两个问题:***个问题,虽然电气设备是双套的,但都放在一个房间里,这在金山云看来也是单点故障,这个房间一旦放生火灾,业务就要有全部中断的风险。另一个问题,高压母联开关,有的数据中心觉得占用空间、逻辑复杂、增加投资成本而省掉,但这一点可能会将数据中心的级别从T3降到T2,高压母联开关不仅仅是电源故障时一种重要的保障措施,更重要作用是解决高压检修时可在线维护性问题。

对于制冷,目前IDC业内主流的数据中心制冷架构配置基本类似,冷机+冷塔+板换的模式,我这里只讲一个问题:蓄冷罐,蓄冷罐的作用有两个,一是峰谷平电价时,谷时存水、峰时用水的一种降低运营成本的用法。另外最最主要作用是冷机从停电到再启动运行,往往需要5分钟以上启动时间,而且冷机还需要错峰逐台启动,这5-10分钟空白时间数据中心制冷是如何保障的?这时候就需要蓄冷罐储存的冷水作为不间断制冷的冷源支撑下去,道理就像UPS的电池蓄电一样。

运维能力方面,随着数据中心的建设规模不断扩大,数据中心变得越来越复杂,一个运营商运营体系、运营能力、运营经验就起到重要的作用。金山云主要考察的首先是运营体系、运维流程、管理制度,其次是人员能力素质,同时还有严格的SLA标准去要求。

曹锡刚总结,选择一个数据中心并不是一个简单的问题,它所涉及的方方面面技术因素其实是非常复杂的。虽然每家云计算公司选择数据中心考虑的因素不尽相同,但归根结底都是以适应业务发展要求,保障业务连续性,保证客户满意度为最核心标准。

至此,从数据中心中国本土化设计,到全球部署战略,再到数据中心选址,一个国内公有云IaaS前三甲的数据中心部署策略逐渐清晰。据了解,金山云已布局19个大型数据中心,全球CDN节点数量达600+,BGP带宽储备200G+,服务器总量达80000+。

责任编辑:市场部 来源: 中国IDC圈
相关推荐

2010-03-16 09:25:19

服务器

2018-11-16 17:58:21

OpenStack

2010-03-15 14:18:52

俄罗斯超级计算机

2017-12-04 15:12:41

IT 运维

2010-07-06 22:42:35

2017-11-08 17:57:32

IDC产业

2009-11-16 11:31:43

2012-12-12 10:03:32

数据中心虚拟化云计算

2011-11-10 11:00:11

苹果云计算雅虎

2011-10-24 10:19:24

苹果云计算数据中心

2015-11-19 19:40:40

TOP500曙光HPC

2009-01-16 09:11:03

MySpaceWeb邮件Gmail

2017-09-27 14:42:16

IaaS云计算云服务

2012-11-21 18:14:07

2011-06-28 09:14:57

2015-06-04 13:24:44

数据中心云计算

2015-04-07 09:59:57

云计算数据中心混合云

2011-04-12 10:54:30

网络布局机房布线
点赞
收藏

51CTO技术栈公众号