2020年3月4日,中共中央政治局常务委员会召开会议,指出要加快5G网络、数据中心等新型基础设施建设进度。“新基建”成为适应时代发展趋势、带动疫后经济复苏、推动社会稳定发展的重要引擎,受到各行各业的热烈关注。大数据中心作为“新基建”的七大领域之一,缘何成为“新基建”?冷静辨析大数据中心成为“新基建”的缘由,剖析大数据中心发展的内生动力和基础条件,提出推动大数据中心发展的对策建议,对充分发挥大数据中心作为“新基建”运行的基础作用,推动大数据中心稳妥有序发展意义重大。
大数据中心成为“新基建”的内在根源
(一)大数据中心是承载“新基建”有序运行的基础保障
“新基建”作为立足于科技端的基础设施,数据是贯穿其中的生命线,所有“新基建”都面临着数据“存在哪”“如何存”“怎么管”“怎么用”的问题,大数据中心正是解决数据存储、分析、应用等一揽子问题的最佳选择。随着大数据中心的不断演变发展,其内涵已由传统的机房延伸扩展,成为以数据为基本管理对象,融合互联网数据中心(Internet Data Center,简称IDC)、云计算、区块链、人工智能等新技术于一体,成为集数据、算力、算法三大要素于一身的数字基础设施,在“新基建”中发挥着数字底座的关键作用,促进社会生产力发展。首先,大数据中心是海量数据的“图书馆”,为“新基建”运行提供海量数据存储管理服务。其次,大数据中心是海量算力的“发动机”,为“新基建”运行提供数据计算处理服务。再次,大数据中心是海量服务的“发射器”,为“新基建”各类场景优化提供数据应用服务。一言以蔽之,大数据中心既是新一代信息基础设施的“粮仓”,自身又是 “新基建”,更是其他领域“新基建”的运行基石。
(二)大数据中心是促进数字经济高质量发展的现实需要
建设大数据中心,既是应对疫情推动产业数字化转型的必然选择,也是发展数字产业带动经济复苏的重要举措,更是培育数据要素市场激活数据价值的必由之路。产业数字化转型是推动大数据中心建设的“助推器”。受疫情影响,传统产业数字化转型步伐提速,云上办公、数字娱乐、生鲜电商、在线教育、无人配送、无人餐厅等新业态加速涌现,为大数据中心发展提供新需求新空间。如,腾讯云为加大在线办公支持力度,仅2020年1月29日至2月6日就扩容超过10万台云主机,投入的计算资源超过100万核。大数据中心是拉动新兴数字产业高速发展的“加速器”。一方面,大数据中心的建设将带动上下游产业链加速发展,尤其是服务器、路由器、交换机、网络、光模块、海量数据管理系统等软硬件产品以及IaaS、SaaS、PaaS等云计算服务需求量将大幅提升。据不完全统计,我国云数据中心资源总体供给规模近年来复合增长率在30%以上,全球500强超级计算机的计算能力中32%来自中国,2022 年我国服务器市场规模将达1979亿元。另一方面,大数据中心的建设也将带动5G、人工智能、区块链等新兴产业蓬勃发展。据毕马威估算,5G市场潜在价值高达4.3万亿美元。大数据中心是激发数据要素新活力的“赋能器”。数据作为生产要素参与价值创造的过程,必将带来数据大规模、大范围跨域跨境流通,这些都离不开大数据中心的承载与支持。随着数据要素市场的进一步发展勃兴,无形中将对大数据中心发展带来极大的促进作用。
(三)大数据中心是加速智慧社会高效治理的关键支撑
建设大数据中心,既是应对疫情和经济下行的有效手段,也是对以往社会治理能力建设不足的补课,更是开启了智慧社会的数字时代。从社会治理能力来看,我国虽然有500个城市开展了智慧城市建设,但这些城市大数据中心之间相互分离尚未连接,致使疫情期间不同城市间数据无法互通,很多跨域协同问题无法得到有效的数据支持。例如,全国大部分省份推出了本地“健康码”,为疫情期间居民出行和政府管理带来很大便利。但是各地健康码都基于各自大数据中心研发,使得健康码跨地区互认困难,为跨地区出行带来不便。同样,数据是构建智慧社会的关键资源,数据在不同数据中心间的无障碍共享流通是打造智慧社会的基本前提。从短期来看,准确把握疫情防控与复工复产并行的新形势新要求,充分应用好大数据资源,重构社会生产与社会组织彼此关联的形态,促进大数据与社会治理深度融合,实现社会治理更加优化、更加科学、更加智慧,成为推动国家治理体系和治理能力现代化的重要一环。从长远来看,构建全国一体化国家大数据中心体系尤为必要。通过加快数据治理创新,实现数据泛在融通共享、平台服务资源集聚开放、新技术应用场景持续创新,解决信息碎片化、应用条块化、服务割裂化等问题,并通过场景应用的交互与反馈,形成良性循环,加速社会的智慧化运转。
大数据中心发展趋势展望
近年来,我国对大数据中心发展日益重视,政府部门纷纷作出重要部署,大数据中心发展的政策标准环境日趋优化。从国家部委来看,大数据中心的主管部门涉及工信部、发改委、国土部、国家能源局等部门,主要通过市场准入、布局指导、资金支持、产业政策等方式稳步推进数据中心发展。据不完全统计,截至目前,国家相关部委出台大数据中心相关政策15项。总体来讲,大数据中心在政策驱动和技术发展的引导下,正朝着高端化、定制化、协同化发展。
(一)融合性技术创新驱动大数据中心高端化发展
目前大数据中心建设正改变在原有数据中心基础上迭加设备数量和规模的“数字地产”模式,更多地与高密度、模块化、智能化、绿色化等新技术相融合,实现对传统数据中心的全面升级或全新替代。一是从建设模式看,模块化技术将大数据中心硬件和系统功能封装在独立模块中,按需部署、快速组装、即插即用,能够缩短50%的建设周期、节约30%的建设成本、减少50%占地面积,实现大数据中心动态可调整、弹性可扩展。二是从运维模式看,AI 解决方案正逐步介入大数据中心的设备管理、环境控制、现场运维、安全保障等全生命周期管理,改变大数据中心完全依赖人工运维的传统,实现大数据中心资源的最佳利用。三是从建设规模看,GPU、FPGA、ASIC等专用芯片算力增强,服务器功率密度、计算密度大幅提升,大数据中心基础设施向高密度、超大规模化方向演进。近年来,我国数据中心的建设规模不断扩大,许多地区的超大型数据中心,规划建设规模甚至达数十万平方米。四是从市场接受度来看,用户更愿意选择技术力量雄厚、机房良好、服务体系上佳的大型服务商。数据中心行业正在进行洗牌,规模较小、服务低劣的数据中心厂商将逐步被市场淘汰。大型服务商整合市场已成定局,下一代数据中心将朝着全球化、国际化方向规模化发展。五是从建设内容来看,虚拟化技术促使传统数据中心云端迁移。传统数据中心之间,服务器、网络设备、存储设备、数据库资源等都是相互独立的,彼此间毫无关联。虚拟化技术改变了不同数据中心间资源互不相关的状态,通过虚拟化资源设计,将服务器、存储设备、网络设备等进行虚拟化,使不同数据中心之间的资源实现了连接,用户可以远程调用所需的计算资源、网络资源、存储资源、数据库资源等。随着虚拟化技术的深入应用,服务器虚拟化已由理念走向实践,慢慢向应用程序领域拓展延伸,未来将有更多的应用程序向云端迁移。六是从能耗上来看,不断上涨的能源成本和不断增长的计算需求,使得数据中心的能耗问题引发越来越多的关注。“节能环保、绿色低碳”将成为下一代数据中心的主题词,全生命周期低碳运营的理念,将贯穿数据中心规划设计、设备材料选型、建设实施、运维管理各个环节,从技术和管理上综合开展节能减排工作。同时,面向通信机房、数据机房、基站机房等传统数据中心的节能减排改造将变成重点,网络技术演进和高能耗设备退网改造步伐加快,以有效控制能耗过快增长。在高密度、模块化、智能化技术融合应用下,大数据中心低能耗、低PUE成效日益突出,按照《关于加强绿色数据中心建设的指导意见》提出的“2022年全国新建大型、超大型数据中心的PUE(电能使用效率)值不得高于1.4”,我国大数据中心能耗水平将快速向欧美国家看齐。
(二)多样性场景应用牵引大数据中心定制化发展
随着5G、物联网、边缘计算、区块链等新技术与经济社会融合应用程度加深,车联网、人工智能、工业互联网等新型数字基础设施加快布局,数字政府、行业数字化、数字孪生城市、智慧社会、数字化生存等应用场景需求持续激发,大数据中心服务重心正在从单一的存储和算力供给向基础数据价值挖掘深度拓展。一方面,依托多源异构数据资源储备,大数据中心可通过合理的机制设计推动数据的共享和开放,从而促进数据的社会化应用。如,上海大数据中心归集了政务、行业、社会等多渠道数据,基于标准化管理推动全市数据资源的统一治理、共享、交换和开放,为上海智慧城市建设应用提供基础数据支撑。另一方面,大数据中心可进一步将数据资源包装成标准化产品,为数据产品流通、交易和开发提供平台支持,促进数据资源在更广范围、更多场景中的应用增值。此外,第三方大数据中心服务商正进入赛道,凭借按需弹性服务、专业化运维、定制化解决方案能力吸引用户,服务模式更为灵活高效,极大地弥补了基础电信运营商在大数据中心运营服务方面的市场响应慢、通用服务固化、供需不对应等短板。如,鹏博士采用酒店运营管理模式运作数据中心合作伙伴计划,通过“合作共建+受托运营”赋能南京佳力图公司打造南京楷德悠云数据中心,实现了面向全行业的能力输出。
(三)边缘计算推动大数据中心云边协同化发展
伴随着物联网的发展,边缘计算链接的设备呈爆发式增长。除了电信运营商以外,服务器公司、芯片公司以及内容提供商都积极投入到边缘数据中心建设中。边缘数据中心可以实现设备、传感器、控制系统、业务系统等不同来源数据的快速汇聚采集,实现多源异构数据的有序流动,促使边缘计算的地位和重要性不断提升,云边协同成为可能。据Gartner预测,到2022年将有75%的企业数据由云端集中处理转向云边协同处理。边缘数据中心有利于解决数据不敢传、不能传的问题。针对安全保密要求较高的敏感数据、低能耗低时延数据,可以在边缘侧数据中心进行本地化采集处理,有效保障数据安全,降低了网络延时传输等方面的压力。针对非实时的海量数据,通过云端通用复杂算法开展数据建模分析,可以有效开展纵向横向对比分析,对业务进行全局优化重组,有利于发挥云端数据中心大存储、算力集中的优势,提高数据处理效率。打通边缘侧数据中心和云端数据中心之间的数据传输通道,实现边缘侧与云端协同,有利于促进数据有效流通,进一步释放数据价值。
(四)市场需求强劲为大数据中心发展提供强大动力
在政府导向和市场驱动的双重作用下,我国大数据中心发展迅猛,市场规模一直保持高速增长。政府采购云服务的带动作用日益凸显,很多行业采用云数据中心对原有系统更新以支持业务发展。如,浙江省水利厅将台风路径实时发布系统项目外包给阿里云;甘肃省、新疆维吾尔自治区部分电子政务系统已迁移到第三方的云服务上;贵州省新农合项目使用中国移动提供的云服务,成为卫健系统医疗信息化建设的标杆之一。传统IT架构难以适应客户业务模式的变革需要新的IT系统,云上迁移已经成为IT企业的共同选择,这也推动了整个大数据中心市场的发展。据不完全统计,2019年中国数据中心数量大约有7.4万个,大约占全球数据中心总量的23%,数据中心机架规模达到227万,在用IDC数据中心数量2213个。数据中心大型化、规模化趋势仍在延续。2019年,超大型、大型数据中心数量占比达到12.7%,规划在建数据中心320个,超大型、大型数据中心数量占比达到36.1%。美国超大型数据中心已占到全球总量的40%,与美国相比我国仍有较大发展空间。随着5G商用加速、新基建兴起、国内大数据市场必将迎来广阔发展前景。
大数据中心面临的发展困境
(一)结构性失衡致使大数据中心发展体系化不足
受用户需求、技术基础、建设水平等因素影响,国内大数据中心建设应用面临“大热小冷、东热西冷”的局面。一方面,大数据中心大量集聚在北上广深等一线城市,承载产业升级、城市治理等数字化需求,但也因能源消耗过大、散热要求高而受到收缩政策制约。同时,大数据中心大多为基础电信运营商和互联网龙头企业承建,70%以上IDC机房资源集中在移动、电信、联通三大运营商手中,数据中心资源面向行业、社会开放并转化成服务价值的程度不足,造成了数据中心资源浪费。另一方面,由于托管地域较远、网络稳定性不保障、数据安全性面临威胁,贵州等中西部地区大数据中心虽发展较快,但正步入结构性过剩阶段,整体资源的空置率超过50%,部分区域上架率甚至不足10%,与北上广深等地60%-80%的上架率相比差距明显。分散布局带来的共享问题促使大数据中心加速整合减缓步伐。企业分散办公的现况,带来了相互分散的应用系统布局。然而,企业存在对分支机构数据进行集中处理的需求,远程办公又受困于南北网络无法互通、国际网高延迟等问题,致使总部与分支机构之间难以实现顺畅通信和资源共享。于是,数据中心集中化成为一种必需。据不完全统计,全球2000名以内的企业均朝着数据中心整合的方向发展,数据中心从数以百计缩减为少数几个,应用程序也整合到了少数几台服务器上。在计算资源云化、5G速率大幅提升的带动下,大数据中心整合集中化之势将愈加明显,其建设应用将有可能摆脱对空间距离、设备规模等硬性要素的依赖,从一线城市向周边卫星城、乃至二三线城市逐级延伸,为推动全国大数据中心体系化建设、引导产业要素区域性流动、促进数据资源按行业用户需求均衡化配置提供有力支持。
(二)数据供应薄弱导致大数据中心应用成效低
海量数据为大数据中心孕育了前所未有的机遇,同时也带来了巨大的挑战。由于存储系统仍采用传统架构以及成本等问题,当前大数据中心仅有不到2%的数据被保存,数据“存不下”的问题日益严重。随着信息系统的不断发展,每天企业都产生大量的数据,但传统的数据录入需要预先的人工规划,使得物联网数据、视频数据、图片数据等大量非结构化数据以及一些新型的数据无法进入系统,数据缺失使得对业务的感知削弱,无法真实及时地反映业务的本来面貌。传统组织通常通过数据表来管理和分析数据,规模较大的公司数据表甚至可以达到数百万张,而且分散在各个业务系统中,如果没有统一的数据目录和全局数据视图,要在上百万张表中找特定数据,好比大海捞针,无法应对灵活多变的业务需求。当前,通常一个业务场景需要不同平台的数据协同,需要从多个业务系统获取数据,但是隐私和安全共享机制缺失,数据需要经过多部门协调、联通、核实获取。数据获取的链路冗长,一旦出现问题,需要多方会谈才能解决,无法保障数据供应稳定和高可用性,更无法实现高效的数据融合分析。数据存不下、找不到、管不住等问题导致数据供应有待提升,对业务决策的支持性带来影响,进而影响了大数据中心的应用成效。
(三)内源性数据治理需求掣肘大数据中心效能提升
数据治理制度规则体系建设是实现数据的充分使用、全局流通和有序共享的基础保障。从数据管理来看,数据治理是理清各方权责的“指示灯”。数据治理涉及主体众多,理清各参与方的职责,建立推进机制,是协同各方有效推进工业数据分级分类的组织保障。《数据管理能力成熟度评估模型》(GBT/36073-2018)对数据管理能力设立了5个等级,综合来看,我国大多数机构数据管理能力处于1-2级的水平,数据权属不明、防护不力成为掣肘数据价值释放的关键因素。从数据共享流通来看,数据治理是实现数据共享互认的基本功。传统信息系统建设大多用于单一业务需求,促使数据像“杂货铺”一样分散存储在不同系统中,使用数据时导致找不到,或者找到了不匹配不互认。开展数据治理,做好数据标注分类,推动数据存储由“杂货铺”变成“自动化仓库”,是实现数据共享流通的基本前提。数据的聚合融通,离不开数据的有效管理,更需要数据的安全使用。从数据安全来看,数据治理是确保数据安全的基准线。随着产业互联网的逐步推进,传统信息系统的专有性和封闭性被打破,越来越多的人、机、物暴露在互联网上,数据安全面临的威胁日益加剧,对数据安全治理提出更高要求。结合数据资源属性、安全防护要求,构建数据安全治理体系,分级施策,对确保数据安全至关重要。数据是大数据中心的主要资源,倘若大数据中心的数据只是处于休眠状态,不仅不产生价值,还带来一定的运维成本。加快数据治理,成为激活大数据价值、释放数据潜力、提升大数据中心建设效能的重要抓手。
推动大数据中心发展的政策建议
(一)加强科学规划布局避免大量重复建设
随着“新基建”的推进,云计算服务部署提速,相关设备及服务需求增加,数据中心作为底层数字基础设施有望持续增长,数据中心建设及扩容的步伐也会相应加快。为避免投资过热带来的重复建设和资源浪费,理应从市场需求出发,根据能源、电力、气候等基础条件和比较优势,兼顾用地保障、产业环境、人才支撑等多方要素,科学合理布局,引导大数据中心产业向高纬度电力充沛的地区建设。出台相关政策,推动建设国家一体化大数据中心体系,引导产业健康有序发展,避免数据中心大面积、低水平重复建设。积极推进数据治理体系建设,研究数据跨境跨域融合流通制度规则,为释放数据价值、繁荣数字经济、打造智慧社会练好内功。
(二)重视核心技术研发推动绿色安全发展
加大财政和科研支持力度,鼓励在数据中心节能减排、云服务、虚拟化等技术方面的研发。引导各地数据中心建设积极采用绿色节能技术,切实提高数据中心能效水平。支持华为、中兴等数通设备供应商加强核心技术自主创新,大力发展服务器、交换机、路由器、光模块、软件等基础产品。支持阿里、腾讯等云服务商加快云计算产品、服务和解决方案的开发和应用。加快5G、大数据、人工智能、边缘计算、量子计算等数字技术在大数据中心建设过程中的应用,提升大数据中心发展能级。
(三)完善政策标准体系引导产业良性发展
围绕能源效率、服务质量、评估评测认证、安全管理规范等方面,加快大数据中心综合标准体系建设,充分发挥标准对产业规范发展的导向性和影响力。借鉴发达国家的先进经验,鼓励地方采用政府购买服务的方式应用大数据中心云服务,减少政府自建大数据中心,并逐步将相关应用向云端迁移,通过政府的示范应用,既节约政府 IT支出,又带动产业发展。发挥政府支持与引导作用,通过重点项目投资以及税收优惠、电价优惠等扶持政策,对符合条件的大型、绿色数据中心予以支持。
(四)发挥基础底座作用夯实数字化转型根基
多年来,大数据中心的服务器规模不断叠加翻倍,从机房不断演变集成云计算、区块链、人工智能等多种新一代信息技术,由数据的存储演化为数据加工应用分析的“母机”,成长为整个经济社会数字化运行的基础底座,任何行业的数字化发展都离不开大数据中心的承载与支撑。在疫情突发事件的影响下,大数据中心作为“新基建”承载着经济复苏和社会稳定发展的新使命。未来,随着网络强国、数字中国、智慧社会的建设推进,大数据中心的“母机”作用将愈发凸显,必将带动产业链上下游协同发展,在为经济社会运行提供基础数据支撑中迎来更广阔的发展前景。