NFV是使能网络重构的关键技术,从2013年初正式成立ETSI ISG NFV开始设计NFV框架及系列规范,已经经历了Gartner技术成熟度曲线的创新促动期、过高期望期,逐渐转向稳步发展,经过近两年针对vIMS, vEPC, vBRAS等各专业虚拟网络的实验室测试、现网试点,目前尚未有大规模商用,包括运营商和厂商都开始更加谨慎的推进NFV落地工作。
NFV最初的目标是通过软硬解耦实现硬件资源在多个网络系统之间的共享,一方面引入大规模标准化的通用IT基础设施降低成本,另一方面通过软件部署方式加速新业务上线和更新。理想很美好,现实很骨感,在实施部署的过程中发现:CT系统与IT系统在设计方式、规模和复杂度、可靠性要求、互操作要求、运营维护等方面都有显著的差异,借用IT技术和思维方式来解决CT问题,可能会有点水土不服。
为了实现NFV真正的大规模落地部署,还需要解决以下问题:
1. 提升NFV转发性能和可靠性
CT系统比IT系统对性能有更高的要求。CT网元大体可以分为控制类和转发类的。
控制类网元需要提供高可靠性保证,典型网元如4G核心网的移动性管理实体MME,负责处理4G用户接入移动核心网的信令交互,包括认证鉴权接入控制、移动性管理等关键控制功能,而不进行用户业务数据的转发,因此经过MME的流量具有小流量、大并发、高可靠性要求的特征。传统的物理MME设备可以同时处理百万以上并发用户会话,如果换用X86服务器加vMME来承载,势必要求部署多台服务器,并且提供负荷分担和高可靠HA方案。
转发类网元需要提供高吞吐量线速转发,典型网元如宽带远程接入服务器BRAS,负责宽带业务的接入控制和和流量汇聚转发。BRAS有多种虚拟化形态,典型的包括:转控分离的vBRAS,使用基于X86的控制面和基于NP专有设备或可编程白盒交换机的专有转发面设备,即只实现了控制面虚拟化;基于标准X86的一体化纯软vBRAS;转控分离的vBRAS,控制面基于标准X86服务器,转发面基于带有加速硬件的X86服务器。对于只进行控制面虚拟化的vBRAS,本质上与传统物理BRAS没有太大差别,只是实现了集中的IP地址管控和设备配置管理,无法改变专有设备研发采购部署上线周期长的问题。基于通用X86服务器的一体化vBRAS,即使应用了DPDK等软件加速技术,从转发性能角度考虑,与传统物理BRAS设备单板卡已经实现的百G以上线速转发相去甚远,因此基于X86的一体化vBRAS主要用于承载ITMS等小流量大session的业务,而无法承载家庭宽带上网、IPTV等业务。使用X86服务器加智能加速硬件来提升vBRAS转发性能,成为vBRAS进行全业务承载的一种重要解决方案,但是硬件加速必然降低了NFVI的通用性,为了特定CT网元而对NFVI提出特殊的要求,似乎又违背了NFV的初衷。
从规模角度考虑,转发类网元的部署规模一定是远超控制类网元的部署规模的,NFVI的成本与IT基础设施规模有密切关系,服务器的出货量直接影响采购价格,所以NFV的经济效益依赖大规模部署,只有转发类网元完成了虚拟化部署,才能推动NFV大规模落地。从这个角度讲,使用硬件加速技术来解决NFVI的转发性能问题,目前看来是必由之路,是CT网元对NFVI必须提出的要求。使用可插拔的智能网卡卸载部分软件功能,减少对CPU和PCIe带宽的消耗,是一种值得期待的相对通用的硬件加速方案。同样作为智能网卡,从实现角度又分为基于ARM架构的、基于FPGA的等多种产品。由于FPGA具备比较强大的反复可编程性,一方面实现X86 vBRAS与物理BRAS单板卡可比拟的转发性能,另一方面支持未来新增功能的开发部署,更加符合NFV采用通用硬件和快速部署软件的理念。只不过FPGA智能网卡的价格同样依赖于出货量,目前相比普通网卡贵了很多,但是未来如果能够形成产业链和大规模商用,综合考虑在CPU节省的成本和智能网卡增加的成本,还是可行的。
2. NFV解耦和标准化
NFV期望实现的统一基础设施、新业务快速部署、更加开放的生态系统等优势,都必须依靠解耦来实现。软硬两层解耦是最基本的目标,否则与传统的一体化专有设备没有本质区别。但是实际上按照ETSI定义的NFV框架和产业发展情况,目前NFV产业链可以划分为更多层次的阵营:
- 硬件:服务器厂商
- 平台:Hypervisor厂商
- 功能软件+管理:VNF+VNFM+VIM厂商。由于这三个模块间交互频繁,存在一定的绑定关系,因此通常VNF的厂家也同时提供VNFM和VIM。
- 编排:NFVO。由于需要对跨厂家的网络业务和资源进行全局管理,很多运营商选择自研NFVO,或者选择相对中立的第三方厂家进行深度定制开发。
为了不被少数厂家绑定,以及需要进行跨厂家的编排管理,上述4个部分必须进行解耦。成功解耦有两条评判标准:一是来自不同厂商的各个模块能够正常互操作,实现NFV网络的基本业务功能;二是功能软件在不同的硬件和平台上可以实现稳定一致的性能表现,符合NFV网络的性能要求。
复杂通信系统的解耦和跨厂商对接,依赖全球统一的技术标准,只有大家都遵循相同的bit级技术标准,才能完成两个通信设备的互通。3GPP无疑是最成功的通信国际标准组织,3GPP定义的GSM、WCDMA、LTE/EPC以及即将发布的5G标准,奠定了几代全球移动通信系统研发和大规模部署的基础。严格来讲,ETSI ISG NFV定义的并不是国际标准,而是引导NFV产业的通用行业规范。ETSI的规范定义工作一般分阶段进行,NFV规范从2013年初至今,已经完成了两个阶段的定义,目前正在进行第三阶段的工作。从概念的提出,到架构、功能、接口和信息模型的定义,NFV规范也在不断完善中,但是前两个阶段输出的规范并不足以作为各个模块互通的依据,第三阶段的工作由于涉及到各厂家产品如何更改,讨论更加激烈,并且熟悉通信标准玩法的传统设备厂商没有推进NFV标准发展的动力,导致标准进展不容乐观。另一方面,NFV相关的各开源项目原本就是野蛮生长,谁做成事实标准谁说了算,更是一盘散沙,以至Linux foundation也开始整合旗下各大项目。基于开源代码的产品同时也有各厂家私有的优化开发,存在太多不确定性,很难成为CT领域的商用产品。
综合上述原因,目前能够实现NFV全解耦的也只有一体化vBRAS这样的简单网元,并且也是运营商耗费了大量精力推动各个厂家逐一对接实现的。作为更为复杂的vIMS、vEPC等系统,还需要更多的工作来实现全解耦。
3. NFV网络可采购可运营
目前国内运营商通常按年度进行各专业传统网络设备的滚动规划和集采。这些网络设备在进入采购环节之前,一般以黑盒方式接受运营商的集采测试,通过后进行招投标,中标后设备发送到运营商省市公司,再进入机房安装配置加载业务。从测试到采购,再到分省市的设备到货和上线部署,周期漫长,并且经常出现中标产品与到货产品价格/配置不一致的情况。NFV的出现也是为了弥补这些传统设备采购运营的缺点,期望通过采购部署统一的资源池,再以软件方式快速部署网络功能,加速业务上线。但是分层解耦后的NFV网络,从采购到运营,也都需要分层解耦。
首先,从集采测试考虑,分层解耦需要进行各种组合的功能和性能测试,测试工作量随着每一个应标厂家的增加都将出现成倍的增长,每更新一次软件和平台版本也都要重新遍历各种组合的测试。要想满足未来NFV网络的集采测试需求,必须搭建覆盖全专业的完善的测试床,并且采用自动化的集成测试方法。
其次,传统网络设备由单一厂家提供,出现任何问题都责无旁贷。NFV网络分层解耦后引入了更多的厂家,一旦发生故障,首先需要定位是哪一层出现了问题,否则极易出现不同厂家互相推卸责任的情况。软件问题相比硬件问题更难定位,涉及到多厂家软件配合的,究竟由哪一方来修改,很难得到客观的结论。
因此,未来NFV网络的采购和运营,需要运营商具备强大的系统集成能力,还需要配合组织架构、业务流程、责任划分等方面的调整。
综上所述,NFV网络在大规模商用部署前还需要解决转发性能和可靠性、解耦和互操作标准制定、采购运营等方面的问题。运营商的网络重构影响的是整个通信行业,期待能够联合整个产业界共同解决上述问题,推进网络重构的实施和落地。