企业需要在SD-WAN中构建必要的信息,以预测问题并采取纠正措施。只有这样,SD-WAN才会继续工作。自我修复SD-WAN动态地补偿网络中的错误,从而***限度地减少对更高层次服务(即应用程序)的干扰。与SD-WAN相关的自我修复涉及以下四个功能:
- 监控支持SD-WAN的设备和链路,收集低级统计信息,如丢包、延迟和抖动。
- 检测线路特征何时超过定义的阈值或底衬的某些部分变得不可用。
- 理想情况下,采取行动抢占和提醒网络问题。
- 调整安全性和其他支持网络服务,以***限度地减少并防止应用层中断。
这些功能必须在全球网络的所有层面实施,包括设备,站点,区域和全球网络。
在设备级别,自我修复的SD-WAN必须防止组件故障,例如支持设备中的电源或硬盘。至少这意味着防止SD-WAN接入设备中的组件故障。如果其他设备对于企业网络至关重要,例如防火墙或WAN优化设备,则需要保护这些设备免受组件故障的影响。
在站点级别,自我修复的SD-WAN不仅可以从支持SD-WAN的设备完全故障中恢复,还可以解决该设备路径中以及***一英里的限制和停电问题。在网络设计中应将冗余的路径放置到设备所在的位置,然后采用双归位接入线路接入互联网。正如该公式所示,即使是双宽带连接也可以接近MPLS的理论可用性,但这假设宽带基础设施的所有部分都是冗余的,包括访问SD-WAN设备。实际上,这意味着SD-WAN分支设备的HA配置必须足够简单,任何人都可以部署,并且价格合理,可以广泛采用企业。
自我修复的SD-WAN必须能够补偿数据包丢失,特别是在网络条件最常见的***一英里。诸如分组复制之类的分组丢失校正技术已经很好地建立。如果丢包率过高,或者应该停电,那么自我修复的SD-WAN将根据业务优先级控制流量不足的链路周围的流量。实际上,大多数SD-WAN解决方案提供***一英里自我修复,在主动/主动配置中运行,实时监控线路性能,然后使用基于策略的路由和应用程序配置文件将流量引导到***链路。
区域和全球层级的自我修复
当您转向网络核心时,问题将根据您的SD-WAN架构而有所不同。当SD-WAN解决方案仅依赖于互联网时,与SD-WAN边缘解决方案的关注一样,对区域和全球网络的可达性的关注较少。在这些网络中经常(但肯定不是总是)存在重要的路径和冗余以防止完全中断。然而,人们非常担心停电问题。全球互联网连接的不稳定和往往较差的表现已有详细记录,显示延迟和丢失率远高于私人管理网络。
对于依赖互联网访问本地存在点(PoP)但是私有管理主干而不是互联网来连接这些PoP的SD-WAN,情况恰恰相反。对于私有骨干网,SD-WAN的延迟通常会超过互联网的延迟,但可达性是另一个问题。IT经理必须检查这些SD-WAN中是否内置了足够的智能,路径和冗余,以确保自我修复。
更具体地说,这意味着在区域级别,PoP组件需要在内部中断的情况下通过它们之间的故障转移而变得冗余。如果站点失去与PoP的连接,无论是由于路径问题还是由于组件故障,它们都应该自动重新连接到下一个最近的PoP,这个过程应该继续,直到连接到PoP。
在全球网络的核心内,PoP本身需要从线路中断中恢复并控制故障链路周围的流量。全球中间距离的延迟尤其重要。PoP应该能够考虑直接和间接路由,为每个应用选择它们之间的***路径。如果一个PoP到PoP连接出现掉电或停电,则应采取替代路径。
自我修复和应用
最终,自我修复的目标是防止网络中断影响业务。在连接之间进行故障转移或故障恢复是不够的,必须根据业务优先级来适应不断变化的流量模式。同样,自我修复网络还必须调整支持跨全球网络交付应用程序的其他设备和服务,例如安全策略和WAN优化规则。
如果不这样做可能会阻止用户访问应用程序和资源,即使SD-WAN已适应中断。例如,两个物理数据中心之间的vMotioning工作负载可以成功,但用户可能仍然无法访问该应用程序。需要更新第二数据中心防火墙中的安全规则,以允许访问出现在第二个数据中心的现有新IP。自愈网络必须解决这种情况,更新必要的网络服务以防止应用层中断。
在设计SD-WAN时,要考虑到每一种可能的故障转移场景是不可能的。我们需要在SD-WAN中构建必要的信息,以预测问题并采取纠正措施。只有这样,我们的SD-WAN才能在停电时继续工作。