【51CTO.com 独家译稿】若超大规模存储网络像城市交通一样去进行粗放型管理的话,其结果有多么恐怖完全可想而知。交通堵塞,延迟和数据丢失……网络架构管理与道路交通管理不同,它具备实时流量监控和用于故障排除的端对端视图功能。
不过我们要考虑到任务的难易程度。若一个网络有800个服务器和网络适配器,300个交换机,2个控制器和50个存储阵列,还有1150个网络设备和超过5000个的网络端口-这种规模并非具备云标准的特殊超大型网络架构所独有-市面上常见的架构管理系统同样可以轻松扩展到9000个交换端口和20000个终端设备。在这种情况下,我们根本无法通过监控屏幕中的状态信息来搞定全部设备及端口的问题,更不用说进行故障排查了。
这项工作相当复杂。我们首先要对这个网络进行路径配置,并建立域,还要尝试创建不同的流量策略并确保网络资源的合理运用,避免低优先级应用占用高优先级应用的流量资源。
如上所描述,这样的网络就需要智能网络架构管理系统了。事实上我们几乎可以断言,如果没有这套系统,上述网络完全无法加以管理。
它们也没有足够的监控设备和网络端口。网络是一个单一的实体,并提供了服务器应用、存储阵列和外部服务之间的数据传输服务,还有管理系统应监测服务级别和进行端到端的管理。
端到端
让我们还回到那个城市交通的比喻上,端到端的监控就像是监测纽约大中央火车站和Laguardia机场之间的道路一样。也许这样的比喻有点可笑,在市区或是城镇中进行端到端的监控是不切实际的。然而同样的监控手段却是数据网络正常动作的必备条件,没有它的话,我们将无从搞清设备故障到底影响到了哪些网络服务项目。
通过像思科Fabric Manager和博科的数据中心网络架构管理系统(IBM的OEMed)这样的产品,你可以自定义网络架构中端到端的流量监测规则。它们可以对流量和网络通信时间之类的数据进行实时记录,这些统计数据可以保存到历史记录当中。
博科DCFM界面
这个系统也可以监控单个设备,如果设备的使用频率超过了设置的初始值,它就会发出警报。通过这个软件我们就可以及时管理调试这些设备,比如交换机和交换机端口,还有网络架构中的应用服务和需求响应什么的都可以查看到。如果某项端对端服务开始出现故障,那么立即会有相应的单独设备信息被发送到管理人员手上;该信息将在识别交换设备问题、寻找服务失败原因以及之后的补救方案实施方面带来发挥巨大的作用。
不要只顾服务端口
在云计算环境里,网络架构的管理不能只看服务入口,网络或者SAN这些端口,还要顾及全局。网络的存在是为了提供服务,但网络本身无法直接完成这个功能,而是需要通过服务中的应用程序方能实现。随着虚拟化技术的快速发展,VMware技术现在已成为了主导力量,这也就促使了网络架构管理也必须与虚拟化相结合,具备虚拟感知功能。
虚拟机终端应用也应被包含在端到端的服务管理当中,同时显示在监测管理的界面里。设备管理器应该与接驳到网络中的每台物理服务器上的管理程序结合起来,并对虚拟机信息加以访问,这样管理器就能够将设备与其在管理程序中无法查看的对应网络信息加以连接。
Cisco Fabric Manager程序界面
网络架构管理系统可以进行单个虚拟机设置和QOS配置,还具备一些访问权限和加密的特殊性能。#p#
整体网络
这里有个客户,他的网络架构是由SAN服务器,网络服务器,分支办公网以及灾难备份这些基础架构组成的,其中的每个部分都需要进行管理,那么网络架构系统可将这些部分加以整合,提供一个整体的管理方案。
存储网络、服务器网络甚至是数据中心管理也应该整合在一起。随着数据中心与虚拟化技术的逐渐靠拢,网络架构管理也向着物理与虚拟资源的管理方向发展。架构管理系统向管理员开放一些虚拟资源的端口,这样他们就可以进行一些配置,增建新的虚拟机以供扩展。
再例如,虚拟机管理员可以通过面板新增了一个虚拟机并进行QOS的配置,然后架构管理系统就可以自动进行存储,带宽,安全和审计管理,并且启动监测功能。
当虚拟机从一个服务转移到另一个服务,在这个转移过程中,网络架构系统就可以监测到这个过程,比如在网络架构中重新配置路径什么的。
超大规模网络
道路交通管理是一个庞大并且复杂的结构,其中包含了高速公路的上百个出口和入口、红绿灯、立交桥、信息提示牌和成千上万的道路标志、限速标志和其它一些道路基础设施。
将单独的实例提供给负责传递服务的载体,最终使其到达指定的方位,这基本上就是通路管理的简单模型了。听起来没什么技术含量吧?但要知道,如果需要管理的是整个城市的道路交通网络,实际难度可就不是一个级别的了。
晚间的高速公路
将会有数百万的出入口,数百万的基础设施和标志,数百万的红绿灯和斑马线,而且还有多种多样的交通工具,公共汽车、自行车和行人,还有不同的高速公路类型等等……云网络就是这个类型的网络。
与城市不同,城中的人们可以任何时候做任何自己想做的事,但是一个大型网络架构则有它自己的固有规律和管理规则,并且只能通过网络架构管理系统去监测网络服务、端到端的服务、以及虚拟机、物理机和终端用户的动态。
然后,当城市中发生了特大交通拥堵状况的时候,我们可以坐在咖啡厅里,通过安全有效的远程登录继续完成手头的工作,因为至少我们的网络"还能用"。
【51CTO.com独家译稿,非经授权谢绝转载!合作媒体转载请注明原文出处及出处!】