某市电信IPTV平台发现某频道播放优良率差、播放用户少,和全省其它地市相比,此频道用户数和优良率都低很多。经过测试发现,该频道黑屏或卡住不动,无法观看,属于完全断流的故障现象,而其它频道正常。如图1所示,该频道组播地址为:239.93.5.254。
图1 IPTV频道统计信息
根据上述故障现象,进行分析:
1. 根据统计上报故障的用户发现,在不同的OLT和不同的BRAS下都有类似问题,经测试发现该频道只有几秒钟画面,应该是单播画面,组播完全中断。
2. 在OLT上拉流做流量统计。
3. 在BRAS上检查组播表项,做流量统计。
1. 在OLT设备上拉流做流量统计。
通过如上方法在OLT上做239.93.5.254频道的流量统计发现,该组播组一直没有流量,流量没有到OLT上,所以问题应该从上层设备排查。
2. 查看BRAS设备上的组播表项。
在BRAS上可以查到该组播地址(S, G)、(*, G)表项,可知组播表项正常,源端口是上行口xgei-0/0/0/2.1。有组播表项,但是组播断流,需要逐段排查组播流在哪里中断。
3. 由于OLT是直挂BRAS设备,因此需要在BRAS上抓包或者做流量统计,由于整台OLT都没有该频道组播流,因此直接在BRAS上行口做流量统计,检查是否组播流就没有到BRAS。因为BRAS上行口已经绑定了防病毒策略,只需要在防病毒策略里加一条239.93.5.254地址的规则,打开流量统计功能(在规则后加log参数)就可以测试,如下增加一条rule 100:
再次通过命令查看统计结果:
发现匹配次数没有增加,可能原因有:
1)流量没有到达BRAS。
2)流量在前面的deny规则里被匹配上丢弃了,因此还需要再做一次流量统计,把rule 100改到前面再统计一次,这期间OLT上一直保持拉流状态。
4. 修改规则顺序,放到最前面之后发现匹配次数增加,说明这个地址的流量已经到BRAS上行口,肯定是被上行口的其它规则过滤,因此把前面的规则都打开流量统计,删除这条规则permit ip 239.93.5.254 log,发现如下这条规则增长速度很快。
删除这条规则后再测试,OLT上这个组播地址流量统计正常了。
IPTV直播流是通过UDP协议传输,使用UDP端口号,如果端口被屏蔽,流量就会中断,通过上面的排查过程,发现239.93.5.254频道是采用的UDP端口9996,和BRAS上行口的防病毒端口策略一致,被BRAS上行口丢弃,所以组播流中断。IPTV平台开通新频道定义端口时需要避免使用公认常用的病毒端口。
以上排查过程使用了设备的流量统计功能,对于分段排查流量丢包有帮助,但需要尽量精确了解流量特征,便于快速定位。
1. 中兴通讯OLT组播流量统计方法:
2.中兴ZXR10 M6000-S做BRAS设备流量统计方法:配置ACL访问列表,加log参数,打开统计功能。
V3版本具体配置方式如下:
V5版本具体配置方式如下: