目前BGP路由协议的应用也很多,于是我研究了一下BGP路由协议中的同步问题,在这里拿出来和大家分享一下,希望对大家有用。BGP协议规定:一个运行BGP协议的路由器不会把从内部对等体(IBGP邻居)得知的路由信息通告给外部对等体(EBGP邻居),除非该路由信息也能通过IGP得知。若BGP路由器能通过IGP得知该路由信息,则可认为路由能在AS之间传播,内部通达已有保证。
首先,RTB通过EBGP邻居关系,获得了去往AS100的路由信息,例如,去往AS100中的10.1.1.1/24,RTB会把这样的路由信息通告给RTE,RTE收到从RTB通告来的去往自治系统AS100的路由信息10.1.1.1/24。对于RTE来说,她在考虑是否把这样的路由信息通告给她的EBGP邻居RTF时,就需要考虑同步问题。这里的同步是指:RTE如果能通过IGP(内部网关协议,如OSPF协议)获得去往10.1.1.1/24的路由,我们就认为EGP(外部网关协议,如BGP协议)和IGP同步。在同步情况下,RTE可以将路由信息10.1.1.1/24通告给RTF。否则,不能通告。通过上面的叙述,相信大家应该知道什么是BGP同步了。那么BGP的设计者们为什么要做这样一个规定呢?为什么要引入BGP同步的概念呢?下面我们来说说BGP同步存在的重要性和她所解决的关键问题。
BGP路由同步的重要性
依然用上面的例子来解释,如果RTE不考虑同步问题,直接将路由信息10.1.1.1/24 通告给RTF,那么RTF的路由表中就会记录一条去往10.1.1.1/24的路由信息,下一跳是指向RTE的。这样问题就会出现:RTF有一去往10.1.1.1/24的数据包,RTF通过查看路由表,把这一数据包转发给RTE。如果没有同步,RTE的路由表中也会有去往10.1.1.1/24的表项,但是这一表项的下一跳是直接指向RTA的S0接口的(这里的原因参见BGP的下一跳属性)。在不同步的情况下,RTE是无法直接去往此路由的下一跳的(因为路径中途的路由器RTD、RTC都没有去往10.1.1.1/24的路由)。这里有个概念叫下一跳不可达,就是指这种情况。
那么,讲到这里,聪明的读者是不是明白了呢?BGP强调同步的原因就是要保证下一跳可达。用上面的例子来说,就是RTE在考虑把去往10.1.1.1/24的路由信息通告给RTF时,就需要考虑她去往10.1.1.1/24的下一跳是否可达(这里的下一跳就是指RTA的S0接口,此接口是AS200和AS300去往AS100的入口)。如果这个入口都不可达,更不要说访问其内部了。
所以下一跳是否可达的问题是一个关键性问题,BGP强调同步,就是要求RTE所在自治系统的IGP协议能够实现下一跳可达。如果IGP找到了去往下一跳的路由,那么RTE就得到了两个去往10.1.1.1/24的路由。一个是:通过BGP获得的,这个路由的下一跳不可达。另一个是:通过IGP获得的,这一个下一跳可达(关于为什么BGP获得的路由下一跳不可达,而IGP获得的路由下一跳可达,这个问题需要大家对BGP的下一跳属性做进一步了解,这里不再叙述)。
BGP的路由可达和不可达问题
关于下一跳可达和不可达问题,下面做进一步说明。依然用上面的例子。因为在BGP系统中的下一跳是以自治系统为单位的(这一点在BGP的下一跳属性中,有详细叙述)。这样,就会有这样的问题存在,RTE的路由表中有去往10.1.1.1/24的路由,但是下一跳却在很远的地方,以至于下一跳不可达。但是对于IGP来说就不会有这样的问题出现。这都是因为各自下一跳的定义不同造成的(关于下一跳的定义,我们就不讨论了,BGP的设计者这样定义,也是经过综合考虑和选择的)。既然BGP发现的路由有下一跳不可达的问题存在,我们就要解决这样的问题,BGP同步就是解决的方法。
当然同步是可以选择的。在华为3Com3Com路由器上,同步是可以被取消的。取消了同步之后,路由器通告路由时,就不再考虑同步问题了,直接将自己的路由信息通告给EBGP邻居。但是这样就会出现下一跳不可达的问题。所以,我们在取消同步之前就要考虑好如何处理可能出现的下一跳不可达问题。对于上面例子中的情况来说:RTE所在的自治系统里所有的路由器都要知道如何去往RTA的S0接口。只要满足了下一跳可达,取消同步也是可以的。
取消同步以后,满足下一跳可达的方法有很多,需要视具体网络拓扑情况而定。就上面例子来说,可以由RTB将BGP路由引入IGP中,当然这样的做法一般不采用,应为BGP的路由信息量很大,对于IGP来说负担太重。另外,我们可以在RTC、RTD、RTE上增加静态路由,同时在RTA上也增加静态路由。这种办法看起来很笨,也不是最理想的办法。最后,BGP可以通过命令来强制修改下一跳,在RTE上将去往10.1.1.1/24的下一跳强制修改为RTE自身的接口,同时,需要RTD、RTC的路由表中有去往10.1.1.1/24的路由。
这也不是最理想的解决方法。因为可能还是需要借助于静态路由。其实,对于上面例子的拓扑结构,主要是:IBGP邻居不是直接的连接关系,而是TCP连接。BGP路由协议在这样的拓扑结构上的下一跳可达问题,一直没有理想的解决方案。如果这种情况的网络不是很复杂,还是可以勉强解决的(上面已经介绍了几种解决方法)。但是一旦网络复杂了,解决起来就很困难了。所以,在网络设计时,一定要注意避开这种情况。IBGP邻居尽量直接连接。这个问题的彻底解决是在BGP和MPLS联手以后的事情。以后有机会大家再学习!
小结
BGP下一跳属性规定:BGP路由的下一跳是以自治系统为单位的。这样就引出了BGP路由下一跳不可达的问题,为解决路由下一跳不可达的问题,BGP协议引入了同步概念。同步也是可以通过命令取消的,只要能保证路由的下一跳可达,就可以了。