圖1.SPB的基本結構示意
SPB的基本結構如圖1所示:多臺服務器A/B /C通過交換機1/2/3二層互聯(lián)。服務器之間的流量可以通過二層路由協(xié)議計算的最短路徑轉發(fā),而不必依賴于傳統(tǒng)STP形成的繞行網絡拓撲轉發(fā)。這樣 SPB可以有效的提高二層網絡流量轉發(fā)效率。同時,SPB還可以通過二層路由協(xié)議在多條轉發(fā)路徑之間形成等價路徑,對流量進行負荷分擔,提高網絡整體的利用效率和HA性能。
SPB的優(yōu)勢主要體現(xiàn)在以下四個方面:
● 基于拓撲計算的最短路徑能夠有效減少轉發(fā)跳數(shù),提高轉發(fā)性能;
● 基于等價路由的多鏈路負載均衡(最大16條),能夠有效的提高帶寬利用率;
● 基于等價路由的快速切換能夠保證100毫秒內的故障切換;
● 管理簡單,網絡規(guī)??蛇_1000個節(jié)點。
1.SPB協(xié)議族的結構
圖2.SPB協(xié)議組的架構
如圖2所示,SPB協(xié)議支持兩種模式:
1、Q-in-Q模式稱為SPBV,目前在業(yè)界基本沒有應用;
2、M-in-M模式稱為SPBM,是目前的主要推薦模式。本文將針對SPBM展開介紹。
無論是SPBV還是SPBM,在控制平面都是基于L2IS-IS實現(xiàn)拓撲發(fā)現(xiàn)、管理。在協(xié)議的具體實現(xiàn)思路方面兩者是一致的。
M-in-M是指MacinMac技術,也稱為PBB(見附錄介紹)。PBB定義了二層網絡中的數(shù)據(jù)轉發(fā)流程,但是PBB本身沒有定義控制流程。也就是說二層網絡的拓撲控制、二層環(huán)路管理都必須依賴于傳統(tǒng)的STP等技術,這就直接降低了PBB應用的可行性。因此PBB迫切需要定義一套控制流程,使其能夠有效的替代STP協(xié)議管理大規(guī)模二層網絡的拓撲和環(huán)路,SPBM應運而生。
SPBM和PBB的關系可以簡單地概括為:SPBM+PBB=完整的二層網絡技術,其中SPBM是控制平面協(xié)議,而PBB是數(shù)據(jù)轉發(fā)層面協(xié)議。
2.SPBM的轉發(fā)路徑管理
如前文所述,SPBM基于PBB技術,可以看作是PBB的控制流程協(xié)議:
1、SPBM管理二層網絡的拓撲、環(huán)路,計算路徑等;
2、PBB根據(jù)SPBM計算的路徑進行轉發(fā)。
當然,PBB分為骨干網和接入網兩個層次。接入網層次較低,規(guī)模可以規(guī)劃控制,是標準的二層網絡,可以采用STP或其他二層技術來管理控制。SPBM的目的是通過L2IS-IS協(xié)議學習骨干網的拓撲,計算最短轉發(fā)路徑和等價路徑,指導報文在骨干網上做最優(yōu)的二層轉發(fā)。
● SPBM多實例的概念
SPBM在骨干網上存在多實例的概念。如圖3所示,SPBM的UNI相當于VPLS技術的PE設備,負責外層標簽的封裝與解封裝;而NNI相當于VPLS技術的P設備,負責根據(jù)外層標簽轉發(fā)報文。
SPBM的多實例類似VPLS的VSI概念,即在同一個物理網絡上形成多個相互獨立的邏輯轉發(fā)實體,彼此之間邏輯隔離。圖3中不同的顏色代表不同的實例(指BVID:BVlAN1/2/3/4),它們在相同的物理拓撲上形成不同的邏輯拓撲,,經過計算形成不同的轉發(fā)路徑(指不同的出接口 Interface)。
圖3.SPBM的原理架構
SPBM的單播轉發(fā)管理
SPBM的單播轉發(fā)從本質上與標準的L3IS-IS路由網絡非常類似。如圖4所示,在實例I-SID5中,節(jié)點A計算骨干網上到各節(jié)點的最短轉發(fā)路徑。
圖4.SPBM的單播路徑計算原理
節(jié)點A通過IS-IS協(xié)議相互通告鄰居網絡信息,學習到整網的拓撲信息,然后計算出整個骨干網的拓撲結構?;谶@樣一張標準的拓撲圖,節(jié)點A計算從本節(jié)點到其他各節(jié)點的最短路徑,形成最優(yōu)轉發(fā)路徑。如果存在多條轉發(fā)路徑等價的情況,則需要通過特定的算法–等價路徑算法(ECT:EqualCostTree)計算本實例應該選定的路徑。
SPBM的等價路徑算法相對比較復雜,其基本思路是:
1、在任一實例中,計算任意節(jié)點到另一節(jié)點的最短路徑,存在等價路徑;
2、分別計算各條等價路徑的Key值;
3、比較各條等價路徑的Key值,取最小的Key值對應的路徑作為轉發(fā)路徑。
Key值計算公式為:
1、N=min{BridgeIDXORMASK[i-1]}
2、#N=BridgeID
公式中的BridgeID是用戶指定的交換機ID,是用戶直接配置的數(shù)據(jù),相當于一個唯一的編號或名字。
公式中的MASK[i]是一個標準協(xié)議中定義的數(shù)組,數(shù)組大小是16。由協(xié)議為該數(shù)組指定具體數(shù)據(jù),對應16個不同的實例。當前協(xié)議中定義的數(shù)組是:00ff88774433ccbb22116655aa99ddee。
SPBM的組播管理
圖5.SPBM的組播管理
SPBM的組播與傳統(tǒng)的三層網絡組播管理很類似,都是基于單播管理,在單播管理形成的轉發(fā)路徑上計算組播路徑。如圖5所示,節(jié)點A作為源節(jié)點,D/E/F節(jié)點是葉子節(jié)點。通過圖3中形成的單播轉發(fā)路徑,節(jié)點A計算到各個葉子節(jié)點之間的組播轉發(fā)路徑,形成圖5所示的組播樹。其中,
不同的實例中,定義不同層次的組播樹,相互獨立;
每個實例中,每個節(jié)點有以自己為根的獨立組播樹。
1.大中型規(guī)模數(shù)據(jù)中心:兩層的SPBM組網模型
大中型數(shù)據(jù)中心對于二層網絡的組網要求可以概括為:
○ 管理成百上千臺交換機形成大規(guī)模二層網絡;
○ 支持最短路徑轉發(fā),提高轉發(fā)效率,降低網絡時延;
○ 支持等價多路徑轉發(fā),提高網絡帶寬利用率;
○ 支持多租戶網絡運維管理。
其組網應用方案如下:
圖6.SPBM在大中型數(shù)據(jù)中心內部的組網架構
圖6中紅圈標注部分即是SPBM的骨干網部分,接入層交換機與服務器的虛擬交換機部分即是SPBM的接入網絡,由IRF技術實現(xiàn)二層管理(或 STP)。在SPBM的骨干網里,可以實現(xiàn)最大16條等價路徑,也就是說數(shù)據(jù)中心的二層網絡的匯聚交換機最大可以支持16臺。匯聚換機的數(shù)量越多,容量越大,可以接入的服務器數(shù)量也就越多??梢杂行У財U大數(shù)據(jù)中心服務器的容量和虛擬機的數(shù)量,提高數(shù)據(jù)中心的規(guī)模。
同時,SPBM可以保證骨干網的HA性能,確保任意節(jié)點、任意鏈路出現(xiàn)異常后,能在毫秒級時間范圍內保證業(yè)務恢復正常。這一點能夠有效的提高數(shù)據(jù)中心的HA性能,提高用戶的業(yè)務體驗。
部分運營商的核心數(shù)據(jù)中心或是超大企業(yè)的數(shù)據(jù)中心需要部署在同一個二層網絡中的服務器規(guī)模非常龐大(例如超過2萬臺服務器)。兩層的SPBM組網模型有可能無法滿足其超大規(guī)模的接入密度,所以需要調整SPBM的組網模型,進一步擴展整個二層網絡的規(guī)模,將二層組網結構改成三層組網架構(如圖7所示)。
圖7.SPBM在超大規(guī)模數(shù)據(jù)中心內部的組網架構
需要說明的是,SPBM相對比較復雜。將二層SPBM結構調整為三層SPBM結構后,固然可以增加數(shù)據(jù)中心二層網絡規(guī)模。但代價是進一步增加了網絡構建和運維的復雜程度,提高了運維成本。
大規(guī)模乃至超大規(guī)模數(shù)據(jù)中心畢竟仍是少數(shù),大部分數(shù)據(jù)中心的規(guī)模都在5000臺服務器以下。很多企業(yè)為了降低數(shù)據(jù)中心的建設成本,租用運營商的機房或機架空間,將數(shù)據(jù)中心部署在運營商機房中獨立運維,可以視為一個獨立的企業(yè)數(shù)據(jù)中心。運營商的數(shù)據(jù)中心運維管理也不包括這部分服務器。
這些小型數(shù)據(jù)中心,一個最顯著的特點就是用戶的運維水平以及對新技術跟蹤掌握能力有限,所以SPBM的管理壓力會讓用戶很難接受。用戶希望網絡能夠支持VLAN擴展方案,便于其做多租戶配置,但又不希望網絡配置過于復雜,增加運維難度和風險。簡單總結小型數(shù)據(jù)中心虛擬化二層組網的需求如下:
1、二層網絡規(guī)模較小(覆蓋5000臺服務器以下);
2、盡量避免新技術帶來的學習、管理、運維壓力;
3、支持多租戶。
IRF+PBB為其提供了更加簡單的組網方案,降低對新技術的難度要求。
傳統(tǒng)的IRF+LACP組網方案是目前替代STP組網的的最佳方案。從IRF技術開始正式商用到現(xiàn)在已經有8年的時間,在市場上得到了廣泛的應用。方案非常成熟,運維管理簡單。PBB同樣是非常成熟的技術,用戶也不存在運維方面的壓力。
圖8.PBB+IRF在數(shù)據(jù)中心內部的組網架構
如圖8所示,在這個簡化的組網方案中,最大的特點是在匯聚交換機層面利用4臺交換機IRF虛擬化替代了復雜的SPBM協(xié)議。在匯聚交換機和接入交換機之間只需要配置簡單的LACP協(xié)議。這樣整個網絡的控制平面就是傳統(tǒng)的IRF結合LACP技術。將極大地簡化配置管理和運維管理復雜度。
在數(shù)據(jù)中心轉發(fā)平面,是標準的PBB協(xié)議(見附錄介紹)。PBB協(xié)議支持VLAN擴展功能,可以支持多租戶的應用。
結束語
數(shù)據(jù)中心的集中化、規(guī)模化運營可以有效的降低整體運營成本。服務器的虛擬化可以有效提高資源利用率。因此,未來的數(shù)據(jù)中心一定會向規(guī)劃化、虛擬化的方向發(fā)展。同時,更多企業(yè)客戶為了降低數(shù)據(jù)中心的建設、運維成本,會選擇將數(shù)據(jù)中心租用或托管的方式交由第三方運營管理。這樣多租戶也成為未來數(shù)據(jù)中心發(fā)展的必然方向。
從SPB協(xié)議的定制角度來看,其根本的目的就是要解決大規(guī)模二層網絡的多租戶應用。因此,SPB技術與數(shù)據(jù)中心的發(fā)展趨勢是契合的,未來可能會在大規(guī)模和超大規(guī)模的數(shù)據(jù)中心網絡中得到廣泛的應用。