文章重點介紹銳捷“跨數據中心大二層互聯技術”---L2GRE。文中出現的字母縮略詞,請對照文章后面的“術語清單”。

WHAT:什么是“跨數據中心大二層互聯技術”?

跨數據中心二層互聯技術就是指要實現把二層廣播域從一個數據中心擴展到另外數據中心的技術,突破在傳統三層網絡結構下一個二層VLAN的范圍被限制在網關之下的局限,滿足虛擬化、高可用等技術對跨數據中心大二層環境的需求。

常見的跨數據中心二層互聯技術有:

  • 銳捷的數據中心級L2GRE技術
  • 基于IP 核心網的NVGRE, VXLAN技術
  • 承載于裸光纖DWDM的二層互聯方案
  • 承載于MPLS網絡的VPLS方案

WHY:為什么需要“跨數據中心大二層互聯技術”?

主要有以下三類原因需要跨數據中心部署二層環境:

1. 跨數據中心的心跳鏈路

在分布式雙活或者多活的數據中心環境下,服務器或者網絡設備往往需要跨數據中心進行集群部署,這些集群可能是業務軟件層面的集群、主備服務器之間的集群等,同一個集群系統內部的不同節點之間需要保持一個心跳信令,而這些心跳信令一般要求通過二層網絡傳輸。

2. 跨數據中心的虛擬機遷移

虛擬機遷移的核心技術是虛擬機內存及CPU運行狀態在不同物理機之間的拷貝,遷移前后的兩臺物理機通過“共享存儲(Shared Storage)方式”或“雙活存儲(Active-Active)方式”共享相同的虛機映像文件,因此虛擬機遷移需要在一個二層環境下才能完成。

3. 跨數據中心的災備流量

在主備數據中心模式中,當某些業務系統從主中心遷移到備份中心后IP地址保持不變。此時就需要將用戶請求從主中心轉發到備份中心處理,之后再將反饋數據回傳到主中心,通過主中心的網關送給最終用戶,因此需要在跨數據中心部署二層鏈路。

此外,銳捷的L2GRE技術還能夠解決客戶多個數據中心二層互聯的更多棘手的問題!比如:

1. 多數據中心之間的二層環路問題如何避免?當客戶根據業務擴容需求計劃建設第三數據中心的時候,要實現三個(或者三個以上)數據中心之間的兩兩二層互聯,采用傳統DWDM等技術實現二層互聯會形成一個跨多中心大二層環路,造成不必要的廣播風暴。而采用銳捷的L2GRE技術部署多數據中心二層互聯,L2GRE特有的“水平分割防環機制”能夠完美解決這個問題,其原理是通過L2GRE隧道接收到對端數據中心的以太幀只會在本數據中心內部轉發,不會再轉發到其他數據中心,如圖1所示DC4的數據幀通過L2GRE轉發給DC2,DC2不會再把該數據幀轉發給DC1或者DC3。

(圖1:L2GRE水平分割)

2. 數據中心之間的廣播風暴如何避免?為了減少目的MAC地址為廣播MAC的報文通過數據中心間二層鏈路泛洪到核心網,在邊緣設備偵聽從隧道終結的報文中的ARP應答報文,在本地建立ARP緩存,當后續本站點內部的相同ARP請求直接從邊緣設備進行代答,減少數據中心之間鏈路負擔。

WHEN:何時需要部署“跨數據中心大二層互聯技術”?

當您遇到以下三種場景的時候需要部署“跨數據中心二層互聯技術”:

場景一:服務器跨數據中心集群部署(需求:跨數據中心的心跳鏈路)

在雙活或者多活數據中心環境下,服務器或者網絡設備等跨數據中心實現集群,兩個數據中心的IP地址使用同一網段,此場景需要跨數據中心部署二層互聯技術。

場景二:虛擬機動態遷移(需求:跨數據中心的虛擬機遷移、跨數據中心的災備流量)

遷移至另一中心的虛擬機不僅保留原有IP地址,而且還保持遷移前的運行狀態(如TCP會話狀態),所以必須將涉及虛擬機遷移的物理服務器接入同一個二層網絡(虛擬機在遷移前后的網關不變),這種應用場景要求構建跨中心的二層互聯網絡。

場景三:服務器跨數據中心搬遷(需求:跨數據中心的心跳鏈路、跨數據中心的災備流量)

對數據中心進行擴建或搬遷時,需要將物理服務器從一個數據中心遷至另一個數據中心。在此過程中,考慮以下兩個因素,需要在數據中心間構建二層互聯網絡。

1) 當服務器被遷至新機房,若未構建新老中心間的二層互聯網絡,則面臨重新規劃新中心服務器IP地址的問題。同時還需修改DNS,或修改客戶端應用程序配置的服務器IP。因此,構建跨中心的二層互聯網絡可保留被遷移服務器的IP地址,進而簡化遷移過程。

2) 在服務器搬遷期間,經常在給定的時間內,只能將服務器群的一部分服務器遷至新中心,為保證業務連續性,需建立跨中心的服務器集群,因此構建跨越中心的二層互聯網絡可實現服務器平滑遷移。

HOW:銳捷如何實現“跨數據中心大二層互聯技術”?

“一個基本原理”概述L2GRE技術實現:

L2GRE(二層GRE) 是一種在IP核心網通過GRE遂道提供L2VPN服務的技術。是一種先進的“MAC in IP”技術。它可以基于現有的運營商各種專線網絡或者因特網,為分散的物理站點提供二層互聯功能。基本原理如圖2所示,當MAC1要去訪問MAC2時,開啟L2GRE的邊界設備對MAC1進行IP封裝,使二層數據幀通過三層網絡傳輸到MAC2所在的右邊的站點2,并在開啟L2GRE的邊界設備進行解封裝:

(圖2:L2GRE基本原理示意圖)

“三場PK”展現L2GRE的優勢:

第一場: “裸光纖/DWDM”vs“L2GRE”:

裸光纖/DWDM:成本高,主要應用于同城站點之間,難于擴展。

L2GRE:可用于多種專線鏈路或者Internet鏈路上,成本低,距離遠,易于擴展,而且L2GRE天然支持水平分割防環機制,以及廣播風暴抑制功能,減少數據中心之間鏈路負擔。

第二場:“VPLS”vs“L2GRE”:

VPLS:通常需要增加專門的PE設備為站點間的核心交換機建立二層隧道,并且需要很多協議如MPLS/BGP/LDP/RSVP等配合,配置復雜,用戶比較難于獨立完成VPLS的部署,所有的規劃、調整、監控等需要依賴運營商網絡;VPLS PE設備在進行ARP學習時,面向的對象不是一個局域網,而是分布在多個數據中心內部所有終端,如果不加節制學習MAC地址,FIB地址表空間很快就會被撐滿,從而大大降低路由器內存的使用效率。

L2GRE:部署非常簡單,與中間鏈路類型無關,只需端對端開啟L2GRE功能即可,配置簡單;天然支持廣播風暴抑制減少地址表空間的浪費。

第三場:“NVGRE/ VXLAN”vs“L2GRE”:

NVGRE/VXLAN:對于未知名單播,是使用組播報文進行轉發。 其需要網絡支持組播。 而目前在IP核心網沒有開啟組播功,如果兩個數據中心之間使用IP核心網進行連接,兩個數據中心無法互聯。 即NVGRE, VXLAN使用范圍有所限制。

L2GRE:只要求兩端三層IP可達即可,擴展性極強,使用范圍廣泛。

 術語清單