SRDF 多跳式遠程災備系統(tǒng) (multi hop)
江蘇移動BOSS容災備份系統(tǒng)架構
如圖所示,江蘇移動的BOSS系統(tǒng)的容災備份系統(tǒng)在連接BOSS系統(tǒng)的同時,還與采集、漫游結算中心、營業(yè)廳、網上營業(yè)廳、銀行、HLR/AUC、1860/1861、秘書臺等外圍接口互連。生產中心和容災中心不僅有高速網絡互連,還有存儲級的鏈路互連。
整個BOSS系統(tǒng)包含采集、計費、網間結算、帳務處理、帳務管理、客服管理、統(tǒng)計分析等子系統(tǒng),從涉及范圍、數據完整性、客戶滿意度、公司經濟損失等方面來分析、評估BOSS系統(tǒng)發(fā)生災難時對公司業(yè)務發(fā)展和業(yè)務運營的影響程度來看,采集、計費(含采集、漫游結算)、帳務管理、帳務管理、客服管理(營業(yè))等系統(tǒng)屬于關鍵業(yè)務系統(tǒng),其數據的完整性和恢復及時性要求比較高,長時間的中斷會對客戶服務、業(yè)務受理造成直接或間接影響,直接導致經濟損失,影響公司的信譽和市場競爭力,導致市場占有率和客戶滿意度下降,影響客戶發(fā)展和業(yè)務開展。統(tǒng)計分析、網間結算則屬于非關鍵業(yè)務系統(tǒng),其數據的完整性和恢復及時性要求不高。BOSS系統(tǒng)管理子系統(tǒng)承擔了系統(tǒng)運行維護管理功能,其數據的完整性不是十分重要,但是系統(tǒng)恢復及時性比較高。其長時間的中斷不產生直接的經濟損失,但是會有間接損失,如把握不住市場經營和競爭情況,無法抓住商機等。
下面的表格量化了BOSS災難對業(yè)務的影響,將業(yè)務影響涉及的范圍、數據的完整性、客戶投訴、公司經濟損失等影響級別分為5個等級,分別用1~5來表示,1級別最高,5級最低。
根據對業(yè)務系統(tǒng)特性的分析,江蘇移動要求BOSS關鍵業(yè)務系統(tǒng)(含采集、計費、帳務、營業(yè)子系統(tǒng))的容災備份RTO指標<4小時,RPO指標=0;非關鍵業(yè)務系統(tǒng)(報表、結算系統(tǒng))RTO指標<24小時;客戶資料和話單達到零丟失;可以防止地震、火災、水災、恐怖襲擊、爆炸等高破壞性的災難;能發(fā)充分發(fā)揮容災備份中心的設備資源利用率。
江蘇移動BOSS系統(tǒng)目前支持的移動用戶多,業(yè)務數據量大(天業(yè)務量超過100萬筆,每天話單處理量超過1.2億條,每天數據庫歸檔日志超過800GB),中心機房距離生產中心的距離遠,如此大量的數據通過遠距傳輸不但使得許多同城容災備份技術無法使用,而且也影響網絡響應速度。對容災備份數據進行分類對關鍵業(yè)務數據進行同步備份,而非關鍵數據進行非同步備份顯得很為必要,如采集、計費、帳務、結算、報表屬于典型的Batch業(yè)務,營業(yè)則屬于典型的OLTP。
江蘇移動對于容災備份系統(tǒng)系統(tǒng)的設計原則是:
1)關鍵業(yè)務處理能力和BOSS中心一致;2)數據狀態(tài)和BOSS保持同步;3)容災系統(tǒng)日常維護工作盡可能輕,并能承擔部分業(yè)務處理和業(yè)務測試的工作;4)系統(tǒng)接管恢復時間要盡可能短;5)可實現部分業(yè)務子系統(tǒng)切換和回切;6)技術方案選擇要遵循成熟穩(wěn)定、高可靠性、可擴展性、透明性;7)系統(tǒng)方案可以選擇多種技術組合方式。
江蘇移動容災備份方案選擇:
同步遠程災難備份對數據保護達到最高級別,然而距離很長時線路上的延遲會很明顯,對主機性能的影響也會很大。異步遠程災備雖然不影響生產系統(tǒng)的性能,但容災中心數據會比本地生產端數據落后一定時間段,這個時間隨采用的技術,帶寬、距離、數據流特點的不同而不同,發(fā)生災難時有一定的數據丟失。因此,江蘇移動采用同城同步遠程災備(20KM)加異地異步遠程災備(220KM)的多跳式(multi hop)遠程災備解決方案。
目前如此先進且完善的災備系統(tǒng)在全國還是首例,而且數據量規(guī)模之大(12TB)在國際上也不多見。因此江蘇移動對設備供應商提出了極高的要求,不僅要提供經驗證的產品而且要有強大的技術服務支持。
EMC公司是全球信息存儲領域領導廠商,其SRDF遠程災備解決方案在“9.11”中幫助了25家設在世貿中心的企業(yè)成功的保護了數據,被稱為“9.11中的技術英雄”,是經過實際考驗的成熟解決方案。EMC的存儲產品在銀行、保險、電信行業(yè)有廣泛應用。中國聯(lián)通的四川、山東、江蘇、安徽、浙江等分公司,中國移動的北京、遼寧和云南分公司,以及金融行業(yè)的上海證交所、深圳證交所、光大銀行、廣東建設銀行、中國建設銀行總行、福建興業(yè)銀行、浦東發(fā)展銀行、韓國KTF、香港匯豐銀行、花旗銀行、新加坡發(fā)展銀行、BankOne等眾多企業(yè)都是EMC存儲產品的用戶。
江蘇移動自2001年至今與EMC公司有著長期的合作,在BOSS系統(tǒng)構建項目上已經采購了總容量超過300TB的存儲設備,包括Symmetrix企業(yè)存儲系統(tǒng)系列、ECC Package和PowerPath等軟件,EMC的存儲設備成功聯(lián)接了江蘇移動原有的HP、IBM主機、Oracle數據庫,幫助江蘇移動建立起了計費、結算中心。此次又采用了EMC DMX系列存儲系統(tǒng)以及SRDF、Timefinder等存儲軟件用于容災備份系統(tǒng)。
除了優(yōu)秀的產品外,江蘇移動也十分看重EMC提供的專業(yè)服務。先進的多跳災備系統(tǒng)技術上非常復雜,沒有該領域的專業(yè)技能很難完成,而業(yè)內很少有廠家能夠象EMC一樣提供專業(yè)的存儲服務。EMC為江蘇移動提供了從咨詢、評估、實施到性能調優(yōu)全面的專業(yè)服務,幫助江蘇移動更快、更好的完成了項目。
江蘇移動容災備份系統(tǒng)的生命周期管理:
江蘇移動首先針對各業(yè)務的性質特點,對數據的同步實行分級存儲管理。其實施原則是:對于變化頻度低的數據,如計費參數復制、操作員認證信息、關鍵配置信息等則采用基于ORACLE 9i物化視圖方式的數據復制方式。對于變化頻度比較高的數據,如前臺交易事務、話單合帳信息等,每天數據庫產生的歸檔日志合計就有800GB,則采用Multi-Hop容災備份。Multi-Hop結合TimeFinder軟件提供的具有差分再同步功能的完整拷貝,以及SRDF軟件的遠程數據完整拷貝、高帶寬復制功能,可以達到具有遠程災備功能的完全數據庫熱備。Multi-Hop的同步復制是存儲軟件實現的,和主機、操作系統(tǒng)、邏輯卷是分離的。多種主機、操作系統(tǒng)、邏輯卷的環(huán)境都可以通過一種存儲復制軟件實現容災備份,使用的是存儲系統(tǒng)的內部資源而不是主機的資源,因此,不占用生產系統(tǒng)主機資源,同時使得容災備份系統(tǒng)在維護管理上會相對簡單。
具體的分層存儲管理方案如下:
計費系統(tǒng)是BOSS的關鍵業(yè)務,其數據的完整性和恢復及時性要求比較高。對計費采集模塊,災備中心與生產中心之間采用文件數據同步。計費數據庫的數據狀態(tài)則采用數據庫物化視圖的同步機制,以減少日常維護的工作量。對于計費過濾表、漫游數據全部采用應用軟件實現,垂直同步保證生產中心和容災中心數據處理同步進行,水平同步保證準實時同步計費過濾表、漫游數據,保證容災中心和生產中心計費系統(tǒng)數據一致性。
營帳系統(tǒng)是BOSS系統(tǒng)的核心系統(tǒng),包含了后臺帳務、前臺客服,其數據的完整性和恢復及時性要求也比較高。帳務客服數據庫的數據狀態(tài)采用智能存儲系統(tǒng)Multi-Hop的同步機制,保證數據達到零丟失,同時減少日常維護的工作量。查詢數據庫規(guī)模比較大,數據量保留大,采用出帳后的導入,同時對批價后的話單文件進行入庫進行處理。各種同步方案提供反向同步機制,保證接管后回切成功。
網間結算、統(tǒng)計分析是非關鍵業(yè)務系統(tǒng),其數據的完整性和恢復及時性要求不高。網間結算數據庫的數據狀態(tài)采用定期導入(數據庫邏輯或物理備份恢復)的同步機制,減少日常維護的工作量。
分級存儲不僅是從成本角度對存儲進行分級,對數據信息進行分類、對存儲結構進行劃分,同時要考慮實際應用,考慮高、中、低各種不同的硬件平臺。對于容災備份系統(tǒng)的數據信息存儲,江蘇移動根據數據信息的重要程度進行了分層存儲。對于營帳系統(tǒng)(帳務、客服)等核心系統(tǒng)的業(yè)務數據,總共有12TB,采用遠程同步災難備份,放在Symmetrix DMX網絡存儲上,以確保繳費、開機、查詢、業(yè)務變更等BOSS關鍵業(yè)務的數據完整性和恢復及時性達到較高的要求。對于其他非關鍵業(yè)務系統(tǒng),總共有80多TB的容量,如查詢歷史記錄等,由于其詳細清單需要在容災中心的數據庫中保留2~3個月,不但存儲規(guī)模大,要求存儲的時間長,而且利用率也不是很頻繁,江蘇移動采用了磁帶機進行備份。根據數據的使用頻率和重要程度實施分級存儲管理的直接好處是改進了備份時間、更好的利用了備份存儲資源,降低了成本。
結束語:
BOSS系統(tǒng)是江蘇移動提高公司核心競爭力的有力武器,對江蘇移動BOSS容災備份系統(tǒng)實施信息生命周期管理,為企業(yè)提供了一個簡單有效的方法來發(fā)現、評估、回收和管理文件級的利用率和可用性,可以執(zhí)行對那些不需要的備份或非業(yè)務數據的剔除,將重要數據但不活躍的數據移動到更經濟高效的存儲介質中,改進了備份時間、更好的利用了備份存儲資源,降低了成本。