江西移動網管系統數據庫國產化替換項目
項目概況
項目背景
移動網管業務是為了更好地調配和管理網絡資源及信息、對網絡運行情況進行實時監測并根據業務情況以及網絡流量使用情況進行網絡資源的合理調配。
隨著江西移動業務的不斷發展,網管系統處理負荷不斷增加,系統使用的國外數據庫產品版本老舊,系統運行過程中多次遇到數據庫產品問題,造成運行中斷;此外,我國IT產業發展戰略是要自主可控,要用國產的軟硬件逐步替代國外產品;該項目是將網管系統中的數據庫遷移至網絡服務資源池。
問題與要求
江西移動網管系統自2005年上線后就沒有高可用架構,其間,系統硬件雖做過擴容,但CPU負荷常達到60-70%,內存負荷常達到70-80%,系統存儲容量也非常緊張,無法增加數據庫邏輯日志時而造成數據庫長事務等問題,系統無備份空間做完整的備份。原有主要問題匯總如下:
系統單機運行, 存在極大的單點故障隱患;
系統硬件資源和性能都不能滿足系統業務當前和未來發展的需求;
現有數據庫產品版本老舊,產品問題常影響系統正常運行;
系統業務數據量大, 對系統運行和備份造成影響;
系統所使用的小型機運維成本高,支持服務響應不及時。
建設要求
本項目建設有以下主要要求:
消除系統單點隱患,采用雙機高可用集群,提供整個系統高可用;
提高系統硬件資源和性能,用性能較高的PC服務器替換現有的性能較差的小型機;
采用成熟的國產可控能力平臺,降低運維成本;
在系統替換過程中,對歷史數據進行清理,瘦身現有生產系統;
新系統要完成對現有業務的接管和對新業務的規劃;
新老系統替換要不影響原業務系統運行,提供無縫切換;
解決方案
本項目解決方案要點如下:
用較高性能的PC服務器替換現有的國外老舊小型機,用性能較高、容量較大的存儲替換國外老舊的存儲;
用成熟穩定的國產數據庫GBase 8s替換國外老舊的商用數據庫;
整個業務系統采用雙機架構,使用GBase 8s共享存儲數據庫集群技術SSC,消除系統單點故障隱患,提高整個系統的高可用性;
當有后續業務發展時,可通過增加數據庫集群節點進行系統橫向擴展來滿足未來業務發展;
在系統替換過程中,對原系統中的歷史數據進行清理,瘦身現有生產系統;
在系統替換過程中,為新業務功能留出資源規劃,保障新系統可長期穩定運行;
針對網管系統應用可重復運行的特點,在新系統追平老系統數據的過程中,不停止老系統的運行;在數據追平后,新老系統并行運行3個月,以防新系統出現任何意外情況,且可對新系統進行一段時間的優化;
方案架構圖示意如下:
新系統的網管讀寫業務是經過連接管理器在主節點上運行的,而純讀業務是經過連接管理器由SSC輔節點來承擔;連接管理器除起到讀寫分離、負載均衡的功能外,當主節點發生故障無法工作時,連接管理器還可快速地把運行正常的輔節點切換為可讀寫的新主節點;故障切換時間與故障發生時還在運行的負載有關,在負載不大的情況下,一般20秒之內可完成切換;為了系統的整體高可用,連接管理器也部署為多個,且與數據庫服務器分開,防止相互干擾;數據庫主、輔節點除了用心跳網絡連接來判斷彼此的工作狀態外,如果心跳網絡出了問題,新系統還設置了磁盤心跳,主、輔節點還可通過共享存儲進行通訊,以防止系統發生腦裂問題。
應用效果
本項目屬于國產化產品替換項目,經過測試運行,替換完成順利,而且替換效果顯著,不僅成本優勢明顯,還提高了性能和應對大規模數據的能力。充分證明了GBase8s SSC技術完全可以替換國外商用數據庫RAC功能;
本項目應用效果總結如下:
高穩定
新系統已穩定運行一年多,沒有發生任何故障;
快速切換
在新系統與老系統并行期間, 人為模擬生產系統軟硬件故障包括網絡故障、電源故障,生產系統均可在20s內進行雙機切換,繼續為業務提供服務,能夠滿足用戶業務要求;
負載均衡
雙機輔節點通過數據庫連接管理器可承擔更多的查詢功能,以達到數據庫集群的負載均衡;
可擴展
當有后續業務發展時,可通過增加數據庫集群節點進行系統橫向擴展來滿足未來業務發展。
本項目主要體現價值如下:
使用了國產數據庫,技術支持服務的力度比國外產品要好的太多;
更換了數據庫和其它軟硬件,系統整體性能比之前有大幅提高,系統也穩定多了;
新系統采用共享存儲方式的雙機高可用架構,可防止系統單機故障的風險;
過去跑在單機上的業務,現可運行在雙機上,有利于業務擴展,硬件資源也得以充分利用;
隨著業務的不斷發展,可通過增加集群節點來支撐新的業務負荷。