GBase新聞
某大型國有銀行全棧國產化數據倉庫解決方案
隨著數字經濟深入發展,數據作為一種新型生產要素,貫穿各個行業的生產經營,成為推動國家經濟高質量發展的新動力、新資源。銀行業作為典型的數據驅動型行業,必須加速促進數字價值變現、賦能業務發展。
某大型國有銀行為構筑“統一數據、統一架構、統一生態”的集團數據治理體系,與GBASE南大通用通力協作,打造了一套全棧國產化的數據倉庫解決方案,構建起“三橫兩縱一線”的集團數據治理體系,為數字資產的數據共享、分析挖掘和服務展現提供全面、敏捷、精細的能力支撐。
“三橫兩縱一線”數據治理體系中,“三橫”指的是建設“數據+分析+展現”三層架構體系;“兩縱”分別指的是一本全集團統一的數據字典和一套標準質量全流程管控機制;“一線”指明確一條數據紅線,全面推行數據認責,業務制度與管理制度并重,嚴肅數據紀律,塑造數據文化。
2020年該行啟動全國產化信創改造,搭建GBASE國產數據庫+國產芯片+國產操作系統的全國產化企業數倉平臺。在數據倉庫構建過程中,行方采用“MPP數據庫+Hadoop”的技術架構,形成湖倉混搭模式的數據基座,實現智能的數據探索與服務并形成了共享共建的數據應用機制,保證集團數字資產在桌面端、移動端的秒級展現,提供沉浸式用戶體驗。
利用“MPP數據庫”搭建數據倉庫基礎主題層和匯總共享層,解決復雜數據關系下的關聯計算問題,保障數據倉庫模型架構穩定和數出同源。
以“Hadoop技術”構建貼源數據層、歸集數倉及數據應用結果數據,發揮其對多態、復雜結構數據的歸集、存儲和處理能力,搭載適用于海量數據處理、交互式分析和實時計算與訪問的配套組件,提升數據應用效率,降低實施運維成本。
以“云上服務”構建湖倉應用服務,發揮云平臺易擴展特點,基于IAAS搭建的對象存儲,為數據湖提供統一的原始數據存儲服務,支持橫向擴展,沉淀全行數據資產;基于PAAS搭建數據庫以及消息隊列等基礎服務,為湖倉協同信息流交互提供保障;SAAS提供統一數據服務管控全行服務資產。
行方采用GBase 8a MPP Cluster數據庫搭建集群,承載了數據倉庫、風險數據集市、審計系統、模型管理平臺、監控標準化數據報送平臺、報表系統等數十套應用。超大規模集群提供了海量數據存儲和超強計算能力,同時具備橫向擴展能力,可擴展到千節點以上,支撐未來需求。汲取了這一實踐成果和經驗的創新課題榮獲金電創新應用專委會“2022年重點攻關項目”優秀課題。
未來,行方將進一步拓展GBASE在全行的應用,將剩余的數據分析類應用陸續搬遷至GBase 8a MPP Cluster上。攜手GBASE進一步開展災備建設,基于同步工具與虛擬機群鏡像構建異步、實時雙活集群。共同探討云化部署方案,依托GCDW云原生數據倉庫,滿足行內彈性數據倉庫系統的應用需求。