GBase新聞
DTCC專訪 | GBASE第三代智能分布式數據庫技術革新背后的產品工程化之路
第15屆中國數據庫技術大會(DTCC2024)上,GBASE南大通用分享了第三代智能數據庫GBase 8c助力企業用戶應對多元場景,賦能業務發展的創新實踐。
會后,GBase 8c產品經營部總經理張益接受了ITPUB的采訪,圍繞分布式數據庫領域的熱點話題進行了深入探討。
1. 能否介紹一下GBase 8c 在過去一年的變化?取得了哪些進展?
GBase 8c是南大通用推出的多模多態分布式數據庫產品。過去一年,GBase 8c在產品能力和應用深度兩方面都有了可喜的進展。
在產品能力上,GBase 8c在去年引入了向量存儲,這是在大模型時代DB4AI領域非常重要的一項能力,通過向量存儲,GBase 8c能夠更高效地支持數據處理,特別是針對大模型的數據訪問,這在國產數據庫中是比較少見的。
同時,在應用深度上,我們在金融以及運營商等眾多的核心業務系統投產。例如,在某銀行信貸核心系統中,GBase 8c成功對原有數據庫進行了替換并顯著提升了系統的處理性能。在運營商的O域和B域兩類核心的業務領域,GBase 8c幫助用戶系統實現了一體機上的遷移,基于多租戶能力,顯著降低整體運維難度和成本。
2. 您談到在分布式數據庫領域,大家比拼的是如何做到工程化、產品化,讓產品能夠快速、高效地支持應用,能否展開講講你們的工程實踐?
在數據庫學術界以及產業界大家有一個基本共識,那就是數據庫框架理論已經相對成熟,當然不可否認一些細微的創新點以及特殊的產品優化是有別于同類產品的重要因素,但就數據庫廠商而言,進行標準的產品化、工程化以支持應用是決定企業能否盈利進而不斷迭代的關鍵。
GBASE南大通用始終將自己定位為一家“專注于數據庫產品和服務并且在金融、電信等關鍵領域得到規模化應用的獨立的數據庫廠商”。二十年來,我們也始終在踐行這一點,非常純粹地堅持聚焦數據庫產品研發,通過這二十年的積累,真正讓數據庫實現標準的產品化、工程化,讓客戶放心使用,從而對我們的產品質量和服務水平報有充分信任。
我們嚴格地遵循IPD集成開發模式,并且在組織架構上成立獨立于產品和銷售體系之外的質量管理部門,確保在產品研發的每個階段都能滿足客戶的需求和預期。這種系統化的研發流程使得我們能夠快速響應市場變化,為客戶提供了高質量的產品和服務。
3. 您觀察現在各行業對分布式數據庫的態度和應用現狀是怎樣的?會采取怎樣的策略?
提到分布式數據庫必然要提及集中式數據庫,二者究竟是怎樣的關系始終是學術界和產業界爭論的焦點。我們認為分布式和集中式一定不是對立排斥的關系,只是有些場景分布式更適合,有些場景集中式性價比更高,并非一元化的分布式或者集中式用在核心,另一個用在邊緣。關鍵還是看需求,看并發量、數據量,包括高可用的能力能不能滿足業務的需求。
對于一些并發量大、數據量大的核心業務系統,分布式數據庫可能更加適合。因為分布式數據庫可以通過水平擴展來提升處理能力,同時支持更好的彈性伸縮和負載均衡。而一般業務系統,可能對于高可用或者說數據量沒有那么大,可以選擇像GBase 8c這樣的分布式數據庫,依靠多租戶能力降低管理和運維成本。
4. 如何保證分布式數據庫替換或者升級更加平滑和穩定?
數據庫產品之間的遷移一定不是完全平滑的,同一架構的不同產品都有差異,遑論集中式遷移到分布式。GBase 8c在做的就是讓這個遷移的差異化過程更加智能。
GBASE南大通用采用了智能數據分布算法的專利技術。以往工程實踐中,用戶的業務專家和我們的數據庫團隊會統一設計數據分布方案,進行驗證、調試、測試,這一過程周期長、成本高。
現在我們基于自研的智能數據分布技術,通過算法自動優化數據分布,完成數據分類粗加工后,基于真實業務場景運行測試,通過代價評估不斷進行系統遞歸優化。經過工程 實踐,整體時間節約到原來的20%-50%之間,大大減少了人工干預和調試的成本。
5. 未來,GBase 8c有什么樣的規劃?
我們的終極目標是將GBase 8c發展成為數據云(Data Cloud)。以往對數據庫在云上的定義,將之視為PaaS層的基礎設施組件。但當業務上云后,在建設成本和數據安全方面,很難把控數據庫的容災等級。在未來,我們想實現在應用上將數據和云在物理上的隔離。數據就是數據,從物理資源層開始管理,基于我們多租戶、高安全的能力,實現高級別的高可用,同時滿足虛擬化和云化的需求。