GBase新聞
GBASE分享 | 國產關系型數據庫與知識圖譜的融合
知識圖譜(Knowledge Graph)是人工智能的重要分支技術。建立一個知識圖譜首先要獲得數據,它們可以是一些表格、文本、數據庫、音視頻、圖片等。根據數據的類型可以分為結構化數據、非結構化數據和半結構化數據,需要對它們進行信息抽取才能進一步建立知識圖譜。拿到了不同來源的數據時,需要對數據進行知識融合,也就是把代表相同概念的實體合并,將多個來源的數據集合并成一個數據集,在此基礎上就可以建立相應的知識圖譜了。
在國際上,人工智能領域已經普遍認識到知識圖譜技術的應用是實現人工智能從“感知”到“認知”突破的關鍵因素,而大規模知識圖譜的數據管理系統是新一代人工智能重要基礎設施亟需的關鍵共性技術。
知識圖譜以圖數據庫作為存儲引擎,南大通用在已有自主可控分布式關系數據庫管理系統基礎上,研究國產自主可控關系數據庫系統與圖數據庫的集成,從集群管理、元數據管理、存儲管理、統一訪問接口等模塊無縫融合,實現了在統一封裝的訪問接口服務層進行完全透明的知識圖譜查詢、管理和應用。
一、主要技術研究
知識圖譜統一查詢語言接口實現架構
功能支持方言解析器、標準SQL的轉換與執行,專屬函數管理、數據類型轉換等內容,GBase 系統針對圖查詢語言和SQL查詢語言提供統一JDBC、Python API的數據訪問接口,在SQL引擎層增加方言語法的識別與支持。
分布式查詢計劃
GBase 系統對統一查詢語言進行語法解析、優化處理并生成查詢計劃,查詢計劃由統一的圖計算算子組成,可以在圖計算引擎上執行并返回結果。
GBase 系統支持圖數據庫
GBase 系統位于應用軟件與數據庫基礎軟件之間,起承上啟下作用。通過接收用戶的命令,分析引擎信息,調用對應的引擎,在不同的數據庫系統上執行操作。
二、應用場景
通過國產自主可控關系數據庫系統與圖數據庫的融合,可以在眾多應用場景中實現對業務系統的有效支撐。
精準醫療的應用支撐
在智慧醫療場景中應用,將知識圖譜集成到南大通用關系型數據庫系統中,可以顯著提升包括病情檢查和住院花費在內的智慧醫療任務精準度,具有重要的臨床意義和社會意義。
欺詐檢測應用支撐
通過建模,研究大量的交易信息,借助數據分析,可檢測出詐騙團伙或其他復雜詐騙行為。
語義解析應用支撐
通過將自然語言轉化為知識圖譜,存儲在數據庫中。用自然語言組織的問題可以通過智能問答系統中的語義解析器進行解析并重新組織,然后從知識圖譜中檢索出問題的可能答案,提供給提問人。
總結
將知識圖譜管理系統無縫集成到南大通用關系數據庫系統中,以需求導向為研究方向,使信息橫向整合,方便可視,讓用戶在統一封裝的訪問接口服務層進行完全透明的知識圖譜查詢、管理和應用,促進了融合的數據庫技術發展;融合的系統對海量信息進行智能化處理,利用模型在存儲和查詢分析的優勢為多應用場景提供服務,如智能推薦、智能客服、金融風控、醫療、電商等。GBASE系列產品及技術研究將持續深耕,為各行業大規模知識數據的應用提供技術支撐。