以图为中心的新型大数据技术栈研究
*
沈志宏,赵子豪,王海波
Big Data Technology Stack Shifting: From SQL Centric to Graph Centric
Shen Zhihong,Zhao Zihao,Wang Haibo
表3
以SQL、图为中心的技术栈之间的比较
Table 3
Comparision of SQL Centric and Graph Centric Technology Stack
工具技术
以SQL为中心的技术栈
以图为中心的技术栈
数据库
关系数据库
查询语言为SQL
驱动包括ODBC、JDBC、DAO等
图数据库
查询语言包括Cypher、SPARQL、Gremlin等
数据湖
结构化、半结构化、非结构化数据的集中混搭式管理
其中结构化数据以关系表为主
一张图管理:基于图的结构化、半结构化、非结构化数据的融合管理
数据仓库
多维数据仓库
多维数据仓库+图数据仓库,增强关系挖掘、社区挖掘等能力
ETL
ETL多基于SQL进行
gETL:以图数据为主,包括实体抽取、关系抽取、实体消歧、链接预测等任务
大数据中台
数据服务以SQL报表、数据库CRUD为主
图数据:提倡以图为核心实现数据资产的管理,服务以网络分析、图谱可视化为主中台