以图为中心的新型大数据技术栈研究 *
沈志宏,赵子豪,王海波

Big Data Technology Stack Shifting: From SQL Centric to Graph Centric
Shen Zhihong,Zhao Zihao,Wang Haibo
表3 以SQL、图为中心的技术栈之间的比较
Table 3 Comparision of SQL Centric and Graph Centric Technology Stack
工具技术 以SQL为中心的技术栈 以图为中心的技术栈
数据库 关系数据库
查询语言为SQL
驱动包括ODBC、JDBC、DAO等
图数据库
查询语言包括Cypher、SPARQL、Gremlin等
数据湖 结构化、半结构化、非结构化数据的集中混搭式管理
其中结构化数据以关系表为主
一张图管理:基于图的结构化、半结构化、非结构化数据的融合管理
数据仓库 多维数据仓库 多维数据仓库+图数据仓库,增强关系挖掘、社区挖掘等能力
ETL ETL多基于SQL进行 gETL:以图数据为主,包括实体抽取、关系抽取、实体消歧、链接预测等任务
大数据中台 数据服务以SQL报表、数据库CRUD为主 图数据:提倡以图为核心实现数据资产的管理,服务以网络分析、图谱可视化为主中台