Please wait a minute...
Advanced Search
数据分析与知识发现  2018, Vol. 2 Issue (12): 89-97     https://doi.org/10.11925/infotech.2096-3467.2018.0423
  应用论文 本期目录 | 过刊浏览 | 高级检索 |
基于R2RML的STKOS超级科技词表RDF转换实现*
王颖1, 吴思竹2()
1中国科学院文献情报中心 北京 100190
2中国医学科学院医学信息研究所 北京 100020
Converting STKOS Metathesaurus to RDF Triples with R2RML
Wang Ying1, Wu Sizhu2()
1National Science Library, Chinese Academy of Sciences, Beijing 100190, China
2Institute of Medical Information, Chinese Academy of Medical Sciences, Beijing 100020, China
全文: PDF (1107 KB)   HTML ( 3
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】实现STKOS超级科技词表从关系数据库到RDF数据的自动转换。【方法】构建STKOS超级科技词表语义描述模型, 针对STKOS超级科技词表的数据存储情况和数据特点, 分别建立将科技术语、规范概念、范畴类、来源概念和术语等从关系数据库存储字段转换到RDF数据集的R2RML映射文档, 并利用R2RML Parser工具执行自动批量转换。【结果】完成STKOS超级科技词表大规模发布数据的RDF转换, 生成1.9亿RDF三元组, 并存入Virtuoso数据库中提供SPARQL查询功能。【局限】R2RML的自定义谓词不够灵活, 对于复杂数据结构需要进行预先拆分和转换。【结论】本文基于R2RML开展了STKOS超级科技词表的RDF转换实践, 其映射方法可为其他关系数据库或叙词表的RDF转换提供参考。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
王颖
吴思竹
关键词 R2RMLSTKOS超级科技词表RDF    
Abstract

[Objective] This paper aims to convert STKOS Metathesaurus from records of relational database to RDF triples. [Methods] First, we defined the semantic schema of the STKOS based on their storage features and data characteristics. Then, we mapped the scientific terms, standard concepts, categories, as well as source concepts and terms with the help of R2RML. Finally, we converted the documents stored in relational database to RDF datasets with the R2RML parser. [Results] The proposed method could process STKOS metathesaurus automatically and generated 190 million RDF triples. All new records were stored in the Virtuoso database and could be queried with SPARQL. [Limitations] Predicates in the R2RML lacks flexibily, therefore, more complex data sets need to be splited and transformed first. [Conclusions] The proposed model shed light on future research on converting other relational database records or thesaurus to RDF datasets.

Key wordsR2RML    STKOS Metathesaurus    RDF
收稿日期: 2018-04-20      出版日期: 2019-01-16
ZTFLH:  TP393  
基金资助:*本文系国家科技图书文献中心“下一代国家科技创新知识服务开放系统”先期研发任务课题“STKOS关联数据发布及开放共享 关键技术研究”(项目编号: XQYF0104)和国家社会科学青年基金项目“基于R2RML的RDB到RDF转换模式研究与实现”(项目编号: 13CTQ009)的研究成果之一
引用本文:   
王颖, 吴思竹. 基于R2RML的STKOS超级科技词表RDF转换实现*[J]. 数据分析与知识发现, 2018, 2(12): 89-97.
Wang Ying,Wu Sizhu. Converting STKOS Metathesaurus to RDF Triples with R2RML. Data Analysis and Knowledge Discovery, 2018, 2(12): 89-97.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2018.0423      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2018/V2/I12/89
  R2RML逻辑框架[5]
  STKOS超级科技词表语义描述模型
  STKOS超级科技词表关系数据表
数据表 字段 logicalTable rr:subjectMap rr:predicate rr:objectMap
stkos_concept AUI [rr:tableName “stkos_concept”] [rr:template “http://www.nstl.gov.cn/stkos/
concept/{CUI}”;
rr:class stkos:concept;]
iso25964:hasPreferred
Term
[rr:column “http://www.nstl. gov.cn/stkos/term/{AUI}”]
TUI stkos:LinktoCategory
Class
[rr:column “http://www.nstl. gov.cn/stkos/category/{TUI}”]
stkos_concept_def DEF [rr:sqlQuery “““select CUI,
DEF, ISPREF from stkos_
concept_def where ISPREF=’
YES’ “““]
[rr:template “http://www.nstl.gov.cn/stkos/
concept/{CUI}”;]
iso25964:hasPreferred
Definition
[rr:column “DEF”]
stkos_concept_def DEF [rr:sqlQuery “““ select CUI,
DEF, ISPREF from stkos_
concept_def where ISPREF=’
NO’ “““]
[rr:template “http://www.nstl.gov.cn/stkos/
concept/{CUI}”;]
iso25964:Definition [rr:column “DEF”]
  规范概念映射
数据表 字段 logicalTable rr:subjectMap rr:predicate rr:objectMap
stkos_category LABEL [rr:tableName “stkos_category”] [rr:template “http://www.nstl.gov.cn/stkos/
categoryClass/{TUI}”;
rr:class stkos:categoryClass;]
skos:prefLabel [rr:column “LABEL”; rr:language “zh”]
LABEL_T skos:altLabel [rr:column “LABEL_T”; rr:language “en”]
CSAB_ID skos:inScheme [rr:column “http://www.nstl.gov.cn/stkos/ thesaurus/{CSAB_ID}”]
PTUI skos:broader [rr:column “http://www.nstl.gov.cn/stkos/ categoryClass/{PTUI}”]
  范畴类映射
数据表 字段 logicalTable rr:subjectMap rr:predicate rr:objectMap
stkos_atom LABEL [rr:sqlQuery “““ select LABEL,
SAUI, SCUI, SAB_ID from
stkos_atom“““]
[rr:template “http://www.nstl.gov.cn/stkos/
term/{SAUI}”; rr:class stkos:
sourceTerm;]
iso25964:lexicalValue [rr:column “LABEL”; rr:language “en”]
SAB_ID skos:inScheme [rr:column “http://www.nstl.gov.cn/stkos/thesaurus/
{SAB_ID}”]
stkos_attribute ID [rr:sqlQuery “““select ID, SAUID,
STYPE, SAB_ID from stkos_attribute
where STYPE=’TERM “““];
[rr:template “http://www.nstl.
gov.cn/stkos/sourceTerm/{SA
UID}”; ]
stkos: hasAttribute [rr:column “http://www.nstl.gov.cn/stkos/attribute_
{ID}”]
ATN_C [rr:sqlQuery “““ select ID, ATN_C,
AN, ATN_S, ATV from
stkos_attribute “““]
[rr:template “http://www.nstl.gov.cn/stkos/
attribute_{ID}”; rr:class
stkos: attribute;]
stkos: ATN_C [rr:column “ATN_C”]
ATN stkos: ATN [rr:column “ATN”]
ATN_S stkos: ATN_S [rr:column “ATN_S”]
ATV stkos: ATV [rr:column “ATV”]
stkos_hierarchies PSCUI [rr:sqlQuery “““ select ID, SCUI,
PSCUI from stkos_hierarchies “““]
[rr:template “http://www.nstl.gov.cn/stkos/
sourceConcept/{SCUI}”;
rr:class stkos: sourceConcept;];
skos: broader [rr:column “http://www.nstl.gov.cn/stkos/sourceConcept/{PSCUI}”]
stkos_relationship SACID2 [rr:sqlQuery “““ select SACID1,
STYPE1, SACID2, STYPE2, REL from
stkos_relationship where STYPE1=’
TERM’ and STYPE2=’ TERM’ and
REL=’用’ “““];
[rr:template “http://www.nstl.gov.cn/stkos/
sourceTerm/{SACID1}”;
];
stkos: rel/used [rr:column “http://www.nstl.gov.cn/stkos/sourceTerm/{SACID2}”]
  来源概念和术语映射
  RDF文件导入Virtuoso数据库[9]
  SPARQL查询示例
[1] NCI Enterprise Vocabulary Services[EB/OL]. [2015-03-24]. .
[2] Medical Subject Headings (MeSH) RDF Linked Data (beta)[EB/OL]. [2017-04-24]
[3] AGROVOC Multilingual Agricultural Thesaurus [EB/OL]. [2017-04-24]. .
[4] 孙坦, 刘峥. 面向外文科技文献信息的知识组织体系建设思路[J]. 图书与情报, 2013(1): 2-7.
doi: 10.3969/j.issn.1003-6938.2013.01.001
[4] (Sun Tan, Liu Zheng.Methodology Framework of Knowledge Organization System for Scientific & Technological Literature[J]. Library and Information,2013(1): 2-7.)
doi: 10.3969/j.issn.1003-6938.2013.01.001
[5] Das S, Sundara S, Cyganiak R. R2RML: RDB to RDF Mapping Language[EB/OL]. [2015-03-12]. .
[6] 中国科学院文献情报中心. STKOS超级科技词表发布元数据规范[R]. 北京: 中国科学院文献情报中心, 2012: 6-7.
[6] (National Science Library, Chinese Academy of Sciences. Publishing Metadata Specification for Scientific & Technological Literature[R]. Beijing: National Science Library, Chinese Academy of Sciences, 2012: 6-7.)
[7] Konstantinou N, Spanos D E, Kouis D, et al.Mitrou N: An Approach for the Incremental Export of Relational Databases into RDF Graphs[J]. International Journal on Artificial Intelligence Tools, 2015, 24(2): 1-15.
doi: 10.1142/S0218213015400138
[8] Konstantinou N, Kouis D, Mitrou N.Incremental Export of Relational Database Contents into RDF Graphs[C]// Proceedings of the 4th International Conference on Web Intelligence, Mining and Semantics, Thessaloniki, Greece. 2014.
[9] OpenLink Virtuoso(Version:07.10.3207) [CP/OL]. [2014-02-17].
[1] 郝嘉树. 利用开放语义资源丰富个人名称规范数据——基于FOAF的方案设计[J]. 现代图书情报技术, 2016, 32(2): 75-82.
[2] 刘振, 张智雄. RDB-to-RDF的技术方法和工具综述[J]. 现代图书情报技术, 2014, 30(11): 17-23.
[3] 余本功, 顾佳伟. 基于Folksonomy和RDF的信息组织与表示[J]. 现代图书情报技术, 2014, 30(11): 24-30.
[4] 夏翠娟. RDB2RDF标准及应用研究[J]. 现代图书情报技术, 2013, (4): 10-17.
[5] 洪娜, 钱庆, 范炜, 方安, 王军辉. 关联数据中关系发现的可视化实践[J]. 现代图书情报技术, 2013, 29(2): 11-17.
[6] 徐雷. SPARQL查询优化[J]. 现代图书情报技术, 2012, (10): 42-48.
[7] 王思丽, 马建霞, 祝忠明, 张秀秀, 马建玲. 语义Web模式下综合科技资源的关联策略研究[J]. 现代图书情报技术, 2011, 27(6): 32-38.
[8] 王思丽, 祝忠明. 利用关联数据实现机构知识库的语义扩展研究[J]. 现代图书情报技术, 2011, (11): 17-23.
[9] 李峰. 语义Mashup技术研究*[J]. 现代图书情报技术, 2010, 26(1): 46-50.
[10] Ed Summers,Antoine Isaac,Clay Redding,Dan Krech. LCSH,SKOS 和关联数据[J]. 现代图书情报技术, 2009, 3(3): 8-14.
[11] Martin Malmsten. 将图书馆目录纳入语义万维网[J]. 现代图书情报技术, 2009, 3(3): 3-7.
[12] 司徒俊峰 . 一种基于本体的XML文档语义提取方法[J]. 现代图书情报技术, 2006, 1(11): 55-60.
[13] 崔雷,赵鹏 . 应用Protégé构建临床药物本体的探索*[J]. 现代图书情报技术, 2006, 1(11): 77-80.
[14] Alistair Miles,Brian Matthews,Michael Wilson,Dan Brickley. SKOS Core: 简约知识组织网络表述语言[J]. 现代图书情报技术, 2006, 22(1): 3-9.
[15] 张莹. 描述CAD图的元数据方案研究[J]. 现代图书情报技术, 2005, 21(7): 38-41.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn