Please wait a minute...
Advanced Search
现代图书情报技术  2015, Vol. 31 Issue (2): 1-6    DOI: 10.11925/infotech.1003-3513.2015.02.01
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
Web数据到RDF数据的框架实现
陈涛, 张永娟, 陈恒
中国科学院上海生命科学信息中心 上海 200031
Implementation of the Framework for Converting Web-data to RDF (W2R)
Chen Tao, Zhang Yongjuan, Chen Heng
Shanghai Information Center for Life Sciences, Chinese Academy of Sciences, Shanghai 200031, China
全文: PDF(698 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

[目的] 构建Web 数据到RDF 数据(W2R)转换框架, 实现Web 数据的RDF 结构化。[方法] 采用W2R词表构建转换框架的底层结构, 并根据设计的系统本体和Web 页面元素组成映射文件进行数据的RDF 结构化,同时采用Virtuoso 数据库进行数据存储。[结果] 通过对映射文件的灵活配置, 在不修改任何程序代码的基础上,实现Web 数据的RDF 结构化、不同数据源之间数据的整合以及RDF 数据的Named Graph 存储及推理。[局限] 系统的本体结构以期刊和文献结构为主, 尚不支持其他知识领域。此外, 针对RDF 数据的持久化存储, W2R 框架目前仅支持Virtuoso 数据库。[结论] W2R 框架实现Web 数据的RDF 结构化, 为语义网络和关联数据的应用提供标准化数据。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
陈恒
陈涛
张永娟
关键词 本体语义网络数据采集W2R    
Abstract

[Objective] The article aims at building W2R framework for converting Web data to RDF format. [Methods] Build the bottom infrastructure of the framework with W2R vocabulary, and convert Web data to RDF format with mapping file which is consisted of system Ontology and Web page elements extracted in XPath syntax. Furthermore, use Virtuoso database as the persistent storage of RDF data. [Results] With the W2R framework, it is convenient for converting Web data to RDF format, merging data in different resources, storing them in named graphs and implementing simple inferences without changing any source code. [Limitations] The system Ontology is made up of public namespaces that describe the bibliographies currently. RDF data is only stored in Virtuoso database. [Conclusions] Through the W2R framework, this paper provides a new way of generating the standardized RDF data for semantic network and linked data applications.

Key wordsOntology    Semantic network    Data acquisition    Web data to RDF data
收稿日期: 2014-08-06     
:  G202  
基金资助:

本文系上海市哲学社会科学规划课题青年项目“关联数据的复用与整合在图书馆知识服务体系中的应用模型构建”(项目编号:2011ETQ001)的研究成果之一。

通讯作者: 陈涛, ORCID: 0000-0002-6609-4914, E-mail: chentao01@sibs.ac.cn。     E-mail: chentao01@sibs.ac.cn
作者简介: 作者贡献声明: 陈涛: 提出研究思路, 设计研究方案及框架, 论文起草及最终版本修订;张永娟: 验证方案, 数据采集, 进行实验;陈恒: 系统本体结构分析及构建。
引用本文:   
陈涛, 张永娟, 陈恒. Web数据到RDF数据的框架实现[J]. 现代图书情报技术, 2015, 31(2): 1-6.
Chen Tao, Zhang Yongjuan, Chen Heng. Implementation of the Framework for Converting Web-data to RDF (W2R). New Technology of Library and Information Service, DOI:10.11925/infotech.1003-3513.2015.02.01.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2015.02.01

[1] Linked Data: Evolving the Web into a Global Data Space [EB/OL]. [2014-05-17]. http://linkeddatabook.com/editions/1.0/.
[2] 黄永文. 关联数据在图书馆中的应用研究综述[J]. 现代图 书情报技术, 2010(5): 1-7. (Huang Yongwen. Research on Linked Data-driven Library Applications [J]. New Technology of Library and Information Service, 2010(5): 1-7.)
[3] 刘炜, 夏翠娟, 张春景. 大数据与关联数据: 正在到来的 数据技术革命[J]. 现代图书情报技术, 2013(4): 2-9. (Liu Wei, Xia Cuijuan, Zhang Chunjing. Big Data and Linked Data: The Emerging Data Technology for the Future of Librarianship [J]. New Technology of Library and Information Service, 2013(4): 2-9.)
[4] 沈志宏, 张晓林. 关联数据及其应用现状综述[J]. 现代图 书情报技术, 2010(11): 1-9. (Shen Zhihong, Zhang Xiaolin. Linked Data and Its Applications: An Overview [J]. New Technology of Library and Information Service, 2010(11): 1-9.)
[5] R2RML: RDB to RDF Mapping Language [EB/OL]. [2014-07-27]. http://www.w3.org/TR/2012/REC-r2rml-20120927/.
[6] Unbehauen J, Stadler C, Auer S. Accessing Relational Data on the Web with SparqlMap [C]. In: Proceedings of the 2nd Joint International Conference, Nara, Japan. 2013: 65-80.
[7] Chen T, Zhang Y, Zhang S, et al. Building Semantic Information Search Platform with Extended Sesame Framework [C]. In: Proceeding of the 8th International Conference on Semantic Systems. New York, USA: ACM, 2012: 193-196.
[8] Antoniou G, van Harmelen F. A Semantic Web Primer [M]. The 2nd Edition. London: The MIT Press, 2008.
[9] 张永娟, 陈涛, 张珅. 基于Sesame 及Rdfizer 扩展工具的关 联数据应用平台[J]. 图书情报工作, 2013, 57(16): 135-139. (Zhang Yongjuan, Chen Tao, Zhang Shen. A Linked Data Application Platform Based on the Sesame and Customized-Rdfizer [J]. Library and Information Service, 2013, 57(16): 135-139.)
[10] Bizer C. How to Publish Linked Data on the Web [EB/OL]. [2014-05-10]. http://wifo5-03.informatik.uni-mannheim.de/bizer/pub/LinkedDataTutorial/.
[11] 夏翠娟, 刘炜, 赵亮, 等. 关联数据发布技术及其实现——以Drupal 为例[J]. 中国图书馆学报, 2012, 38(1): 49-57. (Xia Cuijuan, Liu Wei, Zhao Liang, et al. The Current Technologies and Tools for Linked Data: A Case of Drupal [J]. Journal of Library Science in China, 2012, 38(1): 49-57.)
[12] Fuseki: Serving RDF Data over HTTP [EB/OL]. [2014-06-08]. http://jena.apache.org/documentation/serving_data/index.html.
[13] RDFa 1.1 Primer-Second Edition [EB/OL]. [2014-04-13]. http://www.w3.org/TR/xhtml-rdfa-primer/.

[1] 邓诗琦,洪亮. 面向智能应用的领域本体构建研究*——以反电话诈骗领域为例[J]. 数据分析与知识发现, 2019, 3(7): 73-84.
[2] 高广尚. 用户画像构建方法研究综述*[J]. 数据分析与知识发现, 2019, 3(3): 25-35.
[3] 王颖,钱力,谢靖,常志军,孔贝贝. 科技大数据知识图谱构建模型与方法研究*[J]. 数据分析与知识发现, 2019, 3(1): 15-26.
[4] 何有世,何述芳. 基于领域本体的产品网络口碑信息多层次细粒度情感挖掘*[J]. 数据分析与知识发现, 2018, 2(8): 60-68.
[5] 唐慧慧,王昊,张紫玄,王雪颖. 基于汉字标注的中文历史事件名抽取研究*[J]. 数据分析与知识发现, 2018, 2(7): 89-100.
[6] 庞贝贝,苟娟琼,穆文歆. 面向高校学生深度辅导领域的主题建模和主题上下位关系识别研究*[J]. 数据分析与知识发现, 2018, 2(6): 92-101.
[7] 丁晟春,刘梦露,傅柱. 概念设计中基于知识流的多维设计知识统一建模技术研究*[J]. 数据分析与知识发现, 2018, 2(2): 11-19.
[8] 涂海丽,唐晓波. 基于标签的商品推荐模型研究*[J]. 数据分析与知识发现, 2017, 1(9): 28-39.
[9] 陈二静,姜恩波. 文本相似度计算方法研究综述[J]. 数据分析与知识发现, 2017, 1(6): 1-11.
[10] 白如江,冷伏海,廖君华. 一种基于语义组块特征的改进Cosine文本相似度计算方法*[J]. 数据分析与知识发现, 2017, 1(6): 56-64.
[11] 吴丹,刘畅,李翼. 用户步行导航过程中的情感变化研究*[J]. 数据分析与知识发现, 2017, 1(5): 42-51.
[12] 刘健,毕强,刘庆旭,王福. 数字文献资源内容服务推荐研究*——基于本体规则推理和语义相似度计算[J]. 现代图书情报技术, 2016, 32(9): 70-77.
[13] 丁恒,陆伟. 标准文献知识服务系统设计与实现*[J]. 现代图书情报技术, 2016, 32(7-8): 120-128.
[14] 杨小平,马奇凤,余力,莫雨婷,吴佳楠,张悦. 评论簇在网络舆论中的情感倾向代表性研究*[J]. 现代图书情报技术, 2016, 32(7-8): 51-59.
[15] 陆佳莹,袁勤俭,黄奇,钱韵洁. 基于概念格理论的产品领域本体构建研究*[J]. 现代图书情报技术, 2016, 32(5): 38-46.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn