Please wait a minute...
Advanced Search
数据分析与知识发现  2019, Vol. 3 Issue (1): 55-62    DOI: 10.11925/infotech.2096-3467.2018.1357
  专题 本期目录 | 过刊浏览 | 高级检索 |
基于知识图谱的科技大数据知识发现平台建设*
胡吉颖1,谢靖1,2(),钱力1,2,付常雷1
1中国科学院文献情报中心 北京 100190
2中国科学院大学图书情报与档案管理系 北京 100190
Constructing Big Data Platform for Sci-Tech Knowledge Discovery with Knowledge Graph
Jiying Hu1,Jing Xie1,2(),Li Qian1,2,Changlei Fu1
1National Science Library, Chinese Academy of Sciences, Beijing 100190, China
2Department of Library, Information and Archives Management, University of Chinese Academy of Sciences, Beijing 100190, China
全文: PDF(2162 KB)   HTML ( 16
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】突破基于关键词的传统文献检索方式, 为用户打造科技大数据知识发现平台, 实现文献检索到知识检索的转型升级。【方法】利用数据挖掘技术进行科研实体抽取与关系计算, 基于实体知识图谱构建分布式索引, 实现知识多维度检索呈现和关联导航。【结果】本文研发的知识发现平台, 在论文、项目、学者、机构等10类科研实体构建的知识图谱上实现了智能语义搜索和多维知识集成检索发现。【局限】当前知识发现平台主要建立在实体级别上, 语义检索有待进一步研究深化。【结论】基于知识图谱构建的知识发现平台实现了数据在知识层面的组织索引, 满足了用户精准知识检索需求, 提升了用户体验。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
胡吉颖
谢靖
钱力
付常雷
关键词 知识发现科技大数据知识图谱精准服务用户画像    
Abstract

[Objective] This paper tries to create a big data platform for sci-tech knowledge discovery, aiming to transform the keyword-based literature retrieval to knowledge retrieval. [Methods] First, we extracted and annotated scientific research entities and calculated their relationship with data mining techniques. Then, we created distributed indexes based on entity knowledge graph, which achieved multi-dimensional knowledge retrieval and correlated navigation. [Results] This study generated knowledge graphs for 10 research entities, such as papers, projects, scholars and institutions, etc. The proposed platform could conduct intelligent semantic search and multi-dimensional knowledge discovery with these knowledge graphs. [Limitations] Our study is at the entity level, and more research is needed for the semantic retrieval. [Conclusions] The proposed platform organizes data at the knowledge level, which meets user’s precise knowledge retrieval demands and improves user experience.

Key wordsKnowledge Discovery    S&T Big Data    Knowledge Graph    Precision Service    User Portrait
收稿日期: 2018-12-03     
基金资助:*本文系中国科学院文献情报能力建设专项项目“基于大数据计算的知识发现服务平台建设”(项目编号: 院1853)的研究成果之一
引用本文:   
胡吉颖,谢靖,钱力,付常雷. 基于知识图谱的科技大数据知识发现平台建设*[J]. 数据分析与知识发现, 2019, 3(1): 55-62.
Jiying Hu,Jing Xie,Li Qian,Changlei Fu. Constructing Big Data Platform for Sci-Tech Knowledge Discovery with Knowledge Graph. Data Analysis and Knowledge Discovery, DOI:10.11925/infotech.2096-3467.2018.1357.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2018.1357
[1] Google Inside Search [EB/OL]. [2016-02-10]..
[2] WolframAlpha. Computational Knowledge Engine [EB/OL].[2015-03-10]. .
[3] Springer Nature.SN SciGraph[EB/OL].[2018-08-18]..
[4] Taylor & Francis.Wizdom.ai [EB/OL].[2018-05-05]. .
[5] Tang J, Zhang J, Yao L M, et al.AMiner: Extraction and Mining of Academic Social Networks[C]//Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (SIGKDD’2008). 2008: 990-998.
[6] Kuc R, Rogozinski M.Elasticsearch Server[M]. Birmingham: Packt Publishing Ltd., 2013.
[7] 王颖, 张智雄, 李传席, 等. 科技知识组织体系开放引擎系统的设计与实现[J]. 现代图书情报技术, 2015 (10): 95-101.
[7] (Wang Ying, Zhang Zhixiong, Li Chuanxi, et al.The Design and Implementation of Open Engine System for Scientific & Technological Knowledge Organization Systems[J]. New Technology of Library and Information Service, 2015(10): 95-101.)
[8] 孙坦, 刘峥. 面向外文科技文献信息的知识组织体系建设思路[J]. 图书与情报, 2013 (1): 2-7.
[8] (Sun Tan, Liu Zheng.Methodology Framework of Knowledge Organization System for Scientific & Technological Literature[J]. Library & Information, 2013(1): 2-7.)
[9] 李跃鹏, 金翠, 及俊川. 基于Word2vec 的关键词提取算法[J]. 科研信息化技术与应用, 2015(4): 54-59.
[9] (Li Yuepeng, Jin Cui, Ji Junchuan.A Keyword Extraction Algorithm Based on Word2vec[J]. E-science Technology & Application, 2015(4): 54-59.)
[10] 余珊珊, 苏锦细, 李鹏飞. 基于改进的TextRank的自动摘要提取方法[J]. 计算机科学, 2016, 43(6): 240-247.
[10] (Yu Shanshan, Su Jinxi, Li Pengfei.Improved TextRank-based Method for Automatic Summarization[J]. Computer Science, 2016, 43(6): 240-247.)
[11] 顾益军, 夏天. 融合LDA 与TextRank 的关键词抽取研究[J]. 现代图书情报技术, 2014(7-8): 41-47.
[11] (Gu Yijun, Xia Tian.Study on Keyword Extraction with LDA and TextRank Combination[J]. New Technology of Library and Information Service, 2014(7-8): 41-47.)
[1] 孔贝贝,谢靖,钱力,常志军,吴振新. 科技大数据增值丰富化方法研究与工具研发 *[J]. 数据分析与知识发现, 2019, 3(7): 113-122.
[2] 胡佳慧,方安,赵琬清,杨晨柳,任慧玲. 面向知识发现的中文电子病历标注方法
研究 *
[J]. 数据分析与知识发现, 2019, 3(7): 123-132.
[3] 杨海慈,王军. 宋代学术师承知识图谱的构建与可视化[J]. 数据分析与知识发现, 2019, 3(6): 109-116.
[4] 高广尚. 用户画像构建方法研究综述*[J]. 数据分析与知识发现, 2019, 3(3): 25-35.
[5] 丁晟春,侯琳琳,王颖. 基于电商数据的产品知识图谱构建研究*[J]. 数据分析与知识发现, 2019, 3(3): 45-56.
[6] 吴菊华,王煜,黎明,蔡少云. 基于加权知识网络的在线健康社区用户知识发现*[J]. 数据分析与知识发现, 2019, 3(2): 108-117.
[7] 王颖,钱力,谢靖,常志军,孔贝贝. 科技大数据知识图谱构建模型与方法研究*[J]. 数据分析与知识发现, 2019, 3(1): 15-26.
[8] 钱力,谢靖,常志军,吴振新,张冬荣. 基于科技大数据的智能知识服务体系研究设计*[J]. 数据分析与知识发现, 2019, 3(1): 4-14.
[9] 谢靖,钱力,师洪波,孔贝贝,胡吉颖. 科研学术大数据的精准服务架构设计*[J]. 数据分析与知识发现, 2019, 3(1): 63-71.
[10] 毕达天,王福,许鹏程. 基于VSM的移动图书馆用户画像及场景推荐*[J]. 数据分析与知识发现, 2018, 2(9): 100-108.
[11] 王欣,冯文刚. 在线极端主义和激进化监测技术综述*[J]. 数据分析与知识发现, 2018, 2(10): 2-8.
[12] 张志强,范少萍,陈秀娟. 面向精准医学知识发现的生物医学信息学发展*[J]. 数据分析与知识发现, 2018, 2(1): 1-8.
[13] 牟冬梅,王萍,赵丹宁. 高维电子病历的数据降维策略与实证研究*[J]. 数据分析与知识发现, 2018, 2(1): 88-98.
[14] 沈志宏,姚畅,侯艳飞,吴林寰,李跃鹏. 关联大数据管理技术: 挑战、对策与实践*[J]. 数据分析与知识发现, 2018, 2(1): 9-20.
[15] 姜赢,张婧,朱玲萱. 面向Cytoscape平台的关联数据知识图谱概览抽取与可视化*[J]. 数据分析与知识发现, 2017, 1(3): 29-37.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn