Please wait a minute...
Advanced Search
数据分析与知识发现  2019, Vol. 3 Issue (1): 55-62     https://doi.org/10.11925/infotech.2096-3467.2018.1357
  专题 本期目录 | 过刊浏览 | 高级检索 |
基于知识图谱的科技大数据知识发现平台建设*
胡吉颖1,谢靖1,2(),钱力1,2,付常雷1
1中国科学院文献情报中心 北京 100190
2中国科学院大学图书情报与档案管理系 北京 100190
Constructing Big Data Platform for Sci-Tech Knowledge Discovery with Knowledge Graph
Jiying Hu1,Jing Xie1,2(),Li Qian1,2,Changlei Fu1
1National Science Library, Chinese Academy of Sciences, Beijing 100190, China
2Department of Library, Information and Archives Management, University of Chinese Academy of Sciences, Beijing 100190, China
全文: PDF (2162 KB)   HTML ( 21
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】突破基于关键词的传统文献检索方式, 为用户打造科技大数据知识发现平台, 实现文献检索到知识检索的转型升级。【方法】利用数据挖掘技术进行科研实体抽取与关系计算, 基于实体知识图谱构建分布式索引, 实现知识多维度检索呈现和关联导航。【结果】本文研发的知识发现平台, 在论文、项目、学者、机构等10类科研实体构建的知识图谱上实现了智能语义搜索和多维知识集成检索发现。【局限】当前知识发现平台主要建立在实体级别上, 语义检索有待进一步研究深化。【结论】基于知识图谱构建的知识发现平台实现了数据在知识层面的组织索引, 满足了用户精准知识检索需求, 提升了用户体验。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
胡吉颖
谢靖
钱力
付常雷
关键词 知识发现科技大数据知识图谱精准服务用户画像    
Abstract

[Objective] This paper tries to create a big data platform for sci-tech knowledge discovery, aiming to transform the keyword-based literature retrieval to knowledge retrieval. [Methods] First, we extracted and annotated scientific research entities and calculated their relationship with data mining techniques. Then, we created distributed indexes based on entity knowledge graph, which achieved multi-dimensional knowledge retrieval and correlated navigation. [Results] This study generated knowledge graphs for 10 research entities, such as papers, projects, scholars and institutions, etc. The proposed platform could conduct intelligent semantic search and multi-dimensional knowledge discovery with these knowledge graphs. [Limitations] Our study is at the entity level, and more research is needed for the semantic retrieval. [Conclusions] The proposed platform organizes data at the knowledge level, which meets user’s precise knowledge retrieval demands and improves user experience.

Key wordsKnowledge Discovery    S&T Big Data    Knowledge Graph    Precision Service    User Portrait
收稿日期: 2018-12-03      出版日期: 2019-03-04
基金资助:*本文系中国科学院文献情报能力建设专项项目“基于大数据计算的知识发现服务平台建设”(项目编号: 院1853)的研究成果之一
引用本文:   
胡吉颖,谢靖,钱力,付常雷. 基于知识图谱的科技大数据知识发现平台建设*[J]. 数据分析与知识发现, 2019, 3(1): 55-62.
Jiying Hu,Jing Xie,Li Qian,Changlei Fu. Constructing Big Data Platform for Sci-Tech Knowledge Discovery with Knowledge Graph. Data Analysis and Knowledge Discovery, 2019, 3(1): 55-62.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2018.1357      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2019/V3/I1/55
[1] Google Inside Search [EB/OL]. [2016-02-10]..
[2] WolframAlpha. Computational Knowledge Engine [EB/OL].[2015-03-10]. .
[3] Springer Nature.SN SciGraph[EB/OL].[2018-08-18]..
[4] Taylor & Francis.Wizdom.ai [EB/OL].[2018-05-05]. .
[5] Tang J, Zhang J, Yao L M, et al.AMiner: Extraction and Mining of Academic Social Networks[C]//Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (SIGKDD’2008). 2008: 990-998.
[6] Kuc R, Rogozinski M.Elasticsearch Server[M]. Birmingham: Packt Publishing Ltd., 2013.
[7] 王颖, 张智雄, 李传席, 等. 科技知识组织体系开放引擎系统的设计与实现[J]. 现代图书情报技术, 2015 (10): 95-101.
[7] (Wang Ying, Zhang Zhixiong, Li Chuanxi, et al.The Design and Implementation of Open Engine System for Scientific & Technological Knowledge Organization Systems[J]. New Technology of Library and Information Service, 2015(10): 95-101.)
[8] 孙坦, 刘峥. 面向外文科技文献信息的知识组织体系建设思路[J]. 图书与情报, 2013 (1): 2-7.
[8] (Sun Tan, Liu Zheng.Methodology Framework of Knowledge Organization System for Scientific & Technological Literature[J]. Library & Information, 2013(1): 2-7.)
[9] 李跃鹏, 金翠, 及俊川. 基于Word2vec 的关键词提取算法[J]. 科研信息化技术与应用, 2015(4): 54-59.
[9] (Li Yuepeng, Jin Cui, Ji Junchuan.A Keyword Extraction Algorithm Based on Word2vec[J]. E-science Technology & Application, 2015(4): 54-59.)
[10] 余珊珊, 苏锦细, 李鹏飞. 基于改进的TextRank的自动摘要提取方法[J]. 计算机科学, 2016, 43(6): 240-247.
[10] (Yu Shanshan, Su Jinxi, Li Pengfei.Improved TextRank-based Method for Automatic Summarization[J]. Computer Science, 2016, 43(6): 240-247.)
[11] 顾益军, 夏天. 融合LDA 与TextRank 的关键词抽取研究[J]. 现代图书情报技术, 2014(7-8): 41-47.
[11] (Gu Yijun, Xia Tian.Study on Keyword Extraction with LDA and TextRank Combination[J]. New Technology of Library and Information Service, 2014(7-8): 41-47.)
[1] 周阳,李学俊,王冬磊,陈方,彭莉娟. 炸药配方设计知识图谱的构建与可视分析方法研究*[J]. 数据分析与知识发现, 2021, 5(9): 42-53.
[2] 徐曾旭林, 谢靖, 于倩倩. 人才多元评价模型设计方法研究*[J]. 数据分析与知识发现, 2021, 5(8): 122-131.
[3] 沈科杰, 黄焕婷, 化柏林. 基于公开履历数据的人物知识图谱构建*[J]. 数据分析与知识发现, 2021, 5(7): 81-90.
[4] 阮小芸,廖健斌,李祥,杨阳,李岱峰. 基于人才知识图谱推理的强化学习可解释推荐研究*[J]. 数据分析与知识发现, 2021, 5(6): 36-50.
[5] 李贺,刘嘉宇,李世钰,吴迪,金帅岐. 基于疾病知识图谱的自动问答系统优化研究*[J]. 数据分析与知识发现, 2021, 5(5): 115-126.
[6] 代冰,胡正银. 基于文献的知识发现新近研究综述 *[J]. 数据分析与知识发现, 2021, 5(4): 1-12.
[7] 余传明, 张贞港, 孔令格. 面向链接预测的知识图谱表示模型对比研究*[J]. 数据分析与知识发现, 2021, 5(11): 29-44.
[8] 陈仕吉, 邱均平, 余波. 基于Overlay图谱的图情领域大数据主题分析*[J]. 数据分析与知识发现, 2021, 5(10): 51-59.
[9] 邵琦,牟冬梅,王萍,靳春妍. 基于语义的突发公共卫生事件网络舆情主题发现研究*[J]. 数据分析与知识发现, 2020, 4(9): 68-80.
[10] 梁野,李小元,许航,胡伊然. CLOpin:一种面向舆情分析与预警领域的跨语言知识图谱架构*[J]. 数据分析与知识发现, 2020, 4(6): 1-14.
[11] 吕华揆,洪亮,马费成. 金融股权知识图谱构建与应用*[J]. 数据分析与知识发现, 2020, 4(5): 27-37.
[12] 孙鑫瑞,孟雨,王文乐. 基于知识图谱与目标检测的微博交通事件识别*[J]. 数据分析与知识发现, 2020, 4(12): 136-147.
[13] 朱超宇, 刘雷. 基于知识图谱的医学决策支持应用综述*[J]. 数据分析与知识发现, 2020, 4(12): 26-32.
[14] 胡正银,刘蕾蕾,代冰,覃筱楚. 基于领域知识图谱的生命医学学科知识发现探析*[J]. 数据分析与知识发现, 2020, 4(11): 1-14.
[15] 王毅,沈喆,姚毅凡,成颖. 领域事件图谱构建方法综述*[J]. 数据分析与知识发现, 2020, 4(10): 1-13.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn