Please wait a minute...
Advanced Search
数据分析与知识发现  2021, Vol. 5 Issue (10): 51-59     https://doi.org/10.11925/infotech.2096-3467.2021.0113
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于Overlay图谱的图情领域大数据主题分析*
陈仕吉,邱均平(),余波
杭州电子科技大学中国科教评价研究院 杭州 310018
杭州电子科技大学数据科学与信息计量研究院 杭州 310018
Topic Analysis of LIS Big Data Research with Overlay Mapping
Chen Shiji,Qiu Junping(),Yu Bo
Chinese Academy of Science and Education Evaluation (CASEE), Hangzhou Dianzi University,Hangzhou 310018, China
Academy of Data Science and Informetrics (ADSI), Hangzhou Dianzi University, Hangzhou 310018, China
全文: PDF (2815 KB)   HTML ( 19
输出: BibTeX | EndNote (RIS)      
摘要 

【目的】 从大数据研究的整体视角分析图情领域大数据的研究主题,并进一步讨论研究发展趋势。【方法】 以“大数据”为主题检索Web of Science获得原始文献集,根据引用关系剔除和扩充文献,利用Leiden算法和VOSViewer软件构建了大数据研究知识图谱,最后通过图情领域论文分布Overlay图谱和引文Overlay图谱分析该领域的大数据研究主题。【结果】 从论文分布Overlay图谱来看,图情领域大数据研究主要集中在大数据分析和社交媒体分析,其次是云计算、Hadoop、MapReduce、机器学习等;从引文Overlay图谱来看,除大数据分析和社交媒体分析外,云计算、机器学习、健康信息、精准医疗、工业4.0和物联网也是图情领域关注较多的主题。【局限】 大数据研究涉及的论文较多,只能从宏观上分析大数据环境下图情领域的主题和发展趋势。【结论】 大数据研究是图情领域的重要研究主题和发展趋势,目前的研究主要集中在大数据分析和社会媒体分析,而机器学习、健康信息、精准医疗、工业4.0和物联网可能是未来关注和发展的方向。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
陈仕吉
邱均平
余波
关键词 大数据知识图谱Overlay图谱图书情报    
Abstract

[Objective] This paper explores the topics of big data research in Library and Information Science (LIS), aiming to reveal their developing trends. [Methods] We used “big data” as keyword to search the Web of Science and then constructed a test collection with the retrieved documents. Based on the citation analysis, we removed those irrelevant documents. Then, we used the Leiden algorithm and the VOSviewer to construct the science mapping on LIS big data research. Finally, we created the overlay mapping of research topics. [Results] According to the citation analysis, LIS big data research focuses on big data and social media analysis, followed by cloud computing, machine learning, big data technologies (such as Hadoop and MapReduce), health information, precision medicine, industry 4.0 and Internet of Things. [Limitations] We only analyzed the themes and development trends of LIS big data research from the macro-perspective. [Conclusions] Big data is an important LIS research topic. Popular studies focuses on big data and social media analysis. Machine learning, health information, precision medicine, Industry 4.0 and the Internet of Things are the important directions for Library and Information Science.

Key wordsBig Data    Knowledge Mapping    Overlay Mapping    Library and Information Science
收稿日期: 2021-02-02      出版日期: 2021-11-23
ZTFLH:  G350  
基金资助:*国家社会科学基金重大项目(19ZDA348)
通讯作者: 邱均平,ORCID:0000-0001-8660-3491     E-mail: jpqiu@hdu.edu.cn
引用本文:   
陈仕吉, 邱均平, 余波. 基于Overlay图谱的图情领域大数据主题分析*[J]. 数据分析与知识发现, 2021, 5(10): 51-59.
Chen Shiji, Qiu Junping, Yu Bo. Topic Analysis of LIS Big Data Research with Overlay Mapping. Data Analysis and Knowledge Discovery, 2021, 5(10): 51-59.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2021.0113      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2021/V5/I10/51
数据来源 关键词 研究内容
Web of Science数据库 标题或关键词包含“Data Science”或“Big Data” 数据科学的最高贡献来自计算机科学研究领域,图情领域的贡献很小,但文章数量表现增长趋势[8];
从图情领域探讨数据科学的主题[9] ;
评估图情领域在大数据方面的研究成果以及南非在1992-2019年期间的贡献[10];
图书馆和信息管理领域的大数据研究趋势[11];
借助SATI 和SPSS进行关键词共现和聚类分析,揭示国际图情领域大数据研究的热点与特征[12]
LISTA和WoS数据库
(截至2016年10月)
标题或关键词
包含“Big Data”
审查图情领域包含大数据定义的文章,收集了35个定义,并对这些定义进行内容分析和统计描述[13]
中国知网(学术期刊)或维普中文期刊数据库 主题包含“大数据” 通过聚类分析、战略坐标图分析和核心-边缘结构分析等方式挖掘国内图情领域大数据研究热点[14];
图情领域近5年或10年大数据主题的研究热点[15];
近5年或10年大数据主题的研究热点[16]
Web of Science和中国知网(学术期刊) 主题包含“大数据” 利用文本数据挖掘的方法识别和比较国内外图情领域不同时期的大数据研究主题,分析研究主题的演变情况[17]
Table 1  图书情报领域大数据研究热点
Fig.1  大数据研究知识图谱
Fig.2  图情领域大数据论文Overlay图谱
Fig.3  图情领域大数据引文Overlay图谱
类团代码 图情论文数 图情施引次数 关键词
C0 71 685 social media, machine learning, privacy, twitter, ethics
C1 61 881 big data analytics, social media, supply chain management, business analytics
C13 13 163 internet of things, data mining, privacy, machine learning, social network analysis
C6 12 175 MapReduce, machine learning, data mining, feature selection, classification
C2 8 169 cloud computing, MapReduce, Hadoop, security, cloud storage
C3 7 102 internet of things, cloud computing, edge computing, fog computing, smart city
C5 8 121 social media, deep learning, machine learning, human mobility, mobile phone data
C10 4 109 machine learning, data science, climate change, digital agriculture, smart farming
C4 1 102 machine learning, deep learning, artificial intelligence, electronic health records, precision medicine
C7 1 50 machine learning, deep learning, internet of things, big data analytics, security
C8 1 63 industry 4.0, internet of things, cloud computing, smart manufacturing, cloud manufacturing
Table 2  图情领域关注的类团及引用
[1] Hey T, Tansley S, Tolle K. 第四范式:数据密集型科学发现[M]. 潘教峰, 张晓林, 等译. 北京: 科学出版社, 2012.
[1] (Hey T, Tansley S, Tolle K. The Fourth Paradigm: Data-Intensive Scientific Discovery[M]. Translated by Pan Jiaofeng, Zhang Xiaolin, et al. Beijing: Science Press, 2012.)
[2] 马费成, 张瑞, 李志元. 大数据对情报学研究的影响[J]. 图书情报知识, 2018(5): 4-9.
[2] (Ma Feicheng, Zhang Rui, Li Zhiyuan. Impacts of Big Data on the Research of Information Science[J]. Documentation, Information & Knowledge, 2018(5): 4-9.)
[3] 曾建勋, 魏来. 大数据时代的情报学变革[J]. 情报学报, 2015, 34(1): 37-44.
[3] (Zeng Jianxun, Wei Lai. The Changes of Information Science in Big Data Era[J]. Journal of the China Society for Scientific and Technical Information, 2015, 34(1): 37-44.)
[4] 胡昌平, 吕美娇. 大数据与智能环境下的情报学理论发展[J]. 情报理论与实践, 2020, 43(10): 1-6.
[4] (Hu Changping, Lv Meijiao. Development of Information Science Theory in Big Data and Intelligent Environment[J]. Information Studies: Theory & Application, 2020, 43(10): 1-6.)
[5] 唐明伟, 蒋勋, 徐臻元, 等. 大数据环境下情报学方法与技术体系构建[J]. 情报科学, 2020, 38(5): 106-111.
[5] (Tang Mingwei, Jiang Xun, Xu Zhenyuan, et al. System Construction of Intelligence Science Methods and Technologies in Big Data Environment[J]. Information Science, 2020, 38(5): 106-111.)
[6] 李品, 杨建林. 基于大数据思维的情报学科发展道路探究[J]. 情报学报, 2019, 38(3): 239-248.
[6] (Li Pin, Yang Jianlin. Research on the Development Path of Intelligence Studies Based on Big Data Thinking[J]. Journal of the China Society for Scientific and Technical Information, 2019, 38(3): 239-248.)
[7] 董克, 邱均平. 论大数据环境对情报学发展的影响[J]. 情报学报, 2017, 36(9): 886-893.
[7] (Dong Ke, Qiu Junping. Research on the Influence of Big Data Environment on the Development of Informatics[J]. Journal of the China Society for Scientific and Technical Information, 2017, 36(9): 886-893.)
[8] Virkus S, Garoufallou E. Data Science from a Library and Information Science Perspective[J]. Data Technologies and Applications, 2019, 53(4): 422-441.
doi: 10.1108/DTA-05-2019-0076
[9] Virkus S, Garoufallou E. Data Science and Its Relationship to Library and Information Science: A Content Analysis[J]. Data Technologies and Applications, 2020, 54(5): 643-663.
doi: 10.1108/DTA-07-2020-0167
[10] Ajibade P, Mutula S M. Big Data Research Outputs in the Library and Information Science: South African’s Contribution Using Bibliometric Study of Knowledge Production[J]. African Journal of Library Archives and Information Science, 2020, 30(1): 49-60.
[11] Ahmed W, Ameen K. Defining Big Data and Measuring Its Associated Trends in the Field of Information and Library Management[J]. Library Hi Tech News, 2017, 34(9): 21-24.
[12] 赵栋祥, 张瑞. 国际图情领域大数据研究热点挖掘与分析[J]. 图书馆学研究, 2018(14): 10-19.
[12] (Zhao Dongxiang, Zhang Rui. Hot Topic Detection and Analysis of Big Data Research in the Field of International Library and Information Science[J]. Research on Library Science, 2018(14): 10-19.)
[13] Zhan M, Widén G. Understanding Big Data in Librarianship[J]. Journal of Librarianship and Information Science, 2019, 51(2): 561-576.
doi: 10.1177/0961000617742451
[14] 王春华, 李维, 文庭孝. 我国图书情报领域大数据研究热点分析[J]. 图书情报知识, 2015(4): 82-89.
[14] (Wang Chunhua, Li Wei, Wen Tingxiao. The Research Hotspot of Big Data in Library and Information Science of China[J]. Documentation,Information & Knowledge, 2015(4): 82-89.)
[15] 赵蓉英, 魏绪秋. 我国图书情报学领域大数据研究演进特征分析[J]. 情报科学, 2017, 35(5): 3-7, 14.
[15] (Zhao Rongying, Wei Xuqiu. Analysis of Evolutional Characteristics of Big Data in Library and Information Science in China[J]. Information Science, 2017, 35(5): 3-7,14.)
[16] 虞秋雨, 徐跃权. 近5年我国图书情报领域大数据研究热点分析[J]. 图书馆学研究, 2020(8): 10-18.
[16] (Yu Qiuyu, Xu Yuequan. The Research Hotspots of Big Data in China’s Library and Information Science in Recent Five Years[J]. Research on Library Science, 2020(8): 10-18.)
[17] 陈军营, 白如江, 王效岳, 等. 中外图情领域大数据近十年(2007—2016)研究现状与发展趋势分析[J]. 情报科学, 2018, 36(7): 104-110.
[17] (Chen Junying, Bai Rujiang, Wang Xiaoyue, et al. Research Status and Development Trend Analysis of Big Data in the Field of Chinese and Foreign Library and Information Science in Recent 10 Years (2007—2016)[J]. Information Science, 2018, 36(7): 104-110.)
[18] Leydesdorff L, Bornmann L, Zhou P. Construction of a Pragmatic Base Line for Journal Classifications and Maps Based on Aggregated Journal-Journal Citation Relations[J]. Journal of Informetrics, 2016, 10(4): 902-918.
doi: 10.1016/j.joi.2016.07.008
[19] Rafols I, Porter A L, Leydesdorff L. Science Overlay Maps: A New Tool for Research Policy and Library Management[J]. Journal of the American Society for Information Science and Technology, 2010, 61(9): 1871-1887.
doi: 10.1002/asi.v61:9
[20] Traag V A, Waltman L, van Eck N J. From Louvain to Leiden: Guaranteeing Well-Connected Communities[J]. Scientific Reports, 2019, 9: 5233.
doi: 10.1038/s41598-019-41695-z pmid: 30914743
[21] Waltman L, van Eck N J. A Smart Local Moving Algorithm for Large-Scale Modularity-Based Community Detection[J]. The European Physical Journal B, 2013, 86(11): 471.
doi: 10.1140/epjb/e2013-40829-0
[22] Yaqoob I, Hashem I A T, Gani A, et al. Big Data: From Beginning to Future[J]. International Journal of Information Management, 2016, 36(6): 1231-1247.
doi: 10.1016/j.ijinfomgt.2016.07.009
[23] Yang C W, Huang Q Y, Li Z L, et al. Big Data and Cloud Computing: Innovation Opportunities and Challenges[J]. International Journal of Digital Earth, 2017, 10(1): 13-53.
doi: 10.1080/17538947.2016.1239771
[24] Gandomi A, Haider M. Beyond the Hype: Big Data Concepts, Methods, and Analytics[J]. International Journal of Information Management, 2015, 35(2): 137-144.
doi: 10.1016/j.ijinfomgt.2014.10.007
[25] Khan N, Yaqoob I, Hashem I A T, et al. Big Data: Survey, Technologies, Opportunities, and Challenges[J]. The Scientific World Journal, 2014: Article ID 712826.
[26] Chen M, Mao S W, Liu Y H. Big Data: A Survey[J]. Mobile Networks and Applications, 2014, 19(2): 171-209.
doi: 10.1007/s11036-013-0489-0
[1] 周阳,李学俊,王冬磊,陈方,彭莉娟. 炸药配方设计知识图谱的构建与可视分析方法研究*[J]. 数据分析与知识发现, 2021, 5(9): 42-53.
[2] 沈科杰, 黄焕婷, 化柏林. 基于公开履历数据的人物知识图谱构建*[J]. 数据分析与知识发现, 2021, 5(7): 81-90.
[3] 阮小芸,廖健斌,李祥,杨阳,李岱峰. 基于人才知识图谱推理的强化学习可解释推荐研究*[J]. 数据分析与知识发现, 2021, 5(6): 36-50.
[4] 李贺,刘嘉宇,李世钰,吴迪,金帅岐. 基于疾病知识图谱的自动问答系统优化研究*[J]. 数据分析与知识发现, 2021, 5(5): 115-126.
[5] 代冰,胡正银. 基于文献的知识发现新近研究综述 *[J]. 数据分析与知识发现, 2021, 5(4): 1-12.
[6] 常志军,钱力,谢靖,吴振新,张鹄,于倩倩,王颖,王永吉. 基于分布式技术的科技文献大数据平台的建设研究*[J]. 数据分析与知识发现, 2021, 5(3): 69-77.
[7] 余传明, 张贞港, 孔令格. 面向链接预测的知识图谱表示模型对比研究*[J]. 数据分析与知识发现, 2021, 5(11): 29-44.
[8] 赵宇翔,练靖雯. 数字人文视域下文化遗产众包研究综述*[J]. 数据分析与知识发现, 2021, 5(1): 36-55.
[9] 邵琦,牟冬梅,王萍,靳春妍. 基于语义的突发公共卫生事件网络舆情主题发现研究*[J]. 数据分析与知识发现, 2020, 4(9): 68-80.
[10] 王建冬,于施洋. 构建国家经济大脑的实践探索与初步设想 *[J]. 数据分析与知识发现, 2020, 4(7): 2-17.
[11] 邱尔丽,何鸿魏,易成岐,李慧颖. 基于字符级CNN技术的公共政策网民支持度研究 *[J]. 数据分析与知识发现, 2020, 4(7): 28-37.
[12] 梁野,李小元,许航,胡伊然. CLOpin:一种面向舆情分析与预警领域的跨语言知识图谱架构*[J]. 数据分析与知识发现, 2020, 4(6): 1-14.
[13] 吕华揆,洪亮,马费成. 金融股权知识图谱构建与应用*[J]. 数据分析与知识发现, 2020, 4(5): 27-37.
[14] 孙鑫瑞,孟雨,王文乐. 基于知识图谱与目标检测的微博交通事件识别*[J]. 数据分析与知识发现, 2020, 4(12): 136-147.
[15] 朱超宇, 刘雷. 基于知识图谱的医学决策支持应用综述*[J]. 数据分析与知识发现, 2020, 4(12): 26-32.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn