Please wait a minute...
Advanced Search
数据分析与知识发现  2019, Vol. 3 Issue (6): 92-98     https://doi.org/10.11925/infotech.2096-3467.2018.0245
  应用论文 本期目录 | 过刊浏览 | 高级检索 |
机构知识库作者名自动消歧框架设计与实践*
张旺强1(),祝忠明1,李雅梅2,卢利农1,刘巍1
1(中国科学院兰州文献情报中心 兰州 730000)
2(上海科技大学图书信息中心 上海 201210)
Disambiguating Author Names Automatically for Institutional Repository
Wangqiang Zhang1(),Zhongming Zhu1,Yamei Li2,Linong Lu1,Wei Liu1
1(Lanzhou Information Center, Chinese Academy of Sciences, Lanzhou 730000, China)
2(ShanghaiTech University Library, Shanghai 201210, China)
全文: PDF (1241 KB)   HTML ( 8
输出: BibTeX | EndNote (RIS)      
摘要 

目的】实现对机构知识库作者名消歧的高度自动化处理, 并在适当的时机提供人工介入机制。【方法】分析机构知识库作者名消歧的特殊性与消歧特征项, 依此构建机构知识库作者名通用消歧框架并实践部署。【结果】该框架在实际应用中取得良好的成效, 准确率达到99%以上。【局限】对缺失单位信息的作者名未进行处理; 作者别名与机构别名可能存在例外情况。【结论】该框架能够有效地解决机构知识库作者名消歧的难题, 在此基础上可构建更多的精准增值服务。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
张旺强
祝忠明
李雅梅
卢利农
刘巍
关键词 机构知识库人名消歧作者名消歧CSpace    
Abstract

[Objective] This paper tries to automatically finish the disambiguation of author names in institutional repositories, and then provide human intervention mechanism at the right time. [Methods] First, we analyzed the unqiue features of the author name disambiguation. Then, we constructed a general disambiguation framework for the institutional repository. [Results] Our framework achieved good results in practice with more than 99% of precision. [Limitations] We did not examine the author names without affiliation addresses, and there may be exceptions in the alias of authors and institutions. [Conclusions] This framework could effectively disambiguate author names in institutional repositories, which helps us provide more value-added services.

Key wordsInstitutional Repository    Name Disambiguation    Author Name Disambiguation    CSpace
收稿日期: 2018-03-07      出版日期: 2019-08-15
基金资助:*本文系中国科学院文献情报能力建设专项“机构知识库持续运行建设及开放科研知识云”(项目编号: Y8ZG051001)的研究成果 之一
引用本文:   
张旺强,祝忠明,李雅梅,卢利农,刘巍. 机构知识库作者名自动消歧框架设计与实践*[J]. 数据分析与知识发现, 2019, 3(6): 92-98.
Wangqiang Zhang,Zhongming Zhu,Yamei Li,Linong Lu,Wei Liu. Disambiguating Author Names Automatically for Institutional Repository. Data Analysis and Knowledge Discovery, 2019, 3(6): 92-98.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2018.0245      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2019/V3/I6/92
[1] Authority Control of Metadata Values[EB/OL]. [2018-02-20]..
[2] ORCID Integration[EB/OL]. [2018-02-20]..
[3] CSpace[EB/OL]. [2018-02-20]. .
[4] 刘巍, 祝忠明, 张旺强, 等. 机构知识库中作者标识与作品认领机制的研究与实现[J]. 现代图书情报技术, 2014(3): 8-13.
[4] (Liu Wei, Zhu Zhongming, Zhang Wangqiang, et al.Development and Research of Author Identifier and Item Claim Service for Institutional Repository[J]. New Technology of Library and Information Service, 2014(3): 8-13.)
[5] 陈嘉勇, 周婕, 李玲, 等. 基于文献实体关系模型的高校机构知识库作者认领模式研究[J]. 情报理论与实践, 2015, 38(2): 59-63.
[5] (Chen Jiayong, Zhou Jie, Li Ling, et al.Research on Author Claim Pattern for University Institutional Repository Based on Paper-Entity Relationship Model[J]. Information Studies: Theory & Application, 2015, 38(2): 59-63.)
[6] Han H, Giles L, Zha H, et al.Two Supervised Learning Approaches for Name Disambiguation in Author Citations[C]// Proceedings of the 4th ACM/IEEE Joint Conference on Digital Libraries. New York: ACM, 2004: 296-305.
[7] Treeratpituk P, Giles C L.Disambiguating Authors in Academic Publications Using Random Forests[C]// Proceedings of the 9th ACM/IEEE- CS Joint Conference on Digital Libraries. New York: ACM, 2009: 39-48.
[8] Fan X M, Wang J Y, Pu X, et al.On Graph-based Name Disambiguation[J]. Journal of Data and Information Quality, 2011, 2(2): 23-56.
[9] Song Y, Huang J, Councill I G, et al.Efficient Topic-based Unsupervised Name Disambiguation[C]//Proceedings of the 7th ACM/IEEE – CS Joint Conference on Digital Libraries. New York: ACM, 2007: 342-351.
[10] 张雄, 陈福才, 黄瑞阳. 基于融合特征相似度的实体消歧方法研究[J]. 计算机应用研究, 2017, 34(2): 347-350, 396.
[10] (Zhang Xiong, Chen Fucai, Huang Ruiyang.Research on Entity Disambiguation Method Based on Fusion Feature Similarity[J]. Application Research of Computers, 2017, 34(2): 347-350, 396.)
[11] 肖晶, 梁冰, 张晓丹, 等. 一种面向篇级数据的作者名消歧规则和算法[J]. 现代图书情报技术, 2012(5): 55-59.
[11] (Xiao Jing, Liang Bing, Zhang Xiaodan, et al.Author Disambiguation Rules and Algorithm for Article Level Data[J]. New Technology of Library and Information Service, 2012(5): 55-59.)
[12] 上海科技大学知识管理系统[EB/OL]. [2018-02-20]. .(ShanghaiTech University Knowledge Management System)[EB/OL]. [2018-02-20].
[1] 卢利农,祝忠明,张旺强,王小春. 基于Lingo3G聚类算法的机构知识库跨库知识整合与知识指纹服务实现[J]. 数据分析与知识发现, 2021, 5(5): 127-132.
[2] 沈喆, 王毅, 姚毅凡, 成颖. 面向学术文献的作者名消歧方法研究综述*[J]. 数据分析与知识发现, 2020, 4(8): 15-27.
[3] 吴志强,祝忠明,刘巍,王思丽. CSpace知识分析与可视化功能扩展研究与实践*[J]. 数据分析与知识发现, 2019, 3(3): 112-119.
[4] 吴志强, 祝忠明, 姚晓娜, 王思丽. CSpace机构知识库影音资源支持能力扩展研究与实践*[J]. 数据分析与知识发现, 2017, 1(9): 90-96.
[5] 王思丽, 刘巍, 祝忠明, 吴志强, 王金平. 基于CSpace的科技信息可配置化自动监测功能设计与实现*[J]. 数据分析与知识发现, 2017, 1(10): 85-93.
[6] 吴志强, 祝忠明, 刘巍, 张旺强, 姚晓娜. 机构知识库三维模型检索与展示技术研究与实践*[J]. 数据分析与知识发现, 2017, 1(1): 73-80.
[7] 张旺强,祝忠明,姚晓娜,刘巍. 基于开放获取论文推送转发服务系统iSwitch的机构知识库内容建设*[J]. 现代图书情报技术, 2016, 32(4): 91-96.
[8] 钱力, 师洪波, 张晓林, 梁娜. 开放获取论文推送转发服务系统iSwitch: 论文分发推送[J]. 现代图书情报技术, 2015, 31(6): 7-12.
[9] 杨波, 杨军威, 阎素兰. 基于规则的机构名规范化研究[J]. 现代图书情报技术, 2015, 31(6): 57-63.
[10] 严潮斌, 陈嘉勇, 侯瑞芳, 李玲, 周婕. 查收查引服务支撑需求驱动下的高校机构知识库建设[J]. 现代图书情报技术, 2015, 31(5): 94-100.
[11] 白海燕. ORCID在机构知识库中的整合介绍[J]. 现代图书情报技术, 2015, 31(3): 8-17.
[12] 赵瑞雪, 杜若鹏. 中国农业科学院机构知识库的实践探索[J]. 现代图书情报技术, 2015, 31(2): 72-77.
[13] 张晓丹, 乔晓东, 顾立平, 姚长青, 初景利. 中国学术期刊对机构知识库存缴政策调查分析[J]. 现代图书情报技术, 2014, 30(6): 1-7.
[14] 姚晓霞, 聂华, 顾立平, 张冬荣, 吴越, 韦成府. 我国教育科研机构知识库建设现状调查与分析[J]. 现代图书情报技术, 2014, 30(5): 1-9.
[15] 王思丽, 祝忠明, 姚晓娜. 机构知识库语义知识获取方法分析及实验研究[J]. 现代图书情报技术, 2014, 30(4): 7-13.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn