Please wait a minute...
Advanced Search
现代图书情报技术  2010, Vol. 26 Issue (12): 64-69    DOI: 10.11925/infotech.1003-3513.2010.12.11
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
基于万方数据(2003-2007)的知识发现应用研究
谢靖, 江岚, 王东波, 苏新宁
南京大学信息管理系 南京 210093
Application of Knowledge Discovery Based on Wanfang Data (2003-2007)
Xie Jing, Jiang Lan, Wang Dongbo, Su Xinning
Department of Information Management, Nanjing University, Nanjing 210093,China
全文: PDF(560 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

分析万方数据2003-2007年间期刊论文数据,在原有关键词基础上构建主题词表,通过实体识别,对作者、机构、文档进行关联分析,发现作者、机构、文档间的潜在联系,为进一步语义检索研究做基础性探讨。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
谢靖
江岚
王东波
苏新宁
关键词 知识发现万方数据命名实体识别相似度计算智能推荐    
Abstract

The paper makes an association analysis on authors, affiliations and documents based on the data of the papers published in Chinese periodicals from Wanfang Data(2003-2007). This helps to indicate the latent relationships among authors, affiliations and documents. An effective method of entity recognition is also proposed to improve the accuracy of association analysis in this application. And the application is supposed to be the basis of further semantic retrieval.

Key wordsKnowledge    discovery    Wanfang    data    Entity    recognition    Similarity    computation
收稿日期: 2010-09-28     
: 

TP391

 
基金资助:

本文系教育部人文社会科学重点研究基地重大项目“基于智能信息处理的知识挖掘技术及应用研究”(项目编号:08JJD870225)、南京大学研究生科研创新基金资助项目“基于网络的英汉/汉英平行语料对自动获取”(项目编号:2010CW02)和国家科技支持计划“基于海量信息分析的科技评价方法、技术研究与应用”(项目编号:2006BAH03B05-04)的研究成果之一。

引用本文:   
谢靖, 江岚, 王东波, 苏新宁. 基于万方数据(2003-2007)的知识发现应用研究[J]. 现代图书情报技术, 2010, 26(12): 64-69.
Xie Jing, Jiang Lan, Wang Dongbo, Su Xinning. Application of Knowledge Discovery Based on Wanfang Data (2003-2007). New Technology of Library and Information Service, DOI:10.11925/infotech.1003-3513.2010.12.11.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2010.12.11


[1] 张晓林.走向知识服务:寻找新世纪图书情报工作的生长点
[J]. 中国图书馆学报,2000,26(5):32-37.

[2] 姜永常.论知识服务与信息服务
[J]. 情报学报,2001,20(5):572-578.

[3] 李晓鹏,颜端武,陈祖香.国内外知识服务研究现状、趋势与主要学术观点
[J]. 图书情报工作,2010,54(6):107-111.

[4] Blair D C, Maron M E. An Evaluation of Retrieval Effectiveness for a Full-text Document-retrieval System
[J]. Communications of the ACM, 1985, 28(3):289-299.

[5] Chen H, Lynch K J. Automatic Construction of Networks of Concepts Characterizing Document Databases
[J]. IEEE Transactions on Systems, Man and Cybernetics, 1992, 22(5), 885-902.

[6] Chen H, Lynch K J, Basu K, et al. Generating Integrating, and Activating Thesauri for Concept-based Document Retrieval
[J]. IEEE Expert, 1993, 8(2):25-34.

[7] Berry M W, Dumais S T, O’Brien G W. Using Linear Algebra for Intelligent Information Retrieval
[J]. SIAM Review, 1995, 37(4):573-595.

[8] Hofmann T. Probabilistic Latent Semantic Indexing.In: Proceedings of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, Berkeley, California, United States. New York:ACM,1999:50-57.

[9] Cai D, Mei Q, Han J, et al. Modeling Hidden Topics on Document Manifold. In: Proceeding of the 17th ACM Conference on Information and Knowledge Management, Napa Valley, California, USA. New York:ACM,2008:911-920.

[10] Xie F, Liu X, Hu Q. Comparison Probabilistic Latent Semantic Indexing Model in Chinese Information Retrieval. In: Proceedings of the 2009 International Forum on Information Technology and Applications, Chengdu, China.2009:559-562.

[11] Scopus. Search for Author. http://www.scopus.com/search/form/authorFreeLookup.url.

[12] Open Researcher & Contributor ID(ORCID). http://www.orcid.org/.

[13] 裴雷,马费成.社会网络分析在情报学中的应用和发展
[J]. 图书馆论坛,2006,26(6):40-45.

[14] 朱庆华,李亮.社会网络分析法及其在情报学中的应用
[J]. 情报理论与实践,2008,31(2):179-183,174.

[15] 王锐兵,许有志,王道平.基于语义扩展的知识服务检索与组合方法研究
[J]. 情报杂志,2008(12):40-42.

[16] DBLP Bibliography. http://www.informatik.uni-trier.de/%7Eley/db/.

[17] 中国人民大学网络与移动数据管理实验室. 学术空间ScholarSpace(C-DBLP). http://www.cdblp.cn.

[18] 中国科学院计算技术研究所. ICTCLAS资源. http://ictclas.org/Down_OpenSrc.asp.

[19] 陈克利,宗成庆,王霞.基于大规模真实文本的平衡语料分析与文本分类方法.见: 全国第七届计算语言学联合学术会议,哈尔滨.北京:清华大学出版社,2003:540-545.

[1] 胡佳慧,方安,赵琬清,杨晨柳,任慧玲. 面向知识发现的中文电子病历标注方法
研究 *
[J]. 数据分析与知识发现, 2019, 3(7): 123-132.
[2] 关鹏,王曰芬,傅柱. 基于LDA的主题语义演化分析方法研究 * ——以锂离子电池领域为例[J]. 数据分析与知识发现, 2019, 3(7): 61-72.
[3] 黄菡,王宏宇,王晓光. 结合主动学习的条件随机场模型用于法律术语的自动识别*[J]. 数据分析与知识发现, 2019, 3(6): 66-74.
[4] 吴菊华,王煜,黎明,蔡少云. 基于加权知识网络的在线健康社区用户知识发现*[J]. 数据分析与知识发现, 2019, 3(2): 108-117.
[5] 余丽,钱力,付常雷,赵华茗. 基于深度学习的文本中细粒度知识元抽取方法研究*[J]. 数据分析与知识发现, 2019, 3(1): 38-45.
[6] 胡吉颖,谢靖,钱力,付常雷. 基于知识图谱的科技大数据知识发现平台建设*[J]. 数据分析与知识发现, 2019, 3(1): 55-62.
[7] 孙海霞,王蕾,吴英杰,华薇娜,李军莲. 科技文献数据库中机构名称匹配策略研究*[J]. 数据分析与知识发现, 2018, 2(8): 88-97.
[8] 唐慧慧,王昊,张紫玄,王雪颖. 基于汉字标注的中文历史事件名抽取研究*[J]. 数据分析与知识发现, 2018, 2(7): 89-100.
[9] 范馨月,崔雷. 基于文本挖掘的药物副作用知识发现研究[J]. 数据分析与知识发现, 2018, 2(3): 79-86.
[10] 王欣,冯文刚. 在线极端主义和激进化监测技术综述*[J]. 数据分析与知识发现, 2018, 2(10): 2-8.
[11] 张志强,范少萍,陈秀娟. 面向精准医学知识发现的生物医学信息学发展*[J]. 数据分析与知识发现, 2018, 2(1): 1-8.
[12] 牟冬梅,王萍,赵丹宁. 高维电子病历的数据降维策略与实证研究*[J]. 数据分析与知识发现, 2018, 2(1): 88-98.
[13] 谢秀芳,张晓林. 针对科技路线图的文本挖掘研究: 集成分析及可视化*[J]. 数据分析与知识发现, 2017, 1(1): 16-25.
[14] 牟冬梅,任珂. 三种数据挖掘算法在电子病历知识发现中的比较*[J]. 现代图书情报技术, 2016, 32(6): 102-109.
[15] 刘红煦,曲建升. 主流Meta分析软件功能及其在领域知识发现的拓展应用研究*[J]. 现代图书情报技术, 2016, 32(5): 9-21.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn