Please wait a minute...
Advanced Search
现代图书情报技术  2010, Vol. 26 Issue (12): 64-69     https://doi.org/10.11925/infotech.1003-3513.2010.12.11
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
基于万方数据(2003-2007)的知识发现应用研究
谢靖, 江岚, 王东波, 苏新宁
南京大学信息管理系 南京 210093
Application of Knowledge Discovery Based on Wanfang Data (2003-2007)
Xie Jing, Jiang Lan, Wang Dongbo, Su Xinning
Department of Information Management, Nanjing University, Nanjing 210093,China
全文: PDF (560 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

分析万方数据2003-2007年间期刊论文数据,在原有关键词基础上构建主题词表,通过实体识别,对作者、机构、文档进行关联分析,发现作者、机构、文档间的潜在联系,为进一步语义检索研究做基础性探讨。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
谢靖
江岚
王东波
苏新宁
关键词 知识发现万方数据命名实体识别相似度计算智能推荐    
Abstract

The paper makes an association analysis on authors, affiliations and documents based on the data of the papers published in Chinese periodicals from Wanfang Data(2003-2007). This helps to indicate the latent relationships among authors, affiliations and documents. An effective method of entity recognition is also proposed to improve the accuracy of association analysis in this application. And the application is supposed to be the basis of further semantic retrieval.

Key wordsKnowledge    discovery    Wanfang    data    Entity    recognition    Similarity    computation
收稿日期: 2010-09-28      出版日期: 2011-01-07
: 

TP391

 
基金资助:

本文系教育部人文社会科学重点研究基地重大项目“基于智能信息处理的知识挖掘技术及应用研究”(项目编号:08JJD870225)、南京大学研究生科研创新基金资助项目“基于网络的英汉/汉英平行语料对自动获取”(项目编号:2010CW02)和国家科技支持计划“基于海量信息分析的科技评价方法、技术研究与应用”(项目编号:2006BAH03B05-04)的研究成果之一。

引用本文:   
谢靖, 江岚, 王东波, 苏新宁. 基于万方数据(2003-2007)的知识发现应用研究[J]. 现代图书情报技术, 2010, 26(12): 64-69.
Xie Jing, Jiang Lan, Wang Dongbo, Su Xinning. Application of Knowledge Discovery Based on Wanfang Data (2003-2007). New Technology of Library and Information Service, 2010, 26(12): 64-69.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2010.12.11      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2010/V26/I12/64


[1] 张晓林.走向知识服务:寻找新世纪图书情报工作的生长点
[J]. 中国图书馆学报,2000,26(5):32-37.

[2] 姜永常.论知识服务与信息服务
[J]. 情报学报,2001,20(5):572-578.

[3] 李晓鹏,颜端武,陈祖香.国内外知识服务研究现状、趋势与主要学术观点
[J]. 图书情报工作,2010,54(6):107-111.

[4] Blair D C, Maron M E. An Evaluation of Retrieval Effectiveness for a Full-text Document-retrieval System
[J]. Communications of the ACM, 1985, 28(3):289-299.

[5] Chen H, Lynch K J. Automatic Construction of Networks of Concepts Characterizing Document Databases
[J]. IEEE Transactions on Systems, Man and Cybernetics, 1992, 22(5), 885-902.

[6] Chen H, Lynch K J, Basu K, et al. Generating Integrating, and Activating Thesauri for Concept-based Document Retrieval
[J]. IEEE Expert, 1993, 8(2):25-34.

[7] Berry M W, Dumais S T, O’Brien G W. Using Linear Algebra for Intelligent Information Retrieval
[J]. SIAM Review, 1995, 37(4):573-595.

[8] Hofmann T. Probabilistic Latent Semantic Indexing.In: Proceedings of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, Berkeley, California, United States. New York:ACM,1999:50-57.

[9] Cai D, Mei Q, Han J, et al. Modeling Hidden Topics on Document Manifold. In: Proceeding of the 17th ACM Conference on Information and Knowledge Management, Napa Valley, California, USA. New York:ACM,2008:911-920.

[10] Xie F, Liu X, Hu Q. Comparison Probabilistic Latent Semantic Indexing Model in Chinese Information Retrieval. In: Proceedings of the 2009 International Forum on Information Technology and Applications, Chengdu, China.2009:559-562.

[11] Scopus. Search for Author. http://www.scopus.com/search/form/authorFreeLookup.url.

[12] Open Researcher & Contributor ID(ORCID). http://www.orcid.org/.

[13] 裴雷,马费成.社会网络分析在情报学中的应用和发展
[J]. 图书馆论坛,2006,26(6):40-45.

[14] 朱庆华,李亮.社会网络分析法及其在情报学中的应用
[J]. 情报理论与实践,2008,31(2):179-183,174.

[15] 王锐兵,许有志,王道平.基于语义扩展的知识服务检索与组合方法研究
[J]. 情报杂志,2008(12):40-42.

[16] DBLP Bibliography. http://www.informatik.uni-trier.de/%7Eley/db/.

[17] 中国人民大学网络与移动数据管理实验室. 学术空间ScholarSpace(C-DBLP). http://www.cdblp.cn.

[18] 中国科学院计算技术研究所. ICTCLAS资源. http://ictclas.org/Down_OpenSrc.asp.

[19] 陈克利,宗成庆,王霞.基于大规模真实文本的平衡语料分析与文本分类方法.见: 全国第七届计算语言学联合学术会议,哈尔滨.北京:清华大学出版社,2003:540-545.

[1] 韩辉, 刘秀文. 海事适任评估中主观题自动评分技术研究*[J]. 数据分析与知识发现, 2021, 5(8): 113-121.
[2] 代冰,胡正银. 基于文献的知识发现新近研究综述 *[J]. 数据分析与知识发现, 2021, 5(4): 1-12.
[3] 吴彦文, 蔡秋亭, 刘智, 邓云泽. 融合多源数据和场景相似度计算的数字资源推荐研究*[J]. 数据分析与知识发现, 2021, 5(11): 114-123.
[4] 徐晨飞, 叶海影, 包平. 基于深度学习的方志物产资料实体自动识别模型构建研究*[J]. 数据分析与知识发现, 2020, 4(8): 86-97.
[5] 高原,施元磊,张蕾,曹天奕,冯筠. 基于游记文本的游客游览行程重构*[J]. 数据分析与知识发现, 2020, 4(2/3): 165-172.
[6] 马建霞,袁慧,蒋翔. 基于Bi-LSTM+CRF的科学文献中生态治理技术相关命名实体抽取研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 78-88.
[7] 胡正银,刘蕾蕾,代冰,覃筱楚. 基于领域知识图谱的生命医学学科知识发现探析*[J]. 数据分析与知识发现, 2020, 4(11): 1-14.
[8] 刘婧茹,宋阳,贾睿,张翼鹏,罗勇,马敬东. 基于BiLSTM-CRF中文临床文本中受保护的健康信息识别*[J]. 数据分析与知识发现, 2020, 4(10): 124-133.
[9] 胡佳慧,方安,赵琬清,杨晨柳,任慧玲. 面向知识发现的中文电子病历标注方法研究 *[J]. 数据分析与知识发现, 2019, 3(7): 123-132.
[10] 关鹏,王曰芬,傅柱. 基于LDA的主题语义演化分析方法研究 * ——以锂离子电池领域为例[J]. 数据分析与知识发现, 2019, 3(7): 61-72.
[11] 黄菡,王宏宇,王晓光. 结合主动学习的条件随机场模型用于法律术语的自动识别*[J]. 数据分析与知识发现, 2019, 3(6): 66-74.
[12] 吴菊华,王煜,黎明,蔡少云. 基于加权知识网络的在线健康社区用户知识发现*[J]. 数据分析与知识发现, 2019, 3(2): 108-117.
[13] 陈美杉,夏晨曦. 肝癌患者在线提问的命名实体识别研究:一种基于迁移学习的方法 *[J]. 数据分析与知识发现, 2019, 3(12): 61-69.
[14] 杨磊,王子润,侯贵生. 基于Q-LDA主题模型的网络健康社区主题挖掘研究 *[J]. 数据分析与知识发现, 2019, 3(11): 52-59.
[15] 余丽,钱力,付常雷,赵华茗. 基于深度学习的文本中细粒度知识元抽取方法研究*[J]. 数据分析与知识发现, 2019, 3(1): 38-45.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn