Please wait a minute...
Advanced Search
现代图书情报技术  2010, Vol. 26 Issue (2): 63-67    DOI: 10.11925/infotech.1003-3513.2010.02.11
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
专家研究领域自动识别研究*
赵红斌   陆伟
(武汉大学信息资源研究中心   武汉 430072)
The Study of Expert Research Field Automatic Recognition
Zhao Hongbin   Lu Wei
(Center for Studies of Information Resources, Wuhan University, Wuhan 430072,China)
全文: PDF(654 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

借鉴文本自动分类思想,基于文档权重归并法,采用N元语言模型,设计一个专家领域识别实验系统;并以“武汉大学”为例对专家研究领域自动识别的效果进行初步评测,实验结果表明该系统对专家研究领域的自动识别具有很高的查准率。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
赵红斌
陆伟
关键词 专家研究领域识别专家检索文本分类    
Abstract

Based on document-weight combining method, this paper uses N-gram language model and designs an expert research field recognition system. Taking Wuhan University as a preliminary evaluation example, the authors find that the system is highly effective in the expert research field recognition.

Key wordsExpert research field recognition    Expert search    Text classification
收稿日期: 2010-01-20     
: 

TP393

 
基金资助:

*本文系国家自然科学基金重点项目“基于生命周期理论的数字信息资源深度开发与管理机制研究”(项目编号:70833005)和教育部人文社会科学规划项目“专家专长智能识别与检索系统实现研究”(项目编号:09YJA870021)的研究成果之一。

通讯作者: 赵红斌     E-mail: sakura-2008@163.com
作者简介: 赵红斌,陆伟
引用本文:   
赵红斌,陆伟. 专家研究领域自动识别研究*[J]. 现代图书情报技术, 2010, 26(2): 63-67.
Zhao Hongbin,Lu Wei. The Study of Expert Research Field Automatic Recognition. New Technology of Library and Information Service, DOI:10.11925/infotech.1003-3513.2010.02.11.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2010.02.11

[1] Budura A, Bourges-Waldegg D, Riordan J. Deriving Expertise Profiles from Tags[C]. In:Proceedings of the 2009 International Conference on Computational Science and Engineering.2009:34-41.
[2] Tsai T M, Shih C C, Peng T C. Explore the Possibility of Utilizing Blog Semantic Analysis for Domain Expert and Opinion Mining[C]. In:Proceedings of the International Conference on Intelligent Networking and Collaborative Systems.2009.
[3] Khan S, Nabeel S M.OPEMS: Online Peer-to-Peer Expertise Matching System[C]. In:Proceedings of the 1st International Conference on Information and Communication Technologies.2005.
[4] 杨斌,刘记. 基于Web2.0的专长识别与共享模型研究[J].图书情报工作,2009,53(15):113-117.
[5] 杨彩鸽,曹俊霞. 基于Web的学术专家管理系统的设计与实现[J]. 现代电子技术, 2005,28(17): 53-55.
[6] 陆伟,赵浩镇.基于文档权重归并法的企业专家检索[J].现代图书情报技术,2008(7): 38-42.
[7] 陆伟,韩曙光.组织专家的检索系统设计与实现[J].情报学报,2008,27(5):657-663.
[8] 徐望,王炳锡.N—gram语言模型中的插值平滑技术研究[J]. 信息工程大学学报,2002,3(4):32-37.
[9] Peng F, Huang X, Schuurmans D, et al. Text Classification in Asian Languages Without Word Segmentation [C].In:Proceedings of the 6th International Workshop on Information Retrieval with Asian Languages, Sapporo, Japan. Morristown, NJ, USA:Association for Computational Linguistics,2003:41-48.
[10] Lingpipe API [EB/OL]. [2009-07-01].http://alias-i.com/lingpipe/docs/api/index.html.
[11] 陈素萍,谢丽聪.一种文本特征选择方法的研究[J]. 计算机技术与发展, 2009,19(2):31-37.
[12] Apache Lucene-Overview [EB/OL]. [2009-07-01].http://lucene.apache.org/java/docs/index.html.
[13] JDOM v1.1 API Specification [EB/OL]. [2009-07-01].http://www.jdom.org/docs/apidocs/index.html.
[14] Lingpipe 官网 [EB/OL]. [2009-07-02].http://alias-i.com/lingpipe/.
[15] Peng F, Schuurmans D, Wang S.  Language and Task Independent Text Categorization with Simple Language Models[C].In: Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language Technology, Edmonton,Canada.2003:110-117.

[1] 余本功,陈杨楠,杨颖. 基于nBD-SVM模型的投诉短文本分类*[J]. 数据分析与知识发现, 2019, 3(5): 77-85.
[2] 谭章禄,王兆刚,胡翰. 一种基于χ2统计的特征分类选择方法研究*[J]. 数据分析与知识发现, 2019, 3(2): 72-78.
[3] 张紫玄,王昊,朱立平,邓三鸿. 中国海关HS编码风险的识别研究*[J]. 数据分析与知识发现, 2019, 3(1): 72-84.
[4] 李心蕾,王昊,刘小敏,邓三鸿. 面向微博短文本分类的文本向量化方法比较研究*[J]. 数据分析与知识发现, 2018, 2(8): 41-50.
[5] 李琳,李辉. 一种基于概念向量空间的文本相似度计算方法[J]. 数据分析与知识发现, 2018, 2(5): 48-58.
[6] 刘浏,王东波. 基于论文自动分类的社科类学科跨学科性研究*[J]. 数据分析与知识发现, 2018, 2(3): 30-38.
[7] 冯国明,张晓冬,刘素辉. 基于CapsNet的中文文本分类研究*[J]. 数据分析与知识发现, 2018, 2(12): 68-76.
[8] 叶光辉, 夏立新. 专家检索与专家排名研究评述*[J]. 数据分析与知识发现, 2017, 1(2): 1-10.
[9] 李湘东,阮涛,刘康. 基于维基百科的多种类型文献自动分类研究*[J]. 数据分析与知识发现, 2017, 1(10): 43-52.
[10] 路永和,陈景煌. 混合蛙跳算法在文本分类特征选择优化中的应用*[J]. 数据分析与知识发现, 2017, 1(1): 91-101.
[11] 刘红光,马双刚,刘桂锋. 基于降噪自动编码器的中文新闻文本分类方法研究*[J]. 现代图书情报技术, 2016, 32(6): 12-19.
[12] 张群, 王红军, 王伦文. 词向量与LDA相融合的短文本分类方法*[J]. 数据分析与知识发现, 2016, 32(12): 27-35.
[13] 胡菊香, 吕学强, 刘克会. 利用类别引导词的投诉文本分类[J]. 现代图书情报技术, 2015, 31(7-8): 97-103.
[14] 李湘东, 巴志超, 黄莉. 一种基于加权LDA模型和多粒度的文本特征选择方法[J]. 现代图书情报技术, 2015, 31(5): 42-49.
[15] 路永, 王鸿滨. 文本分类中受词性影响的特征权重计算方法[J]. 现代图书情报技术, 2015, 31(4): 18-25.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn