Please wait a minute...
Advanced Search
现代图书情报技术  2007, Vol. 2 Issue (2): 56-59     https://doi.org/10.11925/infotech.1003-3513.2007.02.12
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
一种改进的文档层次分类方法
谭金波
(山东师范大学教育技术系 济南 250014)
An Improved Hierarchical Document Classification Method
Tan Jinbo
(Department of Educational Technology, Shandong Normal University, Jinan 250014,China)
全文: PDF (533 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

在文本分类的类别数量庞大的情况下,层次分类是一种有效的分类途径。但是,常用的层次分类法容易产生“阻滞”的问题。为了解决该问题,提出一种改进型层次分类方法,即限制投票法,并运用Rocchio分类器在基础教育学科资源环境下进行了实验。结果表明,该方法能够降低阻滞,具有较好的分类效果。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
谭金波
关键词 文档分类层次分类限制投票法    
Abstract

On large amount of document category quantity, hierarchical text classification is an effective approach. However, classification methods using the top-down approach suffer from blocking. To address the problem, this paper proposes an improved hierarchical classification method, namely restricted voting method. Our experiments using Rocchio classifiers on the elementary education subjects resource have shown that it can reduce blocking and improve the classification performance.

Key wordsDocument classification    Hierarchical classification    Restricted voting method
收稿日期: 2006-11-17      出版日期: 2007-02-25
: 

G354.4

 
通讯作者: 谭金波      E-mail: yttjb@163.com
作者简介: 谭金波
引用本文:   
谭金波 . 一种改进的文档层次分类方法[J]. 现代图书情报技术, 2007, 2(2): 56-59.
Tan Jinbo . An Improved Hierarchical Document Classification Method. New Technology of Library and Information Service, 2007, 2(2): 56-59.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2007.02.12      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2007/V2/I2/56

1袁时金,李荣陆,周水庚,胡运法. 层次化中文文档分类. 通信学报,2004(11):55-63
2肖雪,何中市. 基于向量空间模型的中文文本层次分类方法研究. 计算机应用, 2006(5):1125-1126,1133
3朱华宇,孙正兴,张福炎. 一个基于向量空间模型的中文文本自动分类系统. 计算机工程, 2001(2):15-17,63
4高波,赵政. 文本层次分类系统的研究. 计算机工程与应用,2006(11):176-178
5Sun A,Lim E P,Ng W K,Srivastava J. Blocking reduction strategies in hierarchical text classification. IEEE Trans. on Knowledge and Data Eng,2004,16(10): 1305-1308
6Sun A,Lim E P. Hierarchical text classification and evaluation. In Proc. of 1st IEEE ICDM,2001 (11):521-528
7Dumais S T,Chen H. Hierarchical classification of Web content. In Proc. of 23rd ACM SIGIR,2000(7):256-263
8Greiner R,Grove A,Schuurmans D. On learning hierarchical classifications. http://citeseer.nj.nec.com/article/greiner97learning.html (Accessed Mar.5,2005)
9Larkey L S,Croft W B. Combining classifiers in text categorization. In Proc. of 19th ACM SIGIR,1996(8):289-297
10Li Y H,Jian A K. Classification of text documents. The Computer Journal,1998,41(8):537-546
11Sebastiani F. Machine learning in automated text categorization. ACM Computing Surveys,2002,34(1):1-47
12谭金波.基于Web的基础教育资源自动分类技术研究:[学位论文].南京:南京师范大学教育技术学院,2006.

[1] 王鑫芸,王昊,邓三鸿,张宝隆. 面向期刊选择的学术论文内容分类研究 *[J]. 数据分析与知识发现, 2020, 4(7): 96-109.
[2] 夏天. 基于维基百科的中文文本层次路径生成研究*[J]. 现代图书情报技术, 2016, 32(3): 25-32.
[3] 王昊, 叶鹏, 邓三鸿. 机器学习在中文期刊论文自动分类研究中的应用[J]. 现代图书情报技术, 2014, 30(3): 80-87.
[4] 谭金波,杨晓江,李艺. 基于统计-规则方法的网页层次分类技术研究[J]. 现代图书情报技术, 2007, 2(8): 59-62.
[5] 王效岳,白如江. 基于变精度粗糙集模型的Web文档分类方法[J]. 现代图书情报技术, 2005, 21(12): 51-54.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn