Please wait a minute...
Advanced Search
现代图书情报技术  2005, Vol. 21 Issue (12): 44-47     https://doi.org/10.11925/infotech.1003-3513.2005.12.10
  网络资源与建设 本期目录 | 过刊浏览 | 高级检索 |
种基于改进的支持向量机的两类文本分类方法的研究*
应伟王正欧安金龙2
1(天津大学系统工程研究所 天津 300072)
2(河北工业大学 天津 300130)
Research on Two Classes Text Categorization Method Based on an Improved Support Vector Machine
Ying Wei1   Wang Zhengou1   An Jinlong2
1 (Institute of Systems Engineering, Tianjin University, Tianjin 300072, China)
2 (Hebei University of Technology, Tianjin 300130, China)
全文:
输出: BibTeX | EndNote (RIS)      
摘要 

提出了一种基于预抽取支持向量机及模糊循环迭代算法的改进的支持向量机(Support Vector Machines,SVM)的两类文本分类方法, 与传统的SVM相比, 该方法具有高得多的计算效率。文中给出了具体算法并将其用于文本分类中,实验表明了本算法用于文本分类的有效性及其高效率。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
关键词 文本分类支持向量机预抽取向量模糊循环迭代算法    
Abstract

This paper puts forward a method of two text categorization classes based on the pre-extracting support vectors and fuzzy circulated iterative algorithm. Compared with the conventional Support Vector Machines(SVM), the present method possesses much higher computation efficiency. This paper gives the concrete procedure of the algorithm, and applies it to the text classification. Experimental results demonstrate the effectiveness and the efficiency of the approach.

Key wordsText categorization    Support Vector Machines(SVM)    Pre-extracting support vectors    Fuzzy circulated iterative algorithm
收稿日期: 2005-08-29      出版日期: 2005-12-25
: 

G254.1

 
基金资助:

*本文系国家自然科学基金资助项目(No.60275020)。

通讯作者: 应伟     E-mail: nobertying@126.com
作者简介: 应伟,王正欧,安金龙
引用本文:   
应伟,王正欧,安金龙. 种基于改进的支持向量机的两类文本分类方法的研究*[J]. 现代图书情报技术, 2005, 21(12): 44-47.
Ying Wei,Wang Zhengou,An Jinlong. Research on Two Classes Text Categorization Method Based on an Improved Support Vector Machine. New Technology of Library and Information Service, 2005, 21(12): 44-47.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2005.12.10      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2005/V21/I12/44

1Talwar V, Mitra P.  Web mining in soft computing framework: relevance, state of the art and future directions. Neural Networks, IEEE Transactions on , Volume: 13 , Issue: 5 , Sep 2002, 1163-1177
2Chih-Wei Hsu, Chih-Jen Lin.  A comparison of methods for multiclass support vector machines.  IEEE Transactions on Neural Networks, 2002, 13(2):415-425
3安金龙,王正欧. 一种新的支持向量机多类分类方法. 信息与控制,2004,(3):262-267
4史忠植. 知识发现. 北京 清华大学出版社,2002
5Wemter G, Arevian, and C pancjev.  Recurrent Neural Network Learing for Text Routing. Proceedings of the International Conference on Artificial Neural Network. Edinburgh, UK,1999, 898-903
6Rennie and Ryan Rifkin.  Improving Multiclass Text Classification with the Support Vector Machine\
[DB/OL\]. Online at: \
[www.ai.mit.edu/research/abstractabstracts2001/machine-learning\] Available: May 23,2002
7Joachims T.  Text categorization with Support Vector Machines:Learning with Many Relevant Features. Proceedings10th European Conference on Machine Learning.1998, ECML-98, 137-142
8Susan Dumais, John Platt, David Hekerman, and M Sahami.  Inductive Learning Algorithms and Representations for text Categorization. 7th International Conference on Information and Knowledge Management, 1998
9Bssu A , Watters C, Shepherd M.  Support Vector Machines for Text categorization . System Sciences, proceedings of the 36th Annual Hawaii International, 6-9Jan, 2003, 7-13
10王明春,王正欧, 张楷等.  一种基于CHI值特征选取的粗糙集文本分类规则抽取方法. 计算机应用, 2005(5):1026-1028
11Vladimir N Vapnik.  An overview of Statistical Learning Theory. IEEE Transactions on Neural Networks, 1999,10(5): 988-999
12Nello Cristianini & John Shawe-Taylor.  An Introduction To Support Vector Machines.New York, USA, Cambridge University Press,2000
13Vasehgi S V.  State duration modeling in hidden Markov models. Signal processing, 1995, (41):31-41
14Vladimir N, Vapnik.  Statistical Learning Theory. Wiley-Interscience Publication, John Wiley&Sons,Inc.New York, USA,1998
15Mokhtar Bazaraa, Hanif Sherali, and Shetty.  Nonlinear Programming: Theory and Algorithms,2nd Edition.Hamilton printing, John Wiley&Sons, Inc.New York, USA, 1993
16安金龙,王正欧. 一种适合于增量学习的支持向量机的快速循环算法. 计算机应用, 2003,23(10):12-14
17安金龙, 王正欧. 预抽取支持向量机的支持向量. 计算机工程, 2004, 30 (10): 10-12
18Zhang Li, Zhou Weida, Jiao Licheng.  Pre-extracting Support Vectors fof Support Vector    Machine. Signal Processing Proceedings, 2000 (3):1432-1435
19Cortes C, Vladimir N Vapnik.  Support Vector Networks. Machine Learning, 1995 (20):273-297
20John Platt.  Fast Training of Support Vector Machines using Sequential Minimal Optimization. Advances in Kernel Methods-Support Vector Learning. Cambridge, MA, MIT Press, 1999,185-208
21Christopher Burges.  A Tutorial on Support Vector Machines for Pattern Recognition. Data Mining and Knowledge Discovery, 1998, 2(2):121-167

[1] 陈杰,马静,李晓峰. 融合预训练模型文本特征的短文本分类方法*[J]. 数据分析与知识发现, 2021, 5(9): 21-30.
[2] 周泽聿,王昊,赵梓博,李跃艳,张小琴. 融合关联信息的GCN文本分类模型构建及其应用研究*[J]. 数据分析与知识发现, 2021, 5(9): 31-41.
[3] 余本功,朱晓洁,张子薇. 基于多层次特征提取的胶囊网络文本分类研究*[J]. 数据分析与知识发现, 2021, 5(6): 93-102.
[4] 沈旺, 李世钰, 刘嘉宇, 李贺. 问答社区回答质量评价体系优化方法研究 *[J]. 数据分析与知识发现, 2021, 5(2): 83-93.
[5] 王艳, 王胡燕, 余本功. 基于多特征融合的中文文本分类研究*[J]. 数据分析与知识发现, 2021, 5(10): 1-14.
[6] 冯昊, 李树青. 基于多种支持向量机的多层级联式分类器研究及其在信用评分中的应用*[J]. 数据分析与知识发现, 2021, 5(10): 28-36.
[7] 唐晓波,高和璇. 基于关键词词向量特征扩展的健康问句分类研究 *[J]. 数据分析与知识发现, 2020, 4(7): 66-75.
[8] 王思迪,胡广伟,杨巳煜,施云. 基于文本分类的政府网站信箱自动转递方法研究*[J]. 数据分析与知识发现, 2020, 4(6): 51-59.
[9] 徐月梅,刘韫文,蔡连侨. 基于深度融合特征的政务微博转发规模预测模型*[J]. 数据分析与知识发现, 2020, 4(2/3): 18-28.
[10] 丁晟春,俞沣洋,李真. 网络舆情潜在热点主题识别研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 29-38.
[11] 龚丽娟,王昊,张紫玄,朱立平. Word2Vec对海关报关商品文本特征降维效果分析*[J]. 数据分析与知识发现, 2020, 4(2/3): 89-100.
[12] 徐彤彤,孙华志,马春梅,姜丽芬,刘逸琛. 基于双向长效注意力特征表达的少样本文本分类模型研究*[J]. 数据分析与知识发现, 2020, 4(10): 113-123.
[13] 余本功,曹雨蒙,陈杨楠,杨颖. 基于nLD-SVM-RF的短文本分类研究*[J]. 数据分析与知识发现, 2020, 4(1): 111-120.
[14] 聂维民,陈永洲,马静. 融合多粒度信息的文本向量表示模型 *[J]. 数据分析与知识发现, 2019, 3(9): 45-52.
[15] 邵云飞,刘东苏. 基于类别特征扩展的短文本分类方法研究 *[J]. 数据分析与知识发现, 2019, 3(9): 60-67.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn