Please wait a minute...
Advanced Search
现代图书情报技术  2010, Vol. 26 Issue (10): 65-69    DOI: 10.11925/infotech.1003-3513.2010.10.11
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
基于规则与统计相结合的互联网突发事件识别研究
夏彦, 何琳, 潘运来, 欧阳辰晨
南京农业大学信息科学技术学院 南京 210095
Research on Recognition of Sudden Events on Web Based on Combination of Rules and Statistical Method
Xia Yan, He Lin, Pan Yunlai, Ouyang Chenchen
College of Information and Technology, Nanjing Agricultural University, Nanjing 210095,China
全文: PDF(473 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

针对互联网大量突发事件新闻语料的标题和正文分别进行预处理,建立特征向量库,利用决策表规则和最短向量距离相结合的匹配方法对文本的主题进行双重识别,从而更好地服务于互联网突发事件自动识别。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
夏彦
何琳
潘运来
欧阳辰晨
关键词 突发事件识别规则识别统计识别    
Abstract

The paper focuses on a large number of news corpus, pretreats the titles and abstracts of training documents, then builds up the feature vector library. At last, it uses matching method of decision table rules and vector space method to identificate the articles in two ways, and makes better service of the sudden events recognition on Web.

Key wordsSudden    event    recognition    Rule-based    recognition    Statistics-based    recognition
收稿日期: 2010-08-16     
: 

G350

 
基金资助:

本文系南京农业大学SRT计划项目“基于规则与统计相结合的互联网突发事件识别研究”(项目编号: 0913A11)的研究成果之一。

引用本文:   
夏彦, 何琳, 潘运来, 欧阳辰晨. 基于规则与统计相结合的互联网突发事件识别研究[J]. 现代图书情报技术, 2010, 26(10): 65-69.
Xia Yan, He Lin, Pan Yunlai, Ouyang Chenchen. Research on Recognition of Sudden Events on Web Based on Combination of Rules and Statistical Method. New Technology of Library and Information Service, DOI:10.11925/infotech.1003-3513.2010.10.11.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2010.10.11


[1] 张广渊,李晶皎,王爱侠.基于知识的满文识别后处理
[J]. 计算机辅助工程 ,2006,15(3):69-71.

[2] 徐文海, 温有奎.一种基于TFIDF方法的中文关键词抽取算法
[J]. 情报理论与实践 ,2008,31(2):298-302.

[3] 张庆国,章成志,薛德军,等.适用于隐含主题抽取的K最近邻关键词自动抽取
[J]. 情报学报 ,2009,28(2):163-168.

[4] 张虹.基于自动文本分类的关键词抽取算法
[J]. 计算机工程 ,2009,35(12):145-147.

[5] Hkkinena J, Suontaustab J, Riisc S, et al. Assessing Text-to-phoneme Mapping Strategies in Speaker Independent Isolated Word Recognition
[J]. Speech Communication, 2003, 41(2-3):455-467 .

[6] 程岚岚,何丕廉,孙越恒.基于朴素贝叶斯模型的中文关键词提取算法研究
[J]. 计算机应用 ,2005,25(12):2780-2782.

[7] 张爱华,荆继武,向继.中文文本分类中的文本表示因素比较
[J]. 中国科学院研究生院学报 ,2009,26(3):400-407.

[8] 李渝勤,孙丽华.基于规则的自动分类在文本分类中的应用
[J]. 中文信息学报 ,2004,18(4):9-14.

[9] 章成志,白振田.文本自动标引与自动分类研究
[M].南京:东南大学出版社,2009:151.

[10] 徐波,孙茂松,靳光瑾.中文信息处理若干重要问题
[M].北京:科学出版社,2003:14-26.

[11] 钟义信.全信息自然语言理解方法论
[J]. 北京邮电大学学报 ,2004,27(4):1-12.

[1] 毕强, 王雨. 国外Folksonomy应用研究的前沿进展及热点分析[J]. 现代图书情报技术, 2013, 29(7/8): 36-42.
[2] 张玉峰, 何超, 王志芳, 周磊. 融合语义聚类的企业竞争力影响因素分析研究[J]. 现代图书情报技术, 2012, (9): 49-55.
[3] 张玉峰, 何超, 王志芳, 周磊. 融合语义分类的企业竞争力影响因素分析研究[J]. 现代图书情报技术, 2012, (9): 56-61.
[4] 滕广青, 毕强, 高娅. 基于概念格的Folksonomy知识组织研究——关联标签的结构特征分析[J]. 现代图书情报技术, 2012, 28(6): 22-28.
[5] 段宇锋, 黑珍珍, 鞠菲, 崔红. 基于自主学习规则的中文物种描述文本的语义标注研究[J]. 现代图书情报技术, 2012, 28(5): 41-47.
[6] 陈芬, 赖茂生. 多特征视频分类挖掘实验研究[J]. 现代图书情报技术, 2012, 28(5): 76-80.
[7] 陈仕吉, 史丽文, 李冬梅, 左文革. 论文被引频次标准化方法述评[J]. 现代图书情报技术, 2012, 28(4): 54-60.
[8] 吴思竹, 钱庆, 胡铁军, 李丹亚, 李军莲, 洪娜. 词形还原方法及实现工具比较分析[J]. 现代图书情报技术, 2012, 28(3): 27-34.
[9] 段宇锋, 鞠菲. 基于N-Gram的专业领域中文新词识别研究[J]. 现代图书情报技术, 2012, 28(2): 41-47.
[10] 陈颖, 张晓林. 基于特征度和词汇模型的专利技术功效矩阵结构生成研究[J]. 现代图书情报技术, 2012, 28(2): 53-59.
[11] 方安, 洪娜, 高东平, 李亚子, 池慧. 传染病本体构建及其在知识服务平台中的应用[J]. 现代图书情报技术, 2012, 28(1): 7-12.
[12] 叶春蕾, 冷伏海. 科技文献全文主题识别方法实证研究[J]. 现代图书情报技术, 2012, 28(1): 53-57.
[13] 陈颖, 张晓林. 专利中技术词和功效词识别方法研究[J]. 现代图书情报技术, 2011, 27(12): 24-30.
[14] 陈颖, 张晓林. 专利技术功效矩阵构建研究进展[J]. 现代图书情报技术, 2011, (11): 1-8.
[15] 王秀艳, 崔雷. 应用关键动词抽取生物医学实体间语义关系研究综述[J]. 现代图书情报技术, 2011, 27(9): 21-27.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn