Please wait a minute...
Advanced Search
现代图书情报技术  2010, Vol. 26 Issue (2): 74-78     https://doi.org/10.11925/infotech.1003-3513.2010.02.13
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
基于基本要素方法的中文自动文本摘要模型*
程倩倩  田大钢
(上海理工大学管理学院   上海 200093)
Automatic Chinese Summarization Model Based on Basic Elements Method
Cheng Qianqian   Tian Dagang
(Business School, University of Shanghai for Science and Technology, Shanghai 200093, China)
全文: PDF (400 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

提出一种基于基本要素方法的中文自动文本摘要模型(BESM)。该模型主要借鉴基本要素的思想进行建立,和单纯的基于词的自动文摘模型相比,它将语义信息作为评估句子重要程度的一部分,实现基本要素中提出的将语义信息和统计方法的结合。通过与普通方法的实例对比,突出基本要素方法的优越性和BESM模型的可行性。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
程倩倩
田大钢
关键词 基本要素方法BESM中文自动文本摘要    
Abstract

The article proposes a model of automation Chinese summarization based on the basic elements method(BESM). The model uses the basic elements method theory, and it has some advantages that comparing with the model based on words, the model shows more symantic information. Combining the symantic information with statistic approach makes our summarization more precise and quick. Finally,the experiment results show that the BESM is better than common method.

Key wordsBE method    BESM    Automatic Chinese summarization
收稿日期: 2010-01-22      出版日期: 2010-02-25
: 

TP391

 
基金资助:

*本文系上海市重点学科项目(第三期)“管理科学与工程”(项目编号:S30504)和国家科技支撑项目“温室栽培管理专家系统推理方法研究”(项目编号:2008BADA6B01)的研究成果之一。

通讯作者: 程倩倩     E-mail: cheng2qian@163.com
作者简介: 程倩倩,田大钢
引用本文:   
程倩倩,田大钢. 基于基本要素方法的中文自动文本摘要模型*[J]. 现代图书情报技术, 2010, 26(2): 74-78.
Cheng Qianqian,Tian Dagang. Automatic Chinese Summarization Model Based on Basic Elements Method. New Technology of Library and Information Service, 2010, 26(2): 74-78.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2010.02.13      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2010/V26/I2/74

[1] 江开忠,李子成,顾君忠.自动文本摘要方法[J].计算机工程, 2008, 34(1): 221-223.
[2] Dragomir R, Jing H Y, Malgorzata B. Centroid-based Summarization of Multiple Documents: Sentence Extraction, Utility-based Evaluation and User Studies [J]. Information Processing and Management, 2004, 40(6):919-938.
[3] Hovy E, Lin C Y, Zhou L. Evaluating DUC 2005 Using Basic Elements[C]. In:Proceedings of the Document Understanding Conference, Canada.2005.
[4] Akiko Yamamoto, Junichi Fukumoto. Automatic Evaluation of Question Answering System Based on BE Method [C]. In:Proceedings of the 23rd International Technical Conference on Circuits/Systems, Computers and Communications.2008:613-616.
[5] 刘德喜,姬东鸿.基于基本要素的文摘内容连贯性评测模型[J].计算机学报, 2008, 31(4): 628-635.
[6] 刘德喜,何炎祥,姬东鸿,等.基于基本要素向量空间的英文多文档自动文摘[J].计算机工程, 2007, 33(14): 166- 167, 170.
[7] 苗守谦,卫志华.中文文本信息处理的原理与应用[M].北京:清华大学出版社, 2007:109-150.
[8] Baeza-Yates R, Ribeiro-Neto B. Modern Information Retrieval[M]. New York: Addison Wesley, 1999: 27-30.
[9] 任纪生,张驰,王作英.一种基于词序信息的自动文摘方法[J].计算机工程与设计, 2007,28(1):178- 181.
[10] 袁津生,赵传刚.搜索引擎与信息检索教程[M].北京:中国水利水电出版社, 2008:42-71,156-181.
[11] Salton G,Wong A,Yang C S.  A Vector Space Model for Automatic Indexing[J]. Communications of the ACM, 1975, 18(11): 613-620.
[12] Webb A R. Statistical Pattern Recognition [M]. 2nd Edition. John Wiley & Sons, 2002: 376-379.
[13] Chali Y, Joty S R. Selecting Sentences for Answering Complex Questions[C].In: Proceedings of the 2008 Conference on Empirical Methods in Natural Language Processing.2008:304-313.
[14] 王萌,李春贵,唐培和,等.一种主题句发现的中文自动文摘研究[J].计算机工程, 2007,33(8):180- 181,189.
[15] 中国新闻网.温家宝出席世博国际论坛开幕式并发表演讲[EB/OL].[2009-11-12].http://www.chinanews.com.cn/expo/news/2009/11-12/1960688.shtml.
[16] 人民网.第七届中国2010年上海世博会国际论坛闭幕式闭幕词[EB/OL].[2009-11-12].http://2010.people.com.cn/GB/10368942.html.

[1] 吕英杰, 范静, 刘景方. 基于文体学的中文UGC作者身份识别研究[J]. 现代图书情报技术, 2013, 29(9): 48-53.
[2] 王昊, 邹杰利, 邓三鸿. 面向中文图书的自动标引模型构建及实验分析[J]. 现代图书情报技术, 2013, 29(7/8): 55-62.
[3] 郭舒. 文献数据库中作者名消歧算法研究[J]. 现代图书情报技术, 2013, 29(7/8): 69-74.
[4] 胡昌平, 陈果. 共词分析中的词语贡献度特征选择研究[J]. 现代图书情报技术, 2013, 29(7/8): 89-93.
[5] 李霄, 丁晟春. 垃圾商品评论信息的识别研究[J]. 现代图书情报技术, 2013, 29(1): 63-68.
[6] 曾少勤, 王惠临, 张寅生. 汉语文本的最小递归语义表示研究——以名词性量化短语为例[J]. 现代图书情报技术, 2012, (10): 35-41.
[7] 宋文, 黄金霞, 刘毅, 汤怡洁. 面向知识发现的SKE关键技术及服务[J]. 现代图书情报技术, 2012, 28(7): 13-18.
[8] 王莉. 基于关键词链的动态分面研究[J]. 现代图书情报技术, 2012, 28(7): 76-81.
[9] 刘萍, 陈烨. 词汇相似度研究进展综述[J]. 现代图书情报技术, 2012, 28(7): 82-89.
[10] 朱雯晶, 夏翠娟. 二维码在图书馆移动服务中的应用——以上海图书馆为例[J]. 现代图书情报技术, 2012, 28(7): 115-120.
[11] 马健, 杜泽宇, 李树青. 基于多兴趣特征分析的图书馆个性化图书推荐方法[J]. 现代图书情报技术, 2012, 28(6): 1-8.
[12] 江华, 苏晓光. 无词典中文高频词快速抽取算法[J]. 现代图书情报技术, 2012, 28(6): 50-53.
[13] 薛建武, 白燚. 本体拓扑结构关系存储研究[J]. 现代图书情报技术, 2012, 28(5): 26-31.
[14] 肖晶, 梁冰, 张晓丹, 吕世炅. 一种面向篇级数据的作者名消歧规则和算法[J]. 现代图书情报技术, 2012, 28(5): 55-59.
[15] 李振清, 刘建毅, 王枞, 吴旭. 同行评议专家遴选系统研究与实现[J]. 现代图书情报技术, 2012, 28(5): 81-86.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn