Please wait a minute...
Advanced Search
现代图书情报技术  2009, Vol. Issue (9): 70-75     https://doi.org/10.11925/infotech.1003-3513.2009.09.12
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
基于模式匹配的军事演习情报信息抽取*
贾美英1,3  杨炳儒郑德权2,3  曹鸿强杨靖张练2
1(北京科技大学信息工程学院 北京 100083)
2(哈尔滨工业大学教育部-微软语言语音重点实验室 哈尔滨 150001)
3(北京图形研究所 北京 100029)
Sham Battle Information Extraction Based on Pattern Matching
Jia Meiying1,3  Yang BingruZheng Dequan2,3 Cao HongqiangYang JingZhang Lian2
1(School of Information Engineering, University of Science and Technology Beijing, Beijing 100083,China)
2(MOE-MS Key Laboratory of Natural Language Processing and Speech, Harbin Institute of Technology, Harbin 150001,China)
3(Beijing Graphic Institution, Beijing 100029,China)
全文: PDF (632 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

 以军事演习情报信息抽取为突破点,采用基于模式匹配的方法进行演习情报的抽取。在信息抽取的不同环节,采用层次自动分类方法进行待抽取文本筛选;采用基于种子模式的自举方法结合领域词典进行军事演习组块识别;采用基于语料标注的方法进行事件属性模式学习获取。实验结果表明该方法在特定领域内的有效性,在实际工程项目中达到可应用状态。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
贾美英
杨炳儒
郑德权
曹鸿强
杨靖
关键词  信息抽取军事演习模式获取模式匹配    
Abstract

 This paper starts from the sham battle intelligence information, and uses the method based on pattern matching to extract sham battle intelligence information.In different steps of information extraction, hierarchical text categorization method is used to filter the target text; seed pattern bootstrapping method together with field dictionary are used to recognize the sham battle blocks; corpus-based method is used to learn and acquire the event patterns.The experimental result shows that this method is effective in special application field, and it is usable in real projects.

Key wordsInformation Extraction    Sham battle    Pattern Matching    Semi-automatic Studying    Event Information Extraction
收稿日期: 2009-06-12      出版日期: 2009-09-25
: 

TP391

 
基金资助:

*本文系国家自然科学基金资助项目“基于大规模复杂结构知识库的知识发现机理、模型与算法研究”(项目编号:60875029)的研究成果之一。

通讯作者: 贾美英     E-mail: jmy100@tom.com
作者简介: 贾美英,杨炳儒,郑德权,曹鸿强,杨靖,张练
引用本文:   
贾美英,杨炳儒,郑德权,曹鸿强,杨靖,张练. 基于模式匹配的军事演习情报信息抽取*[J]. 现代图书情报技术, 2009, (9): 70-75.
Jia Meiying,Yang Bingru,Zheng Dequan,Cao Hongqiang,Yang Jing,Zhang Lian. Sham Battle Information Extraction Based on Pattern Matching. New Technology of Library and Information Service, 2009, (9): 70-75.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2009.09.12      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2009/V/I9/70

[1] 李保利,陈玉忠,俞士汶.信息抽取研究综述[J].计算机工程与应用,2003,39(10):1-5.
[2] Doddington G,Mitchell A, Przybocki M,et al. The Automatic Content Extraction(ACE) Program-Tasks, Data, and Evaluation[C].In: Proceedings of LREC.2004:837-840.
[3]Hai Leong Chieu, Hwee Tou Ng. A Maximum Entropy Approach to Information Extraction from Semi-structured and Free Text[C]. In: Proceedings of the 18th National Conference on Artificial Intelligence, Edmonton, Alberta,Canada. Menlo Park, CA, USA: American Association for Artificial Intelligence,2002:786-791.
[4] 李向阳,苗壮.自由文本信息抽取技术[J].情报科学,2004,22(7):817-820.
[5] 郑家恒,王兴义,李飞.信息抽取模式自动生成方法的研究[J].中文信息学报,2004,18(1):48-54.
[6] 姜吉发.自由文本的信息抽取模式获取的研究[D].北京:中国科学院计算技术研究所,2005.
[7] Riloff E.Automatically Constructing a Dictionary for Information Extraction Tasks[C].In: Proceedings of the 11th National Conference on Artificial Intelligence, Washington DC.1993:811-816.
[8] Riloff E,Shoen J. Automatically Acquiring Conceptual Answer Patterns Without an Annotated Corpus[C]. In: Proceedings of the 3rd Workshop on Very Garge Corpora, MIT.1995:148-161.
[9] Yangarber R. Scenario Customization for Information Extraction[D]. New York: New York University, 2001.
[10] Joyce Yue Chai. Learning and Generalization in the Creation of Information Extraction Systems[D]. Duke:Graduate School of Duke University,1998.
[11] Breiman L. Bagging Predictors[J]. Machine Learning,1996,24(2):123-240.
[12] Freund Y, Schapire R E. Experiments with a New Boosting Algorithm[C]. In: Proceedings of the 13th International Conference on Machine Learning. Morgan Kaufmann,1996:148-156.
[13] 边肇祺,张学工.模式识别[M].北京:清华大学出版社,2000.
[14] Richard O Duda,Peter E Hart. 模式分类[M].李宏东,姚天翔译.北京:机械工业出版社,2003.
[15] 宗成庆.统计、自然语言处理[M].北京:清华大学出版社,2008.
[16] Kernel-Machines.org[EB/OL].[2009-02-10].http://www.kernel-machines.org.
[17] 计算两串字符相似度算法[EB/OL].[2008-09-12].http://www.blogjava.net/chenlb/archive/2008/06/25/210456.html.
[18]李跃进,赵晶,林鸿飞.基于Internet的军事演习信息抽取系统[J].计算机工程与应用,2006,42(14):214-218.

[1] 董美,常志军,张润杰. 一种面向科技文献元数据增量数据规范的多模式匹配算法*[J]. 数据分析与知识发现, 2021, 5(6): 135-144.
[2] 史礼婷,张骞,钟永恒,胡思思,李贞贞. 双向模式匹配在年鉴数据预处理平台中的应用[J]. 现代图书情报技术, 2016, 32(9): 88-94.
[3] 姜春涛. 自动标注中文专利的引文信息[J]. 现代图书情报技术, 2015, 31(10): 81-87.
[4] 李树青,程国达,王维民. 基于加权XML模型的XML数据与DTD模式匹配*[J]. 现代图书情报技术, 2010, 26(1): 57-65.
[5] 张雅珊. 机读目录的模糊检索问题及改进[J]. 现代图书情报技术, 2008, 24(7): 91-95.
[6] 王昊 . 基于层次模式匹配的命名实体识别模型[J]. 现代图书情报技术, 2007, 2(5): 62-68.
[7] 苗杰,邵品洪. BM模式匹配算法的改进研究[J]. 现代图书情报技术, 1994, 10(3): 36-39.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn