Please wait a minute...
Advanced Search
现代图书情报技术  2010, Vol. 26 Issue (7/8): 79-83     https://doi.org/10.11925/infotech.1003-3513.2010.07-08.14
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
基于条件随机场的介宾结构自动识别*
朱丹浩 王东波 谢靖
(南京大学信息管理系 南京 210093)
Automatic Identification of Prepositional Phrase Based on Conditional Random Field
Zhu Danhao  Wang Dongbo  Xie Jing
(Department of Information Management, Nanjing University, Nanjing 210093, China)
全文: PDF (384 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

基于条件随机场对介宾结构进行自动识别的研究。为有效地识别介宾结构,基于清华树库统计介宾结构的外部和内部语言学特征。基于条件随机场,结合介宾结构的语言学特征,使用复杂特征模板对无嵌套介宾结构和有嵌套介宾结构进行自动识别。在开放测试中,F值最高分别达到90.29%和89.99%。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
朱丹浩
王东波
谢靖
关键词 条件随机场介宾结构特征模板自动识别    
Abstract

Based on Conditional Random Fields(CRF), the article identifies the Chinese prepositional phrase. In order to identify the prepositional phrase effectively, the article counts and analyzes the external and internal linguistic features of the prepositional phrase. The prepositional phrases without nesting and nested prepositional phrases are identified with the complex feature model,and in open tests,the best F value can reach 90.29% and 89.99% respectively.

Key wordsConditional random field    Prepositional phrase    Feature template    Automatic identification
收稿日期: 2010-06-21      出版日期: 2010-09-19
: 

TP391

 
基金资助:

本文系教育部人文社会科学重点研究基地重大项目“基于智能信息处理的知识挖掘技术及应用研究”(项目编号:08JJD870225)和国务院侨务办公室课题项目“网络侨情智能服务平台”(项目编号:GQBQ2009052)的研究成果之一。

通讯作者: 朱丹浩     E-mail: zhudanhaozhudanhao@gmail.com
作者简介: 朱丹浩 王东波 谢靖
引用本文:   
朱丹浩 王东波 谢靖. 基于条件随机场的介宾结构自动识别*[J]. 现代图书情报技术, 2010, 26(7/8): 79-83.
Zhu Danhao Wang Dongbo Xie Jing. Automatic Identification of Prepositional Phrase Based on Conditional Random Field. New Technology of Library and Information Service, 2010, 26(7/8): 79-83.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2010.07-08.14      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2010/V26/I7/8/79

[1] 周强,孙茂松,黄昌宁.汉语句子的组块分析体系[J].计算机学报,1999,22(11):1158-1165.
[2] Brill E,Resnik P.A Rule-based Approach to Prepositional Phrase-attachment Disambiguation[C]. In:Proceedings of the 15th Conference on Computational Linguistics,Kyoto,Japan.1994.
[3] Pantel P,Lin D.An Unsupervised Approach to Prepositional Phrase Attachment Using Contextually Similar Words[C].In:Proceedings of Association for Computational Linguistics.1998.
[4] Schwartz L,Aikawa T,Quirk C.Disambiguation of English PP Attachment Using Multilingual Aligned Data[C].In: Proceedings of MT Summit IX,New Orleans,USA.2003.
[5] McLauchlan M.Thesauruses for Prepositional Phrase Attachment[C].In:Proceedings of CoNLL,Boston,MA,USA.2004:73-80.
[6] 干俊伟,黄德根.汉语介词短语的自动识别[J].中文信息学报,2005,19(4):17-23.
[7] 奚建清,罗强.基于HMM的汉语介词短语自动识别研究[J].计算机工程,2007,33(3):172-173,182.
[8] 于俊涛. 基于最大熵的汉语介词短语自动识别[D].大连:大连理工大学,2006:35.
[9] The Features of CRF++[EB/OL].[2009-12-06].http://crfpp.sourceforge.net/#features.
[10] Lafferty J, McCallum A, Pereira F. Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data[C]. In: Proceedings of International Conference on Machine Learning.2001:3-4.
[11] Sutton C, McCallum A. An Introduction to Conditional Random Fields for Relational Learning[M]. MIT Press, 2006:2-7.

[1] 王昊, 林克柔, 孟镇, 李心蕾. 文本表示及其特征生成对法律判决书中多类型实体识别的影响分析[J]. 数据分析与知识发现, 2021, 5(7): 10-25.
[2] 成彬,施水才,都云程,肖诗斌. 基于融合词性的BiLSTM-CRF的期刊关键词抽取方法[J]. 数据分析与知识发现, 2021, 5(3): 101-108.
[3] 赵平,孙连英,涂帅,卞建玲,万莹. 改进的知识迁移景点实体识别算法研究及应用*[J]. 数据分析与知识发现, 2020, 4(5): 118-126.
[4] 李成梁,赵中英,李超,亓亮,温彦. 基于依存关系嵌入与条件随机场的商品属性抽取方法*[J]. 数据分析与知识发现, 2020, 4(5): 54-65.
[5] 黄菡,王宏宇,王晓光. 结合主动学习的条件随机场模型用于法律术语的自动识别*[J]. 数据分析与知识发现, 2019, 3(6): 66-74.
[6] 高原,王东,冯宏伟,施元磊,段治州. 基于GPS轨迹数据的城市交叉路口识别 *[J]. 数据分析与知识发现, 2019, 3(11): 24-34.
[7] 肖连杰,孟涛,王伟,吴志祥. 基于深度学习的情报分析方法识别研究 * ——以安全情报领域为例[J]. 数据分析与知识发现, 2019, 3(10): 20-28.
[8] 唐慧慧, 王昊, 张紫玄, 王雪颖. 基于汉字标注的中文历史事件名抽取研究*[J]. 数据分析与知识发现, 2018, 2(7): 89-100.
[9] 王东波, 吴毅, 叶文豪, 刘睿伦. 多特征知识下的食品安全事件实体抽取研究*[J]. 数据分析与知识发现, 2017, 1(3): 54-61.
[10] 张越, 王东波, 朱丹浩. 面向食品安全突发事件汉语分词的特征选择及模型优化研究*[J]. 数据分析与知识发现, 2017, 1(2): 64-72.
[11] 张琳, 秦策, 叶文豪. 基于条件随机场的法言法语实体自动识别模型研究*[J]. 数据分析与知识发现, 2017, 1(11): 46-52.
[12] 王密平,王昊,邓三鸿,吴志祥. 基于CRFs的冶金领域中文专利术语抽取研究*[J]. 现代图书情报技术, 2016, 32(6): 28-36.
[13] 王小梅,邓启平. 科学结构地图的领域群自动识别研究*[J]. 现代图书情报技术, 2016, 32(4): 48-55.
[14] 贺惠新,刘丽娟. 主动学习的科技文献研究对象标引体系研究*[J]. 现代图书情报技术, 2016, 32(3): 67-73.
[15] 隋明爽,崔雷. 结合多种特征的CRF模型用于化学物质-疾病命名实体识别[J]. 现代图书情报技术, 2016, 32(10): 91-97.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn