Please wait a minute...
Advanced Search
现代图书情报技术  2006, Vol. 1 Issue (8): 42-45     https://doi.org/10.11925/infotech.1003-3513.2006.08.09
  信息检索技术 本期目录 | 过刊浏览 | 高级检索 |
基于反序词典的中文逆向最大匹配分词系统设计*
张李义1,2 李亚子1
1(武汉大学信息管理学院 武汉 430072)
2(武汉大学信息资源研究中心 武汉 430072)
A Chinese Reverse-order Directional Maximum Mathching Segmentation System Design Based Converse Dictionary
Zhang Liyi1,2    Li Yazi1
1 (School of Information Management, Wuhan University, Wuhan 430072,China)
2 (Center for Studies of Information Resources, Wuhan University, Wuhan 430072,China)
全文:
输出: BibTeX | EndNote (RIS)      
摘要 

介绍几种常见的分词算法,在改进传统的反序词典、优化逆向最大匹配算法的基础上,设计并实现基于逆向最大匹配的中文分词系统,试验证明速度和精度都有显著提高。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
李亚子
张李义
关键词 反序词典最大匹配逆向最大匹配自动分词    
Abstract

 This paper introduces normal segmentation algorithms, and based on the improving Chinese converse dictionary and optimizing reverse-order directional maximum matching algorithm, designs a Chinese segmentation system. In the experiment, the speed and accuracy are improved obviously.

Key wordsReverse-order dictionary    Maximum matching    Reverse maximum matching    Auto segmentation
收稿日期: 2006-05-25      出版日期: 2006-08-25
: 

G254

 
基金资助:

* 本文系国家社会科学基金项目“面向政府电子采购的推荐系统研究与实现”(项目编号:05BTQ022)的中期研究成果之一。

通讯作者: 张李义     E-mail: 8982632@163.com
作者简介: 张李义,李亚子
引用本文:   
张李义,李亚子 . 基于反序词典的中文逆向最大匹配分词系统设计*[J]. 现代图书情报技术, 2006, 1(8): 42-45.
Zhang Liyi,Li Yazi . A Chinese Reverse-order Directional Maximum Mathching Segmentation System Design Based Converse Dictionary. New Technology of Library and Information Service, 2006, 1(8): 42-45.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2006.08.09      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2006/V1/I8/42

1刘源. 信息处理用现代汉语分词规范及自动分词方法. 北京: 清华大学出版社, 1994
2Pak-kwong Wong, Chorkin Chan. Chinese Word Segmentation based on Maximum Matching and Word Binding Force.In:International Conference On Computational Linguistics Proceedings of the 16th conference on Computational linguistics.Copenhagen,Denmark,1996: 200-203
3ERIK HATCHER, OTIS GOSPODNETIC. Lucene In Action. America: Manning Publications Co.2005
4刘宏涛. 中文自动分词系统的设计模型. 计算机与数字工程,2005, 33 (4):138-140
5赵艳红,费洪晓. 一个基于改进的反序分词词典的中文分词算法. 深圳职业技术学院学报, 2004, 4 : 28-31
6HongLan Jin, Kam-Fai Wong. A Chinese Dictionary Construction Algorithm for Information Retrieval.In:ACM Transactions on Asian Language Information Processing. ACM Press,2002: 281-296
7刘开瑛. 中文文本自动分词和标注, 北京: 商务印书馆, 2000

[1] 王晓玉, 李斌. 基于CRFs和词典信息的中古汉语自动分词*[J]. 数据分析与知识发现, 2017, 1(5): 62-70.
[2] 谷俊, 王昊. 基于领域中文文本的术语抽取方法研究[J]. 现代图书情报技术, 2011, 27(4): 29-34.
[3] 白如星,张成昱,王茜. 基于缩略语转换的手机图书馆发布信息预处理机制初探*[J]. 现代图书情报技术, 2010, 26(3): 64-70.
[4] 麦范金,王挺.
基于双向最大匹配和HMM的分词消歧模型*
[J]. 现代图书情报技术, 2008, 24(8): 37-41.
[5] 向晖,郭一平,王亮 . 基于Lucene的中文字典分词模块的设计与实现[J]. 现代图书情报技术, 2006, 1(8): 46-50.
[6] 孙巍 . 一种面向中文信息检索的汉语自动分词方法[J]. 现代图书情报技术, 2006, 1(7): 33-36.
[7] 黄水清,程冲 . 基于既定词表的自适应汉语分词技术研究[J]. 现代图书情报技术, 2006, 1(5): 13-17.
[8] 文庭孝,邱均平,侯经川. 汉语自动分词研究展望[J]. 现代图书情报技术, 2004, 20(7): 6-10.
[9] 黄崑,符绍宏. 自动分词技术及其在信息检索中应用的研究[J]. 现代图书情报技术, 2001, 17(3): 26-29.
[10] 尹锋. 汉语自动分词研究的现状与新思维[J]. 现代图书情报技术, 1998, 14(4): 22-26.
[11] 徐进鸿,邵品洪,李明霞. 情报检索数学模型及若干技术进展*[J]. 现代图书情报技术, 1990, 6(3): 5-10.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn