汉语自动分词模式自动机构造研究

doi:10.11925/infotech.1003-3513.2006.05.12

现代图书情报技术

2006, Vol. 1

Issue (5): 47-49 https://doi.org/10.11925/infotech.1003-3513.2006.05.12

信息检索技术

本期目录 | 过刊浏览 | 高级检索

汉语自动分词模式自动机构造研究

吴绍根

（广东轻工职业技术学院广州 510300）

Study of Scheme Automaton for Chinese Word Automatic Segmentation

Wu Shaogen

(Department of Computer Engineering, Guangdong Industry Technical College, Guangzhou 510300,China)

摘要
参考文献
相关文章
Metrics

全文:
输出: BibTeX | EndNote (RIS)

摘要

基于有限状态自动机，提出一种新型的有限自动机模型——模式自动机，并以该模型为基础，设计出一种新的汉语自动分词模型，给出构造汉语自动分词模型的核心数据结构和构造算法，并分析该分词算法的复杂度。

	服务

	把本文推荐给朋友
	加入引用管理器
	E-mail Alert
	RSS
	作者相关文章
	吴绍根

关键词 ：中文信息处理, 汉语分词, 模式自动机, 二分查找

Abstract：

Based on finite state automaton, a new finite state automaton, named Scheme Automaton is proposed in this paper. On the basis of the model, a new Chinese word automatic segmertation model is designed, and also gives the key data structure and construction algorithm. Then analyzes the complexity of the algorithm.

Key words： Chinese information process Chinese word segmentation Scheme automaton Binary search

收稿日期: 2006-02-07 出版日期: 2006-05-25

TP391

通讯作者: 吴绍根 E-mail: bill3000@126.com

作者简介: 吴绍根

引用本文:

吴绍根 . 汉语自动分词模式自动机构造研究[J]. 现代图书情报技术, 2006, 1(5): 47-49.
Wu Shaogen . Study of Scheme Automaton for Chinese Word Automatic Segmentation. New Technology of Library and Information Service, 2006, 1(5): 47-49.

链接本文:

https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2006.05.12 或 https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2006/V1/I5/47

1揭春雨，刘源，梁南元.论汉语自动分词方法.中文信息学报，1989,3（1）：1-8
2尹锋.基于神经网络的汉语自动分词系统的设计与分析.情报学报，1998，17（1）:41-49
3吴建胜，战学刚，迟呈英.一种基于自动机的分词方法.计算机工程与应用，2005（8）：81-85
（下转第61页）4张立昂，王捍贫，黄雄.计算理论导引.北京：机械工业出版社，200021-22
5吴胜远.一种汉语分词方法.计算机研究与发展，1996，33（4）:307-311
6陈桂林，王永成，韩客松等.一种高效的中文电子词表数据结构.计算机研究与发展，2000，37（1）:109-115
7刘源，梁南元.汉语处理的基础工程——现代汉语词频统计.中文信息学报，1986（1）：17-25

[1]	段宇锋,黄思思. 中文植物物种多样性描述文本的信息抽取研究^*[J]. 现代图书情报技术, 2016, 32(1): 87-96.
[2]	邓莎莎, 张朋柱, 李欣苗. 政府公共决策领域中网络民意建模方法研究[J]. 现代图书情报技术, 2012, (9): 69-74.
[3]	江华, 苏晓光. 无词典中文高频词快速抽取算法[J]. 现代图书情报技术, 2012, 28(6): 50-53.
[4]	季培培, 鄢小燕, 岑咏华, 王凌燕. 面向领域中文文本信息处理的术语语义层次获取研究[J]. 现代图书情报技术, 2010, 26(9): 37-41.
[5]	姚兴山. 基于Hash算法的中文分词的研究[J]. 现代图书情报技术, 2008, 24(3): 78-81.
[6]	张海营 . 全二分快速自动分词算法构建[J]. 现代图书情报技术, 2007, 2(4): 52-55.
[7]	章成志,苏新宁 . 面向信息检索的排除词识别研究[J]. 现代图书情报技术, 2007, 2(2): 44-48.
[8]	章成志,苏新宁 . 面向信息检索的词汇知识发现[J]. 现代图书情报技术, 2007, 2(1): 10-14.
[9]	翟喜奎 . 中文信息处理在数字图书馆中的应用[J]. 现代图书情报技术, 2006, 1(8): 8-11.
[10]	吴绍根 . 基于模式自动机的自学习中文全文检索[J]. 现代图书情报技术, 2006, 1(7): 25-28.
[11]	王兰成,王立双. 一种基于数字图书馆的文本信息标引技术的改进研究*[J]. 现代图书情报技术, 2006, 1(2): 5-9.
[12]	文庭孝,邱均平,侯经川. 汉语自动分词研究展望[J]. 现代图书情报技术, 2004, 20(7): 6-10.
[13]	沈艺. 中文机读目录字符集的完整性[J]. 现代图书情报技术, 1996, 12(5): 44-47.

Viewed

Full text

Abstract

Cited

Shared

Discussed