Please wait a minute...
Advanced Search
现代图书情报技术  2007, Vol. 2 Issue (4): 52-55     https://doi.org/10.11925/infotech.1003-3513.2007.04.13
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
全二分快速自动分词算法构建
张海营
(襄樊学院网络中心 襄樊  441053)
A Design of Algorithm for Chinese Phrase Segmentation
Zhang Haiying
(Networks Center of Xiangfan University, Xiangfan 441053, China)
全文: PDF (389 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

分析现有分词算法存在的不足,在此基础上提出一种新的分词词典,通过为分词词典建立首字Hash表和词索引表两级索引,使得该分词词典支持全二分最大匹配分词算法,利用该分词算法进行自动分词,其时间复杂度实现了大的改善。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
张海营
关键词 分词算法汉语分词    
Abstract

This paper analyses the shortcoming of segmentation algorithm, designs a new algorithm for Chinese phrase segmentation. By building two levels index for Chinese thesaurus, we attain a highly efficient Chinese phrase segmentation thesaurus which supports hashing operation by means of the first Chinese character in a string and full binary search. Based on this thesaurus, we design a new algorithm for Chinese phrase segmentation.

Key wordsSegmentation algorithm    Chinese segmentation
收稿日期: 2007-01-30      出版日期: 2007-04-25
: 

G252.7 

 
     
  TP391

 
通讯作者: 张海营     E-mail: xfu_www@126.com
作者简介: 张海营
引用本文:   
张海营 . 全二分快速自动分词算法构建[J]. 现代图书情报技术, 2007, 2(4): 52-55.
Zhang Haiying . A Design of Algorithm for Chinese Phrase Segmentation. New Technology of Library and Information Service, 2007, 2(4): 52-55.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2007.04.13      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2007/V2/I4/52

1张国煊,王小华, 周必水.快速书面自动分词系统及其算法设计.计算机研究与发展,1993,30(1):163-167
2陈桂林,王永成,韩客松,王刚.一种改进的快速分词算法.计算机研究与发展,2000,37(4):418-424
3揭春雨,刘源,梁南元.论汉语自动分词方法.中文信息学报,1989,3(1):101-108
4吴胜远.一种汉语分词方法.计算机研究与发展,1996,33(4):306-311
5孙巍.一种面向中文信息检索的汉语自动分词方法.现代图书情报技术,2006(7):33-36
6吴绍根.汉语自动分词模式自动机构造研究.现代图书情报技术,2006(5):47-49,61
7傅立云.基于词典的汉语自动分词算法的改进.情报杂志,2006,25(1):40-41
8文庭孝,邱均平,侯经川.汉语自动分词研究展望.现代图书情报技术,2004(7):6-10

[1] 唐琳,郭崇慧,陈静锋. 中文分词技术研究综述*[J]. 数据分析与知识发现, 2020, 4(2/3): 1-17.
[2] 吴绍根 . 汉语自动分词模式自动机构造研究[J]. 现代图书情报技术, 2006, 1(5): 47-49.
[3] 文庭孝,邱均平,侯经川. 汉语自动分词研究展望[J]. 现代图书情报技术, 2004, 20(7): 6-10.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn