Please wait a minute...
Advanced Search
现代图书情报技术  2006, Vol. 1 Issue (7): 33-36     https://doi.org/10.11925/infotech.1003-3513.2006.07.08
  信息检索技术 本期目录 | 过刊浏览 | 高级检索 |
一种面向中文信息检索的汉语自动分词方法
孙巍
(黑龙江大学信息管理学院 哈尔滨 150080)
A Chinese Automatic Word Segmentation Method for Chinese Information Retrieval
Sun Wei
(School of Information Management, Heilongjiang University, Harbin 150080,China)
全文:
输出: BibTeX | EndNote (RIS)      
摘要 

阐述信息检索对汉语分词技术的要求,分析中文信息检索与汉语分词技术结合过程中有待解决的关键问题,并重点针对这些要求及关键问题提出一种面向中文信息检索的汉语自动分词方法。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
孙巍
关键词 中文信息检索汉语自动分词词典    
Abstract

This paper discusses what kinds of characteristics Chinese word segmentation should have during information retrieval,analyzes solving difficulties to combine Chinese information retrieval with Chinese word segmentation,and on the basis of these characteristics and difficulties, puts forward a Chinese automatic word segmentation method for Chinese information retrieval.

Key wordsChinese information retrieval    Chinese automatic word segmentation    Dictionary
收稿日期: 2006-04-06      出版日期: 2006-07-25
: 

TP391

 
通讯作者: 孙巍     E-mail: sunwei_wei@126.com
作者简介: 孙巍
引用本文:   
孙巍 . 一种面向中文信息检索的汉语自动分词方法[J]. 现代图书情报技术, 2006, 1(7): 33-36.
Sun Wei . A Chinese Automatic Word Segmentation Method for Chinese Information Retrieval. New Technology of Library and Information Service, 2006, 1(7): 33-36.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2006.07.08      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2006/V1/I7/33

1孙宾.现代汉语文本的词语切分技术.http://www.ce86.com/lunwen/computer/ai/3814.html (Accessed Feb.10,2006)
2闫引堂,周小强.交集型歧义字段切分方法研究.情报学报,2000,19(6):637-643
3孙茂松,左正平.高频最大交集型歧义切分字段在汉语自动分词中的作用.中文信息学报,1999,13(1):27-34
4费洪晓,康松林,朱小娟等.基于词频统计的中文分词的研究.计算机工程与应用,2005(7):67-68,100
5孙建军等. 信息检索技术.北京:科学出版社,2004.238-240
6翟凤文.统计与字典相结合的中文分词[学位论文].吉林:吉林大学,2005
7郑逢斌,付征叶等.HENU汉语自动分词系统中歧义字段消除算法.河南大学学报(自然科学版),2004(4):49-52

[1] 钟佳娃,刘巍,王思丽,杨恒. 文本情感分析方法及应用综述*[J]. 数据分析与知识发现, 2021, 5(6): 1-13.
[2] 张梦瑶, 朱广丽, 张顺香, 张标. 基于情感分析的微博热点话题用户群体划分模型 *[J]. 数据分析与知识发现, 2021, 5(2): 43-49.
[3] 郑新曼, 董瑜. 基于科技政策文本的程度词典构建研究*[J]. 数据分析与知识发现, 2021, 5(10): 81-93.
[4] 彭郴,吕学强,孙宁,张乐,姜肇财,宋黎. 基于CNN的消费品缺陷领域词典构建方法研究*[J]. 数据分析与知识发现, 2020, 4(11): 112-120.
[5] 尤众喜,华薇娜,潘雪莲. 中文分词器对图书评论和情感词典匹配程度的影响 *[J]. 数据分析与知识发现, 2019, 3(7): 23-33.
[6] 蒋翠清,郭轶博,刘尧. 基于中文社交媒体文本的领域情感词典构建方法研究*[J]. 数据分析与知识发现, 2019, 3(2): 98-107.
[7] 冯国明, 张晓冬, 刘素辉. 基于自主学习的专业领域文本DBLC分词模型[J]. 数据分析与知识发现, 2018, 2(5): 40-47.
[8] 胡家珩, 岑咏华, 吴承尧. 基于深度学习的领域情感词典自动构建*——以金融领域为例[J]. 数据分析与知识发现, 2018, 2(10): 95-102.
[9] 李伟卿, 王伟军. 基于大规模评论数据的产品特征词典构建方法研究*[J]. 数据分析与知识发现, 2018, 2(1): 41-50.
[10] 首欢容, 邓淑卿, 徐健. 基于情感分析的网络谣言识别方法*[J]. 数据分析与知识发现, 2017, 1(7): 44-51.
[11] 程翠琼, 徐健. 面向网络游记时间特征的情感分析模型*[J]. 数据分析与知识发现, 2017, 1(2): 87-95.
[12] 王晓耘,袁媛,史玲玲. 基于微博的电影首映周票房预测建模*[J]. 现代图书情报技术, 2016, 32(4): 31-39.
[13] 郭顺利,张向先. 面向中文图书评论的情感词典构建方法研究[J]. 现代图书情报技术, 2016, 32(2): 67-74.
[14] 聂卉, 容哲. 面向评论效用评估的文本情感特征提取[J]. 现代图书情报技术, 2015, 31(7-8): 113-121.
[15] 谷威, 李超凡, 王洪俊, 肖诗斌, 施水才. 专利检索日志的同义词获取[J]. 现代图书情报技术, 2015, 31(2): 24-30.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn