Please wait a minute...
Advanced Search
现代图书情报技术  2009, Vol. 25 Issue (4): 19-22     https://doi.org/10.11925/infotech.1003-3513.2009.04.04
  专题 本期目录 | 过刊浏览 | 高级检索 |
开源全文检索引擎Lucene本地化实践研究*
吴鹏飞马凤娟李文革郭鹏1
1(石家庄学院图书馆 石家庄 050035)
2(石家庄经济学院人文与社科学院 石家庄 050031)
Localization of the Open Source Full-text Retrival Engine Based on Lucene
Wu PengfeiMa FengjuanLi WengeGuo Peng1
1(Library of Shijiazhuang University, Shijiazhuang 050035,China)
2(School of Humanities and Social Sciences,Shijiazhuang University of Economics, Shijiazhuang 050031,China)
全文: PDF (535 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

对开源全文检索引擎Lucene的系统架构、索引与检索过程、语言分析器进行分析的基础上,针对其对中文只能进行单字切分、双字切分的不足,二次开发基于Lucene中英文语言分析器ZH_CNAnalyzer,并给出一个调用此分析器建立索引与检索的实例。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
吴鹏飞
马凤娟
李文革
郭鹏
关键词 全文检索Lucene语言分析器数字图书馆开源    
Abstract

This paper introduces the system architecture, indexing and retrieval process, and language analyzer of Lucene. According to the disadvantage of Lucene that it can only make one-word and two-word segmentation, this paper develops a Chinese-English language analyzer — ZH_CNAnalyzer. At last, an indexing and retrieval example of ZH_CNAnalyzer is given.

Key wordsFull-text retrival    Lucene ZH_CNAnalyzer    Digital library    Open source
收稿日期: 2009-03-03      出版日期: 2009-04-25
: 

G254

 
基金资助:

*本文系石家庄学院社会科学重点基金项目“面向学科服务的Web多媒体智能搜索平台”(项目编号:2007032)的研究成果之一。

通讯作者: 吴鹏飞     E-mail: wupengfei_2000@163.com
作者简介: 吴鹏飞,马凤娟,李文革,郭鹏
引用本文:   
吴鹏飞,马凤娟,李文革,郭鹏. 开源全文检索引擎Lucene本地化实践研究*[J]. 现代图书情报技术, 2009, 25(4): 19-22.
Wu Pengfei ,Ma Fengjuan, Li Wenge,Guo Peng. Localization of the Open Source Full-text Retrival Engine Based on Lucene. New Technology of Library and Information Service, 2009, 25(4): 19-22.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2009.04.04      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2009/V25/I4/19

[1] The Apache Jakarta Project:Lucene[EB/OL].[2008-09-10].http://jakarta.apache.org/lucene/.
[2] Gospodnetic O,Hatcher E.Lucene in Action[M].Manning Publications Co.,2005:10.
[3] 向晖,郭一平,王亮.基于Lucene的中文字典分词模块的设计与实现[J].现代图书情报技术,2006(8):46-50.
[4] 王继明,杨国林.基于Lucene的中文文本分词[J].内蒙古工业大学学报,2007(3):185-188.
[5] 李庆虎,陈玉健,孙家广.一种中文分词词典新机制——双字哈希机制[J].中文信息学报,2003(4):13-18.
[6] 李振星,余泽平,唐卫清,等.全二分最大匹配快速分词算法[J].计算机工程与应用,2002(11):106-109.
[7] Luke[EB/OL].[2008-12-10].http://www.getopt.org/luke/.

[1] 代君,郭世新,王慧,廖莹驰. 开发人员协同开发行为特征对开源项目成功的影响 *[J]. 数据分析与知识发现, 2019, 3(10): 110-117.
[2] 齐云飞, 赵宇翔, 朱庆华. 关联数据在数字图书馆移动视觉搜索系统中的应用研究*[J]. 数据分析与知识发现, 2017, 1(1): 81-90.
[3] 洪亮,钱晨,樊星. 移动数字图书馆资源的情境感知个性化推荐方法研究*[J]. 现代图书情报技术, 2016, 32(7-8): 110-119.
[4] 刘健,毕强,马卓. 数字图书馆微服务评价指标体系构建及实证研究*[J]. 现代图书情报技术, 2016, 32(5): 22-29.
[5] 董智鹏,刘静羽. 基于Drupal的项目网站建设——以“开放资源建设”网站为例[J]. 现代图书情报技术, 2016, 32(1): 81-86.
[6] 吴振新, 张智雄, 谢靖, 胡吉颖. 基于IIPC开源软件拓展构建国际重要科研机构Web存档系统[J]. 现代图书情报技术, 2015, 31(4): 1-9.
[7] 秦学东. 基于Drupal的KVM私有云管理系统解决方案[J]. 现代图书情报技术, 2015, 31(11): 91-95.
[8] 王传清, 毕强. 数字图书馆自动化语义标注工具系统模型研究[J]. 现代图书情报技术, 2014, 30(6): 17-24.
[9] 郑海山, 林俊伟. 图书馆数据中心运维中开源软件的应用[J]. 现代图书情报技术, 2014, 30(6): 100-106.
[10] 尉萌. 利用演化模式做文献推荐[J]. 现代图书情报技术, 2014, 30(4): 20-26.
[11] 张旺强, 祝忠明, 卢利农. 几种典型新型开源机构知识库软件的比较分析[J]. 现代图书情报技术, 2014, 30(2): 17-24.
[12] 李善杰. 二维码技术在图书馆查询机中的应用与实现[J]. 现代图书情报技术, 2014, 30(1): 97-101.
[13] 胡昌平, 陈果. 共词分析中的词语贡献度特征选择研究[J]. 现代图书情报技术, 2013, 29(7/8): 89-93.
[14] 王忠义, 夏立新, 石义金, 郑森茂. 数字图书馆中层关联数据的创建与发布[J]. 现代图书情报技术, 2013, (5): 28-33.
[15] 刘炜, 夏翠娟, 张春景. 大数据与关联数据:正在到来的数据技术革命[J]. 现代图书情报技术, 2013, (4): 2-9.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn