Please wait a minute...
Advanced Search
现代图书情报技术  2007, Vol. 2 Issue (8): 63-66     https://doi.org/10.11925/infotech.1003-3513.2007.08.15
  应用实践 本期目录 | 过刊浏览 | 高级检索 |
基于Lucene的企业级搜索引擎的设计与实现
陈艳春1 李双平2
1(石家庄铁道学院经济管理学院 石家庄 050043)
2(北京易维博科科技有限公司 北京 100010)
Design and Implementation of Enterprise Search Engine Based on Lucene
Chen Yanchun1   Li Shuangping2
1(Economic & Management Institute,Shijiazhuang Railway Institute,Shijiazhuang  050043,China )
2(Ewayboke Corporation Limited,Beijing 100010,China)
全文: PDF (629 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

针对企业文档信息资源丰富而又缺乏有效搜索工具的问题,提出构建企业级搜索引擎。首先分析企业级搜索引擎应具有的功能和总体架构,在实现中,对Lucene索引器进行深入研究;在抓取器的体系设计中,采用插件设计思想,来对不同的文档类型解析、抽取;在任务调度方面,实现一套多任务并行的调度机制;在用户接口设计上,采用Yui-ext组件和DWR远程对象调用框架,实现Web方式下的异步通信,提升用户体验。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
李双平
陈艳春
关键词 搜索引擎Lucene插件抓取器    
Abstract

The enterprise-level search engine is proposed to solve the problem that enterprise have abundant document information resources but lack of effective search tools.The function and the overall framework of the enterprise-level search engine are analyzed firstly.Lucene indexer is studied in depth during implementation secondly. Then the plug-in unit is used to carry out the analysis and extraction of different types of documentsi in design. A set of parallel multi-task scheduling mechanism is established in the task scheduling. When the user interface is designed,Yui-ext components and DWR remote object invocation framework is applied to implement asynchronous communication by the Web,which can promote the users’ experience.

Key wordsSearch engine    Lucene    Plug-in    Crawler
收稿日期: 2007-07-06      出版日期: 2007-08-25
: 

TP393

 
通讯作者: 陈艳春     E-mail: chenyanchunsjz@163.com
作者简介: 陈艳春,李双平
引用本文:   
陈艳春,李双平. 基于Lucene的企业级搜索引擎的设计与实现[J]. 现代图书情报技术, 2007, 2(8): 63-66.
Chen Yanchun,Li Shuangping. Design and Implementation of Enterprise Search Engine Based on Lucene. New Technology of Library and Information Service, 2007, 2(8): 63-66.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2007.08.15      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2007/V2/I8/63

[1] 李刚,宋伟,邱哲.征服Ajax+Lucene-构建搜索引擎[M]. 北京:人民邮电出版社,2006.
[2] 邱哲,符滔滔.Lucene+Heritrix开发自己的搜索引擎[M]. 北京:人民邮电出版社,2007.
[3] 金恩年.智能商品查询服务系统的研究与设计[D].上海:华东师范大学,2006
[4] 丛磊.桌面搜索引擎的研究与实现[D].北京:北京化工大学,2006
[5] Gospodnetic O, Hatcher E.Lucene in Action[M].USA:Manning Publications Co.,2006.
[6] 孙卫琴.精通Hibernate Java对象持久化技术详解[M].北京:电子工业出版社,2005.

[1] 刘彤,倪维健,柳梅. 面向搜索引擎查询日志的领域术语自动识别方法*[J]. 现代图书情报技术, 2016, 32(2): 25-33.
[2] 童国平, 孙建军. 基于搜索日志的用户行为分析[J]. 现代图书情报技术, 2015, 31(7-8): 80-88.
[3] 王晰巍, 赵丹, 杨梦晴, 魏俊巍. 行业网站搜索引擎优化指标及实证研究——基于信息生态视角的分析[J]. 现代图书情报技术, 2015, 31(3): 75-83.
[4] 方安, 吴思竹, 洪娜, 钱力, 王颖, 胡佳慧. 科技知识组织体系(STKOS)相关工具集成服务系统的设计与实现[J]. 现代图书情报技术, 2015, 31(3): 92-100.
[5] 陈勇, 李红莲, 吕学强. 网络用户搜索行为特征分析[J]. 现代图书情报技术, 2014, 30(12): 10-17.
[6] 钱力, 张晓林, 李春旺, 王小梅, 杨立英, 陈挺, 张智雄. 利用OSGi的科技情报分析集成服务架构研究与应用[J]. 现代图书情报技术, 2014, 30(12): 62-70.
[7] 李文江, 陈诗琴. AIMLBot智能机器人在实时虚拟参考咨询中的应用[J]. 现代图书情报技术, 2012, 28(7): 127-132.
[8] 鲜国建, 赵瑞雪, 朱亮, 寇远涛. 农业科学叙词表的SKOS转化及其应用研究[J]. 现代图书情报技术, 2012, (10): 16-20.
[9] 张李义, 陈明英. 搜索引擎的灵敏度和特异度研究[J]. 现代图书情报技术, 2011, 27(7/8): 41-46.
[10] 鲜国建, 赵瑞雪. 基于Solr的中文农业期刊文摘检索系统的构建研究[J]. 现代图书情报技术, 2011, 27(6): 51-58.
[11] 王继民, 李雷明子, 张鹏. 搜索引擎日志挖掘领域的论文合著网络分析[J]. 现代图书情报技术, 2011, 27(4): 58-63.
[12] 张红斌, 曹义亲. 混合多层分类和朴素贝叶斯模型的垂直搜索引擎分类器设计[J]. 现代图书情报技术, 2011, 27(3): 73-79.
[13] 顾立平. 数字图书馆的社会模拟技术研究[J]. 现代图书情报技术, 2011, 27(2): 8-15.
[14] 周之诚. 基于查询意图聚类的实时搜索建议[J]. 现代图书情报技术, 2011, 27(2): 87-93.
[15] 柯青, 成颖, 郑彦宁, 潘云涛. 搜索引擎可用性评价指标体系构建[J]. 现代图书情报技术, 2011, (11): 24-30.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn