Please wait a minute...
Advanced Search
现代图书情报技术  2010, Vol. 26 Issue (11): 84-89     https://doi.org/10.11925/infotech.1003-3513.2010.11.14
  应用实践 本期目录 | 过刊浏览 | 高级检索 |
基于Lucene.net全文检索在文档管理中的应用
李文江1, 陈诗琴2
1. 重庆文理学院教务处 重庆 402160;
2. 重庆文理学院图书馆 重庆 402160
Full-text Retrieval Based on Lucene.net Application in Document Management
Li Wenjiang1, Chen Shiqin2
1. Office of Academic Affairs, Chongqing University of Arts and Sciences, Chongqing 402160, China;
2. Library of Chongqing University of Arts and Sciences, Chongqing 402160, China
全文: PDF (678 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

针对文档管理中的全文检索功能的开发,综合运用Lucene.net、ICTCLAS等系列开源类库,建立文档解析器,将解析文档内容存储于数据库中;建立中文分析器,对文档记录进行索引。通过索引检索结果,并结合文档控制信息,实现具有权限控制的文档全文检索。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
李文江
陈诗琴
关键词 Lucene.net文档解析ICTCLAS索引全文检索文档控制    
Abstract

According to the development of full-text retrieval functions in document management, this paper synthetically uses open source libraries such as Lucene.net, ICTCLAS etc. to establish the document parser and store the parsing documents content in the database.Then Chinese analyzer is established to index the document records, and the full-text retrieval of documents with authority control is realized by indexing the retrieval results and combining with the document control information.

Key wordsLucene.net    Document parser    ICTCLAS    Indexing    Full-text retrieval    Document control
收稿日期: 2010-08-16      出版日期: 2011-01-04
: 

TP391.1

 
引用本文:   
李文江, 陈诗琴. 基于Lucene.net全文检索在文档管理中的应用[J]. 现代图书情报技术, 2010, 26(11): 84-89.
Li Wenjiang, Chen Shiqin. Full-text Retrieval Based on Lucene.net Application in Document Management. New Technology of Library and Information Service, 2010, 26(11): 84-89.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2010.11.14      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2010/V26/I11/84


[1] 陈慧萍,于国政,王建东.全文索引技术在办公自动化系统中的应用研究
[J].计算机应用研究, 2007,24(2):222-224.

[2] 吴鹏飞,马凤娟,李文革,等.开源全文检索引擎Lucene本地化实践研究
[J].现代图书情报技术,2009(4):19-22.

[3] Lucene.Net
[EB/OL].
[2010-07-25].http://lucene.apache.org/lucene.net/.

[4] Minidx文件管理系统|Minidx全文搜索引擎
[EB/OL].
[2010-07-25].http://cn.minidx.com/.

[5] ICTCLAS2010-packet-release.rar - Windows Live
[EB/OL].
[2010-07-25].http://cid-51de2738d3ea0fdd.skydrive.live.com/self.aspx/Public/ICTCLAS2010-packet-release.rar.

[6] 罗刚.自己动手写搜索引擎
[M].北京:电子工业出版社,2009:189-239.

[7] Gospodnetic O, Hatcher E. Lucene in Action
[M]. 谭鸿,黎俊鸿,周鹏,等译.北京:电子工业出版社,2007:3-296.

[1] 李轲禹,王昊,龚丽娟,唐慧慧. 学术数据库中研究主题术语的质量测度及分布研究*[J]. 数据分析与知识发现, 2020, 4(6): 91-108.
[2] 贾君枝,叶壮壮. 基于潜在语义索引的Wikidata机构实体聚类研究 *[J]. 数据分析与知识发现, 2019, 3(10): 56-65.
[3] 谢靖, 王敬东, 吴振新, 张智雄, 王颖, 叶志飞. 科技文献检索系统语义丰富化框架的设计与实践*[J]. 数据分析与知识发现, 2017, 1(4): 84-93.
[4] 胡吉颖,吴振新,谢靖,张智雄. 构建面向WARC文档的全文索引系统[J]. 现代图书情报技术, 2016, 32(5): 91-98.
[5] 刘彤,倪维健,柳梅. 面向搜索引擎查询日志的领域术语自动识别方法*[J]. 现代图书情报技术, 2016, 32(2): 25-33.
[6] 童国平, 孙建军. 基于搜索日志的用户行为分析[J]. 现代图书情报技术, 2015, 31(7-8): 80-88.
[7] 王晰巍, 赵丹, 杨梦晴, 魏俊巍. 行业网站搜索引擎优化指标及实证研究——基于信息生态视角的分析[J]. 现代图书情报技术, 2015, 31(3): 75-83.
[8] 陈勇, 李红莲, 吕学强. 网络用户搜索行为特征分析[J]. 现代图书情报技术, 2014, 30(12): 10-17.
[9] 王忠义, 夏立新, 石义金, 郑森茂. 数字图书馆中层关联数据的创建与发布[J]. 现代图书情报技术, 2013, (5): 28-33.
[10] 李文江, 陈诗琴. AIMLBot智能机器人在实时虚拟参考咨询中的应用[J]. 现代图书情报技术, 2012, 28(7): 127-132.
[11] 鲜国建, 赵瑞雪, 朱亮, 寇远涛. 农业科学叙词表的SKOS转化及其应用研究[J]. 现代图书情报技术, 2012, (10): 16-20.
[12] 张梅, 段建勇. 基于常用问题集的问答系统设计与实现[J]. 现代图书情报技术, 2011, 27(9): 83-87.
[13] 张李义, 陈明英. 搜索引擎的灵敏度和特异度研究[J]. 现代图书情报技术, 2011, 27(7/8): 41-46.
[14] 王继民, 李雷明子, 张鹏. 搜索引擎日志挖掘领域的论文合著网络分析[J]. 现代图书情报技术, 2011, 27(4): 58-63.
[15] 张红斌, 曹义亲. 混合多层分类和朴素贝叶斯模型的垂直搜索引擎分类器设计[J]. 现代图书情报技术, 2011, 27(3): 73-79.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn