Please wait a minute...
Advanced Search
现代图书情报技术  2007, Vol. 2 Issue (5): 41-44     https://doi.org/10.11925/infotech.1003-3513.2007.05.10
  数字图书馆 本期目录 | 过刊浏览 | 高级检索 |
基于叙词表的主题爬虫技术研究*
夏崇镨 康丽
(中国农业大学计算机系 北京 100083)
The Focused-crawler Based on Thesaurus
Xia Chongpu   Kang Li
(Department of Computer Science,China Agricultural University,Beijing 100083, China)
全文: PDF (578 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 

将叙词表同传统的信息检索技术相结合,提出用叙词表的族对爬虫的主题进行描述的方法并用该方法设计实现一主题爬虫。实验结果证明本文提出模型和算法的有效性。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
康丽
夏崇镨
关键词 主题爬虫叙词表搜索引擎    
Abstract

Combining the thesaurus with the traditional information retrieval technology, a new method is presented that family in thesaurus is used to describe the predefined topic.Also develops a focused-crawler based on this method. On which we compare its efficiency with other well-known Web search engine. The experimental results showes the effectiveness of our models and algorithms.

Key wordsFocused crawler    Thesaurus    Search engine
收稿日期: 2007-02-06      出版日期: 2007-05-25
: 

TP393

 
基金资助:

*本文系北京市自然科学基金资助项目“基于遗传算法网页信息搜索技术”(项目编号:4062013)的研究成果之一。

通讯作者: 康丽     E-mail: kangli.cau@gmail.com
作者简介: 夏崇镨,康丽
引用本文:   
夏崇镨,康丽 . 基于叙词表的主题爬虫技术研究*[J]. 现代图书情报技术, 2007, 2(5): 41-44.
Xia Chongpu,Kang Li . The Focused-crawler Based on Thesaurus. New Technology of Library and Information Service, 2007, 2(5): 41-44.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2007.05.10      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2007/V2/I5/41

1赵焕洲,唐爱民. 对两种知识组织系统——叙词表与Ontology的比较研究. 情报理论与实践,2005,28(5): 469-471
2毛军. 基于RDF的叙词表研究. 情报学报,2003,22(2):163-168
3李波,戴秀梅,侯汉清. 计算机建立分类法和主题词表转换系统的尝试. 现代情报,2003,23(6): 112-115
4常春,卢文林. 叙词表编制历史、现状与发展. 农业图书情报学刊,2002(5):22-28
5贺纯佩,李思经. 农业叙词表在中国的发展和农业本体论展望. 农业图书情报学刊,2003(4):16-19

[1] 刘彤,倪维健,柳梅. 面向搜索引擎查询日志的领域术语自动识别方法*[J]. 现代图书情报技术, 2016, 32(2): 25-33.
[2] 童国平, 孙建军. 基于搜索日志的用户行为分析[J]. 现代图书情报技术, 2015, 31(7-8): 80-88.
[3] 余凡, 楼雯. 领域概念的三层递进筛选方法研究[J]. 现代图书情报技术, 2015, 31(4): 26-33.
[4] 王晰巍, 赵丹, 杨梦晴, 魏俊巍. 行业网站搜索引擎优化指标及实证研究——基于信息生态视角的分析[J]. 现代图书情报技术, 2015, 31(3): 75-83.
[5] 曾新红, 蔡庆河, 黄华军, 林伟明. 基于力导向模型的非一致节点群组布局可视化算法研究[J]. 现代图书情报技术, 2014, 30(9): 33-43.
[6] 李鹏, 朱礼军, 刘亚洁, 闫莹莹. 一种改进RBAC模型在规范概念协同工作平台任务管理中的实现[J]. 现代图书情报技术, 2014, 30(2): 86-91.
[7] 陈勇, 李红莲, 吕学强. 网络用户搜索行为特征分析[J]. 现代图书情报技术, 2014, 30(12): 10-17.
[8] 薛建武, 赵娜, 王东娜. 面向本体构建的叙词表词间关系细化和应用研究[J]. 现代图书情报技术, 2013, 29(3): 14-20.
[9] 鲜国建, 赵瑞雪, 寇远涛, 朱亮, 张洁. 农业科学叙词表关联数据构建研究与实践[J]. 现代图书情报技术, 2013, 29(11): 8-14.
[10] 黄华军, 曾新红, 林伟明. OTCSS关联数据服务的研究与实现[J]. 现代图书情报技术, 2012, 28(7): 40-47.
[11] 黄炜, 金雅博, 胡昌龙. 网络舆情主题信息采集研究[J]. 现代图书情报技术, 2012, (11): 65-71.
[12] 曾新红, 蔡庆河, 曾汉龙, 唐铖, 黄华军, 林伟明. 中文叙词表本体可视化群组布局算法研究与实现[J]. 现代图书情报技术, 2012, (10): 8-15.
[13] 鲜国建, 赵瑞雪, 朱亮, 寇远涛. 农业科学叙词表的SKOS转化及其应用研究[J]. 现代图书情报技术, 2012, (10): 16-20.
[14] 张李义, 陈明英. 搜索引擎的灵敏度和特异度研究[J]. 现代图书情报技术, 2011, 27(7/8): 41-46.
[15] 王继民, 李雷明子, 张鹏. 搜索引擎日志挖掘领域的论文合著网络分析[J]. 现代图书情报技术, 2011, 27(4): 58-63.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn