Please wait a minute...
Advanced Search
  • 数据分析与知识发现
      2009年, 第25卷, 第5期 刊出日期:2009-05-25   
    选择: 合并摘要
    专题
    基于Stanford Parser的实体间关系识别
    刘建华,张智雄
    现代图书情报技术. 2009, 25 (5): 1-5.   DOI: 10.11925/infotech.1003-3513.2009.05.01
    摘要   HTML   PDF (849KB)

    分析当前基于GATE等开源工具进行关系识别的研究,提出利用GATE和Stanford Parser构建开放式实体间语义关系识别的Rela Pair模型。实验表明,该模型可以有效识别出由动词或介词所引导的命名实体关系三元组,为后续的情报分析工作提供重要支撑。

    参考文献 | 相关文章 | 多维度评价
    基于Ajax的异步语义检索实验模型研究
    薛建武,陈尧清,崔璇
    现代图书情报技术. 2009, 25 (5): 6-10.   DOI: 10.11925/infotech.1003-3513.2009.05.02
    摘要   HTML   PDF (587KB)

    基于Ajax技术特点,设计一个表现层与语义检索引擎的异步通信模型,解决语义检索中复杂对象的传递,通过“本体导航”实例验证该模型的可行性,从用户体验和冗余处理角度论证Ajax技术对改善语义检索性能的作用。

    参考文献 | 相关文章 | 多维度评价
    网络信息资源保存开源软件综述
    刘兰,吴振新,向菁,孙志茹
    现代图书情报技术. 2009, 25 (5): 11-17.   DOI: 10.11925/infotech.1003-3513.2009.05.03
    摘要   HTML   PDF (532KB)

    探讨Web Archive领域广泛使用开源软件的原因,介绍常用的开源软件,总结Web Archive开源软件的使用现状及未来发展趋势,并就开源软件在Web Archive领域应用所面临的问题进行初步分析。

    参考文献 | 相关文章 | 多维度评价
    Overlay期刊系统构建模式研究
    祝忠明,王楠,卢利农
    现代图书情报技术. 2009, 25 (5): 18-21.   DOI: 10.11925/infotech.1003-3513.2009.05.04
    摘要   HTML   PDF (390KB)

    通过对相关研究项目和应用的调研,对基于知识库软件和基于期刊出版软件构建Overlay期刊系统的两种主要模式的技术特点和应用趋势进行简要分析和说明,并提出一种基于OJS和OAI收割服务相结合以构建Overlay期刊系统的基本框架。

    参考文献 | 相关文章 | 多维度评价
    数字图书馆
    一种基于复合文本描述的科学数据特征表示方法*
    孙巍
    现代图书情报技术. 2009, 25 (5): 22-27.   DOI: 10.11925/infotech.1003-3513.2009.05.05
    摘要   HTML   PDF (540KB)

    特征表示是数据聚类的关键问题之一。当前对科学数据特征表示的深度不够,从而在一定程度上影响科学数据聚类的效果。针对这一问题,提出复合文本描述的概念以及一种基于复合文本描述的科学数据特征表示方法,该方法的主要特点是运用不同的特征权重计算法分别对基于两种文本数据源的候选特征加以表示,并将两种特征集合并,最终实现强化特征集的目的。实验表明,该方法优于传统方法,使科学数据聚类的效果有明显提高。

    参考文献 | 相关文章 | 多维度评价
    数字图书馆网格服务发布和发现机制研究*
    张自然,董慧
    现代图书情报技术. 2009, 25 (5): 28-33.   DOI: 10.11925/infotech.1003-3513.2009.05.06
    摘要   HTML   PDF (617KB)

    在基于服务域划分的层次型数字图书馆网格服务发布结构基础上,提出面向用户的多阶段数字图书馆网格服务发现机制,利用“我的服务”阶段、主服务域→子服务域阶段、主服务域间转发阶段和根域→主服务域阶段完成服务发现。

    参考文献 | 相关文章 | 多维度评价
    Mashup系统构建研究
    汪名森,王强
    现代图书情报技术. 2009, 25 (5): 34-38.   DOI: 10.11925/infotech.1003-3513.2009.05.07
    摘要   HTML   PDF (654KB)

    Mashup作为Web2.0的特性,能够对数据资源进行整合与利用,提升数据价值。本文在论述Mashup技术特点的基础上,对Mashup应用系统开发方法进行研究,结合结构化系统开发方法,指出基于Mashup的系统开发流程。最后,在中国远洋项目中运用此方法构建了一个基于Mashup的数据融合与展示系统,为今后Mashup深层次应用提供了指导。

    参考文献 | 相关文章 | 多维度评价
    知识组织与知识管理
    基于模糊处理的中文文本关键词提取算法*
    张红鹰
    现代图书情报技术. 2009, 25 (5): 39-43.   DOI: 10.11925/infotech.1003-3513.2009.05.08
    摘要   HTML   PDF (493KB)

    研究关键词提取算法,在分析可能影响关键词提取词语的各种属性并将其量化的基础上,提出并实现一种将分词与词性标注、文本预处理、线性加权算法、组合词生成与过滤、合并候选关键词等集成到一个完整框架中的模型算法。

    参考文献 | 相关文章 | 多维度评价
    基于本体和DOM相结合的Web信息抽取器
    柳佳刚,陈山,贺令亚
    现代图书情报技术. 2009, 25 (5): 44-49.   DOI: 10.11925/infotech.1003-3513.2009.05.09
    摘要   HTML   PDF (570KB)

    针对基于Web页面信息本体的信息抽取不能准确划定抽取区域的缺点,设计基于本体和DOM相结合的Web信息抽取器。利用DOM树设计对样本页面信息项路径进行归纳学习的算法,该算法能准确划定信息抽取区域,降低页面噪声,实现对Web页面的预处理。实验表明,改进后的抽取方法提高了Web信息的抽准率。

    参考文献 | 相关文章 | 多维度评价
    《汉语主题词表》XML文档的自动生成研究
    贾君枝,卫荣娟,罗林强
    现代图书情报技术. 2009, 25 (5): 50-54.   DOI: 10.11925/infotech.1003-3513.2009.05.10
    摘要   HTML   PDF (482KB)

    《汉语主题词表》XML文档的实现对于提高词表的利用效率具有重要意义。在详细分析《汉语主题词表》各数据表之间逻辑关系基础上,利用JDOM技术实现《汉语主题词表》XML文档的自动生成。

    参考文献 | 相关文章 | 多维度评价
    情报分析与研究
    专利信息获取分析系统设计与实现*
    翟东升,刘晨,欧阳轶慧
    现代图书情报技术. 2009, 25 (5): 55-60.   DOI: 10.11925/infotech.1003-3513.2009.05.11
    摘要   HTML   PDF (773KB)

    设计并实现一个专利信息获取分析的原型系统。通过概念检索的方式扩展某一领域专利检索词,提高检索性能,同时利用XML解析技术,准确高效地抽取出检索结果页面中的专利文本信息,并将社会网络分析方法应用于专利引文分析之中。

    参考文献 | 相关文章 | 多维度评价
    从用户评论中挖掘产品属性——基于SOM的实现
    余传明
    现代图书情报技术. 2009, 25 (5): 61-66.   DOI: 10.11925/infotech.1003-3513.2009.05.12
    摘要   HTML   PDF (710KB)

    在分析现有产品属性识别方法不足的基础上,提出一种利用自组织映射(SOM)进行属性识别的新方法,定义一种新的名为“属性叠加矩阵”的SOM显示方式。为验证该方法的有效性,以餐馆评论为样本,从中抽取饮食行业的产品属性。实验证明提出的方法识别产品属性的效果较好。

    参考文献 | 相关文章 | 多维度评价
    应用实践
    基于DSpace构建联合网站的研究与实践
    邹荣,曾婷,姜爱蓉,郭靖
    现代图书情报技术. 2009, 25 (5): 67-71.   DOI: 10.11925/infotech.1003-3513.2009.05.13
    摘要   HTML   PDF (911KB)

    介绍构建联合网站的整体思路;联合网站的建设环境及资源组织,基于OAI收割元数据的方法和开发,并对联合网站建设过程中的关键问题进行分析。最后,介绍建立联合网站的效果和需要进一步改进的工作。

    参考文献 | 相关文章 | 多维度评价
    基于增量的网页快照及其可视化
    何明贵,周宁,荣辉贵
    现代图书情报技术. 2009, 25 (5): 72-75.   DOI: 10.11925/infotech.1003-3513.2009.05.14
    摘要   HTML   PDF (766KB)

    为了持续跟踪某网页的变更情况,搜索引擎需要保存多个快照版本,这会大大增加服务器的存储空间。通过增量的方法,保存快照版本间的差异可减小磁盘空间占用。采用可视化方法,使用户能从全局了解各个版本间的修订情况、从细节上了解快照任意两个版本间的差异。

    参考文献 | 相关文章 | 多维度评价
    服务质量分析系统的设计与实现*
    阚德涛
    现代图书情报技术. 2009, 25 (5): 76-80.   DOI: 10.11925/infotech.1003-3513.2009.05.15
    摘要   HTML   PDF (634KB)

    从读者特征、服务质量和读者行为意愿相关性、服务质量维度对读者行为意愿影响等角度扩展服务质量评价系统的分析功能,并对系统实现的相关分析、回归分析等算法进行研究,为图书馆拓展服务质量评价系统功能提供一定的参考依据。

    参考文献 | 相关文章 | 多维度评价
    基于通用搜索引擎实现站内搜索的二次开发
    徐芳
    现代图书情报技术. 2009, 25 (5): 81-85.   DOI: 10.11925/infotech.1003-3513.2009.05.16
    摘要   HTML   PDF (675KB)

    介绍一种新的站内搜索引擎实现,它是基于Google、Baidu等大型通用搜索引擎实现站内搜索的二次开发。与其他类似应用相比其优点是:搜索结果页面干净、无其他广告、推广信息等附加内容;能同时指定多个域名,达到在主网站、子网站及类网站间同时搜索的目的。

    参考文献 | 相关文章 | 多维度评价
    数字资源集合管理系统的设计与实现
    陈权,杨晓江
    现代图书情报技术. 2009, 25 (5): 86-91.   DOI: 10.11925/infotech.1003-3513.2009.05.17
    摘要   HTML   PDF (803KB)

    介绍一个以“数字资源集合”为操作对象的资源集合管理系统。对系统的总体设计进行详细介绍,包括资源集合的粒度表示、资源集合描述元数据、资源集合的功能操作,并对系统相关实现进行描述。

    参考文献 | 相关文章 | 多维度评价
    门户网站中集成ILASII读者认证与Ezproxy校外访问系统的研究
    田支斌
    现代图书情报技术. 2009, 25 (5): 92-95.   DOI: 10.11925/infotech.1003-3513.2009.05.18
    摘要   HTML   PDF (404KB)

    介绍Ezproxy系统HTTP自定义认证脚本的原理和通过HTTP协议编程实现ILASII Web认证的流程。在此基础上提出在门户网站中集成ILASII读者认证与Ezproxy校外访问系统的体系结构,并给出读者状态检测、安全密码机制及分组认证的具体实现方法。

    参考文献 | 相关文章 | 多维度评价
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn