Please wait a minute...
Advanced Search
  • 数据分析与知识发现
      2010年, 第26卷, 第10期 刊出日期:2010-10-25   
    选择: 合并摘要
    数字图书馆
    用户行为模型驱动个性化服务研究综述
    顾立平
    现代图书情报技术. 2010, 26 (10): 1-9.   DOI: 10.11925/infotech.1003-3513.2010.10.01
    摘要   HTML   PDF (463KB)

    个性化服务是优化信息系统的一种方式。系统介绍优化检索系统、信息推荐系统、工作流管理系统、用户生成系统、社会网络系统、媒体播放系统、网络导航系统、移动通讯信息系统、交互面板的用户行为模型。解释从简单工具型的用户模型,到技术操作型的用户模型,再到符合人类心理与行为的用户模型的变化。提出 “用户行为-用户建模-个性化服务-再设计”的流程,作为用户行为模型驱动数字图书馆个性化服务的整体方案。

    参考文献 | 相关文章 | 多维度评价
    基于CSSCI本体的学科关联分析
    王昊, 苏新宁
    现代图书情报技术. 2010, 26 (10): 10-16.   DOI: 10.11925/infotech.1003-3513.2010.10.02
    摘要   HTML   PDF (810KB)

    尝试改变传统的采用关联规则挖掘在单一标准基础上判断学科关联的分析模式,将本体机制引入CSSCI学术资源的知识组织中,以面向对象的方式来组织学科及其相关概念,建立基于本体的CSSCI学术资源网络模型;在此基础上,采用学科评价方法对本体中学科间的两两关系进行剖析,通过知识挖掘发现隐含在原有知识下用户感兴趣的学科多元关联模式,以获得可提供具体决策支持的分析结论,为学科间合作的增强甚至交叉学科、边缘学科的产生和发展提供事实依据。

    参考文献 | 相关文章 | 多维度评价
    概念格构建工具ConExp与Lattice Miner的比较研究
    滕广青, 毕强
    现代图书情报技术. 2010, 26 (10): 17-22.   DOI: 10.11925/infotech.1003-3513.2010.10.03
    摘要   HTML   PDF (717KB)

    利用概念格构建工具ConExp1.3和Lattice Miner1.4,以构建球类运动概念格为例,从基本信息、形式背景编辑、概念格视图、关联规则挖掘以及存储管理等方面,对两个工具软件的性能和操作进行比较,从而得出:ConExp具有重视概念及概念间关系细节,以及概念格个性化呈现的特征;而Lattice Miner则在复杂问题处理、关联规则提取和支持语义网络方面具有优势,该研究为基于概念格构建工具开展相关研究做出铺垫。

    参考文献 | 相关文章 | 多维度评价
    运用微服务重组机制构建图书馆编目随需应变模型
    翟晓娟, 聂娜
    现代图书情报技术. 2010, 26 (10): 23-27.   DOI: 10.11925/infotech.1003-3513.2010.10.04
    摘要   HTML   PDF (533KB)

    在分析图书馆编目发展需求与现存业务系统之间矛盾的基础上,研究SOA理论,运用面向服务的分析方法构建图书馆编目模型,设计具有松散耦合、独立自治等特性的编目微服务,并在代码层面实现微服务的自由组配。利用微服务的重组机制实现SOA编目模型的随需应变,为编目业务不断发展的需求变化提供系统保障。构建的编目系统模型具有高度的开放性和延展性,不仅可以应对编目未来的发展需求,而且可以移植到其他图书馆业务实际工作中加以利用。

    参考文献 | 相关文章 | 多维度评价
    知识组织与知识管理
    基于PLSA的大众标注潜在语义发现
    蒋翠清, 张玉, 丁勇
    现代图书情报技术. 2010, 26 (10): 28-32.   DOI: 10.11925/infotech.1003-3513.2010.10.05
    摘要   HTML   PDF (457KB)

    针对大众标注系统的标注语义模糊等问题,分析标注中用户、资源和标签的潜在语义关系,引入概率潜在语义分析PLSA模型并对其进行扩展,将标注映射到一个有限维的潜在语义空间中,通过聚类得到标注的潜在语义直观代表集合。将此应用于大众标注系统中,以提高用户对网络资源的实际使用需求的满意度,通过实验证明本文方法的有效性。

    参考文献 | 相关文章 | 多维度评价
    基于简约知识组织系统的《中国档案主题词表》语义网络化应用研究
    段荣婷
    现代图书情报技术. 2010, 26 (10): 33-42.   DOI: 10.11925/infotech.1003-3513.2010.10.06
    摘要   HTML   PDF (1625KB)

    阐述简约知识组织系统(SKOS)的概念、结构-功能及其特点,具体分析《中国档案主题词表》SKOS化基本功能及其高级扩展功能的实现,并总结其标准规范化、系统化、灵活性及实用性等特点。

    参考文献 | 相关文章 | 多维度评价
    热点主题词提取方法研究
    程肖, 陆蓓, 谌志群
    现代图书情报技术. 2010, 26 (10): 43-48.   DOI: 10.11925/infotech.1003-3513.2010.10.07
    摘要   HTML   PDF (415KB)

    针对热点主题词的提取,在候选主题词的多级过滤中,尝试通过对大规模数据处理,分析其在时间标签基础上的统计规律来确定噪音词,提出联合方差的概念。基于多特征的融合提出热点主题词权重计算方法,构造出热点主题词判断公式HK,实现对热点主题词的提取。实验结果表明,该方法对热点主题词的提取有一定的效果。

    参考文献 | 相关文章 | 多维度评价
    基于改进信任度的协同过滤推荐算法
    金亚亚, 牟援朝
    现代图书情报技术. 2010, 26 (10): 49-53.   DOI: 10.11925/infotech.1003-3513.2010.10.08
    摘要   HTML   PDF (431KB)

    在传统协同过滤算法中引入信任度,提出一种改进信任度的协同过滤推荐算法。将相似度和信任度结合在一起,替代传统的相似度作为加权的权重,以提高推荐结果的准确性。实验证明,该算法与传统的协同过滤推荐算法和基于信任关系的推荐算法相比有更好的推荐效果。

    参考文献 | 相关文章 | 多维度评价
    移动元搜索引擎中网页内容提取算法研究
    聂靖, 李强, 庞力, 应慧杰
    现代图书情报技术. 2010, 26 (10): 54-58.   DOI: 10.11925/infotech.1003-3513.2010.10.09
    摘要   HTML   PDF (664KB)

    提出和实现基于VIPS的网页内容提取算法WEAV(Web-page Extraction Algorithm based on VIPS)。将该算法用于移动元搜索引擎M-Meta中,对移动搜索的结果页面进行内容提取并返回给用户,以适应移动设备的显示,提高用户获取信息的速度,增强Web在移动设备中的可用性。

    参考文献 | 相关文章 | 多维度评价
    情报分析与研究
    基于条件随机域模型的事实信息抽取方法应用
    武帅
    现代图书情报技术. 2010, 26 (10): 59-64.   DOI: 10.11925/infotech.1003-3513.2010.10.10
    摘要   HTML   PDF (1143KB)

    探讨一种基于条件随机域的非结构化文本事实信息抽取方法的实际应用,分析模型的参数估计和特征选择方法。在进行信息抽取时,先利用分隔符、特定标识符等格式信息对文本进行分块,在分块的基础上使用条件随机域模型进行指定块的抽取。该方法应用于世界武器装备知识库系统的事实信息抽取模块,经测试,具有良好的准确率和召回率。

    参考文献 | 相关文章 | 多维度评价
    基于规则与统计相结合的互联网突发事件识别研究
    夏彦, 何琳, 潘运来, 欧阳辰晨
    现代图书情报技术. 2010, 26 (10): 65-69.   DOI: 10.11925/infotech.1003-3513.2010.10.11
    摘要   HTML   PDF (473KB)

    针对互联网大量突发事件新闻语料的标题和正文分别进行预处理,建立特征向量库,利用决策表规则和最短向量距离相结合的匹配方法对文本的主题进行双重识别,从而更好地服务于互联网突发事件自动识别。

    参考文献 | 相关文章 | 多维度评价
    基于网络内容分析的高校门户网站可用性测评 ——以江苏省为例
    袁红
    现代图书情报技术. 2010, 26 (10): 70-75.   DOI: 10.11925/infotech.1003-3513.2010.10.12
    摘要   HTML   PDF (613KB)

    利用工具软件获取全网数据,对网站可用性概念进行深入的网络内容分析,明确网站可用性的内涵,据此构建网站可用性评价指标体系的逻辑层次。利用搜索引擎的网站分析功能及相关软件对江苏省29所高校门户网站进行可用性测评。

    参考文献 | 相关文章 | 多维度评价
    应用实践
    搭建基于云计算的开源海量数据挖掘平台
    赵华茗
    现代图书情报技术. 2010, 26 (10): 76-81.   DOI: 10.11925/infotech.1003-3513.2010.10.13
    摘要   HTML   PDF (661KB)

    通过分析亚马逊弹性MapReduce(EMR)平台构架,针对信息情报机构内部数据处理的迫切需求,提出通过开源技术Xen和Hadoop平台构建基于云计算的动态可伸缩的海量数据处理平台并给出实施方案、海量文本数据处理案例和开源EMR平台的优势分析。实施方案主要分为三部分:搭建动态虚拟的云计算环境、安装制作Hadoop虚拟服务器模板、配置运行Cloudera和Cloudera Desktop。通过开源EMR架构的应用,可以有效解决服务器蔓延问题,提高网络计算资源的利用效率和分布式数据挖掘服务的快速布署能力及灵活性。

    参考文献 | 相关文章 | 多维度评价
    基于Nutch的开放存取搜索引擎构建研究
    崔宇红, 张奎
    现代图书情报技术. 2010, 26 (10): 82-86.   DOI: 10.11925/infotech.1003-3513.2010.10.14
    摘要   HTML   PDF (928KB)

    研究当前主要的开放存取搜索系统的实现机制,选择基于网络爬虫的搜索引擎技术,利用开源软件Nutch构建分布式DSearch实验系统,为开放存取资源出版和信息服务机构提供一种高效、灵活、可定制的检索工具。重点介绍DSearch系统核心技术——分布式集群配置、中文分词模块修改和索引设置,并通过设定的种子列表实验对DSearch系统实现的功能和效果进行评价。

    参考文献 | 相关文章 | 多维度评价
    利用Mashup提升图书馆服务能力——以豆瓣网和南京大学图书馆OPAC结合为例
    沈奎林, 杜瑾
    现代图书情报技术. 2010, 26 (10): 87-90.   DOI: 10.11925/infotech.1003-3513.2010.10.15
    摘要   HTML   PDF (481KB)

    介绍 Mashup的概念和基本应用,结合对豆瓣网的分析,利用Mashup技术将豆瓣网的图书评价推介功能和图书馆的OPAC系统融合起来,提高图书馆的服务能力,并给出实现思路和关键代码,同时以南京大学图书馆的汇文OPAC和豆瓣网的融合做实践,得到用户的认可。

    参考文献 | 相关文章 | 多维度评价
    学位论文OAI-METS元数据生成的实现
    周玉陶, 范国银
    现代图书情报技术. 2010, 26 (10): 91-94.   DOI: 10.11925/infotech.1003-3513.2010.10.16
    摘要   HTML   PDF (391KB)

    通过对学位论文OAI XML以及TRS元数据记录格式的分析,参照CALIS的相关标准和规范,提出一种用VB实现学位论文OAI XML元数据生成的程序设计方法,可为非标准的学位论文服务系统提供一个解决问题的思路。

    参考文献 | 相关文章 | 多维度评价
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn