Please wait a minute...
Advanced Search
  • 数据分析与知识发现
      2011年, 第27卷, 第4期 刊出日期:2011-04-25   
    选择: 合并摘要
    数字图书馆
    语义网环境下数据溯源表达模型研究综述
    沈志宏, 张晓林
    现代图书情报技术. 2011, 27 (4): 1-8.   DOI: 10.11925/infotech.1003-3513.2011.04.01
    摘要   HTML   PDF (754KB)
    综述语义网环境下数据溯源在表达模型与技术上的研究进展,重点研究Open Provenance Model、Provenir Ontology与Provenance Vocabulary的描述方法和能力,结合科研环境,讨论这些溯源模型在使用和推广上所面临的挑战。
    参考文献 | 相关文章 | 多维度评价
    数字图书馆私有云平台的构建研究和应用开发
    马少兵, 马自卫
    现代图书情报技术. 2011, 27 (4): 9-16.   DOI: 10.11925/infotech.1003-3513.2011.04.02
    摘要   HTML   PDF (645KB)
    介绍数字图书馆私有云平台的架构、详细阐述DLCloud云基础设施、Euca2ools中间件、基于GridSphere门户子系统的功能与机理。在数字图书馆私有云平台架构实现的基础上,详细介绍数字图书馆应用模板的建立和数字图书馆应用系统的运行方式等。最后对数字图书馆云平台进行总结,并对下一步工作提出展望。
    参考文献 | 相关文章 | 多维度评价
    云计算环境下大规模数据处理的研究与初步实现
    张兴旺, 李晨晖, 秦晓珠
    现代图书情报技术. 2011, 27 (4): 17-23.   DOI: 10.11925/infotech.1003-3513.2011.04.03
    摘要   HTML   PDF (822KB)
    将云计算技术引入到大规模数据处理过程中,提出在集中或分布管理的大量廉价计算机集群上构建动态的、可扩展的、高性价比的、易使用的高性能计算平台,创建一种基于云计算的大规模数据处理的框架模型。论述在这一环境下的大规模数据处理的方法和应用,通过搭建相应的计算平台,验证计算机集群及框架模型的可行性。
    参考文献 | 相关文章 | 多维度评价
    基于概念格的虚拟社区信息甄别中锚定效应的矫正
    田依林, 滕广青, 董立丽, 张凡
    现代图书情报技术. 2011, 27 (4): 24-28.   DOI: 10.11925/infotech.1003-3513.2011.04.04
    摘要   HTML   PDF (476KB)
    以概念格理论为基础,借助形式概念分析的方法对虚拟社区中的信息及其特征构建概念格。以概念聚类和关联规则挖掘辅助筛选和推荐具有较高通达性的“类比锚”,对由前锚信息造成的锚定效应进行干预。从认识论和本体论相结合的角度,尝试探索网络虚拟社区信息甄别活动中锚定效应的矫正方法。
    参考文献 | 相关文章 | 多维度评价
    知识组织与知识管理
    基于领域中文文本的术语抽取方法研究
    谷俊, 王昊
    现代图书情报技术. 2011, 27 (4): 29-34.   DOI: 10.11925/infotech.1003-3513.2011.04.05
    摘要   HTML   PDF (541KB)
    在ICTCLAS词典分词的基础上,利用串频最大匹配算法从中文专利文本中抽取候选术语,再利用TF-IDF算法得到相关特征项的权重,经过筛选后得到最终概念术语。最后,抽取部分样本数据进行实验,并对结果进行分析。
    参考文献 | 相关文章 | 多维度评价
    基于社会化标签网络的细粒度用户兴趣建模
    易明, 毛进, 邓卫华
    现代图书情报技术. 2011, 27 (4): 35-41.   DOI: 10.11925/infotech.1003-3513.2011.04.06
    摘要   HTML   PDF (733KB)
    针对目前由社会化标签抽取用户兴趣模型过程中存在的问题,在借鉴社会网络分析的基础上,提出构建网站层次和用户层次的社会化标签网络对用户产生的社会化标签进行序化,进而分别得到反映主题领域的社会化标签使用文档和用户标签网络,通过两者相似度的计算形成细粒度用户兴趣模型。实验结果能够验证该模型的科学性。
    参考文献 | 相关文章 | 多维度评价
    面向汉语自动句法分析的语法知识库构建
    王东波, 朱丹浩, 谢靖
    现代图书情报技术. 2011, 27 (4): 42-47.   DOI: 10.11925/infotech.1003-3513.2011.04.07
    摘要   HTML   PDF (648KB)
    基于100万字的973汉语树库,按照语法功能分布的理论,从汉语自动句法分析和语言知识库构建的角度,构建一个相对系统化和多层次的语法知识库。该语法知识库由汉语词语、短语实例、短语结构、句法规则等知识组成。汉语词语知识共统计51 390个汉语词汇的58种语法知识,短语实例知识共获取3 836个汉语短语实例的58种语法知识,短语结构知识共抽取26种短语结构的58种知识,句法规则共有900条记录知识组成。该语法知识库的构建不仅为汉语自动句法分析和语言学研究提供语法知识,而且为更大规模的语法知识库构建打下基础。
    参考文献 | 相关文章 | 多维度评价
    面向查询扩展的特征词频繁项集挖掘算法
    黄名选, 马瑞兴, 兰慧红
    现代图书情报技术. 2011, 27 (4): 48-51.   DOI: 10.11925/infotech.1003-3513.2011.04.08
    摘要   HTML   PDF (324KB)
    为了获取高质量的扩展词,提出一种面向查询扩展的基于文本数据库的特征词频繁项集挖掘算法。该算法采用支持度衡量特征词频繁项集,给出新的剪枝策略,并结合原始查询,挖掘同时含有查询词项和非查询词项的特征词频繁项集,以提高挖掘效率。实验表明,与传统的挖掘算法相比,本算法更有效、更合理。
    参考文献 | 相关文章 | 多维度评价
    情报分析与研究
    互联网新闻报道中的突发事件识别研究
    姚占雷, 许鑫
    现代图书情报技术. 2011, 27 (4): 52-57.   DOI: 10.11925/infotech.1003-3513.2011.04.09
    摘要   HTML   PDF (530KB)
    为及时、准确地捕获突发事件,提出词间距的思想,并构建基于互联网新闻报道的突发事件识别模型。该模型主要包括热点词元发现和新词语检测两部分,即通过改进的TF-PDF算法捕获当前关注的词元以形成热点词元,利用词间距来寻找热点词元之间的客观分布状态,从而依据热点词元之间相对稳定的组合达到突发事件识别的目的。实验表明该模型对突发事件的识别,在时间上有着较高的敏感性。
    参考文献 | 相关文章 | 多维度评价
    搜索引擎日志挖掘领域的论文合著网络分析
    王继民, 李雷明子, 张鹏
    现代图书情报技术. 2011, 27 (4): 58-63.   DOI: 10.11925/infotech.1003-3513.2011.04.10
    摘要   HTML   PDF (368KB)
    基于Web of SCI和EI数据库中所收录的有关搜索引擎日志挖掘领域的研究论文,构建作者合著网络,利用社会网络分析方法研究合著网络的中心性、小世界特性、连通性等基本特征,发现该领域中最核心的科研合作团队、研究人员及其研究内容等。
    参考文献 | 相关文章 | 多维度评价
    学术期刊客观赋权评价新方法——指标难度赋权法
    俞立平, 武夷山
    现代图书情报技术. 2011, 27 (4): 64-70.   DOI: 10.11925/infotech.1003-3513.2011.04.11
    摘要   HTML   PDF (417KB)
    在总结现有客观赋权法根据数据波动和数据独立程度赋权原理的基础上,对复相关系数法进行修正,提出一种根据指标值提高难度进行赋权的新方法——指标难度赋权法,并用标准分对学术期刊评价指标进行标准化,然后进行加权汇总。研究表明,指标难度赋权法能够克服评价中的“投机取巧”心理,区分度好,从而使评价更加公平,非常适合于学术期刊评价,但在评价对象较少的情况下采用该方法要慎重,概率权赋权法值得商榷。
    参考文献 | 相关文章 | 多维度评价
    应用实践
    PDF过量下载监测的设计与原型实现
    李宇, 王威
    现代图书情报技术. 2011, 27 (4): 71-76.   DOI: 10.11925/infotech.1003-3513.2011.04.12
    摘要   HTML   PDF (629KB)
    PDF过量下载容易造成电子资源服务中断。通过对网络PDF下载行为的抓取分析,设计并基于开源软件实现PDF过量下载监测系统原型。经过一年的实际运行,原型系统能够准确预警过量下载情况的发生。
    参考文献 | 相关文章 | 多维度评价
    实时虚拟参考咨询服务新尝试——清华大学图书馆智能聊天机器人
    姚飞, 纪磊, 张成昱, 陈武
    现代图书情报技术. 2011, 27 (4): 77-81.   DOI: 10.11925/infotech.1003-3513.2011.04.13
    摘要   HTML   PDF (626KB)
    实时虚拟参考咨询服务在图书馆服务中发挥着积极且重要的作用。清华大学图书馆基于开源软件A.L.I.C.E.开发出实时智能聊天机器人“小图”,提供参考咨询、图书搜索、自我学习等多种服务,并将其推广至社交网络,取得良好的效果。
    参考文献 | 相关文章 | 多维度评价
    高校图书馆电子资源服务监控系统设计与实现
    彭晓庆
    现代图书情报技术. 2011, 27 (4): 82-88.   DOI: 10.11925/infotech.1003-3513.2011.04.14
    摘要   HTML   PDF (591KB)
    针对图书馆电子资源管理中服务会中断或者不响应的问题,提出高校图书馆电子资源服务监控系统的需求分析,选择SNMP和Java EE技术对图书馆电子资源服务监控系统进行总体设计和详细设计,并实现一个符合图书馆实际需求,能监测图书馆电子资源服务平台、数据库以及图书馆专有的Z39.50服务,轻型的、便于部署和操作的系统。
    参考文献 | 相关文章 | 多维度评价
    基于LDAP实现多认证源的统一身份认证实践——以华东师范大学图书馆为例
    李欣, 刘丹
    现代图书情报技术. 2011, 27 (4): 89-93.   DOI: 10.11925/infotech.1003-3513.2011.04.15
    摘要   HTML   PDF (480KB)
    在实际应用基础上, 提出一套基于LDAP实现多认证源的统一用户身份管理解决方案,并对其中涉及的关键技术进行详细介绍。通过LDAP代理服务技术解决某些商业应用系统不支持多认证源的问题,为大型机构实现统一身份认证管理提供一种参考模式。
    参考文献 | 相关文章 | 多维度评价
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn