Please wait a minute...
Advanced Search
  • 数据分析与知识发现
      2013年, 第29卷, 第5期 刊出日期:2013-05-25   
    选择: 合并摘要
    数字图书馆
    科研数据共享的挑战
    Christine L. Borgman(著), 青秀玲(译)
    现代图书情报技术. 2013, (5): 1-20.   DOI: 10.11925/infotech.1003-3513.2013.05.01
    摘要   HTML   PDF (824KB)

    新型科研设备和研究方法的出现造成了前所未有的数据洪流。大量数据以及新型数据分布和挖掘方法激起资助机构、决策者和一般大众对于新的发现和创新的憧憬。众多利益相关者期盼数据可开放获取,然而至今数据共享也仅在天文学和基因组学等少数领域出现。在其他领域,一部分研究者会经常共享数据,其他研究者则从不共享数据,而其他大多数研究者则只愿意在某些时间共享某些数据。因此,数据共享仍是一个难题——一个错综复杂而又困难的问题。科研数据有很多形式,数据收集有很多目的,也采用很多方法,一旦离开了数据最初产生的背景则很难解释。本文以自然科学、社会科学和人文科学为例来分析说明数据类型和数据实践。作者考察了数据共享的4个理由:进行研究再现或验证;使公共资助研究的结果为公众所用;使其他人利用现有数据提出新的科学问题;提升研究和创新水平。因为不同的共享原因、不同的受益人、以及卷入其中的利益相关者的动机和激励,人们对这些理由的认识不同。数据共享的挑战就是理解什么数据应该被共享、被谁共享、和谁共享、在什么条件下共享、为什么共享以及要做什么努力等。回答这些问题将贯穿整个数据政策和数据实践。

    参考文献 | 相关文章 | 多维度评价
    国外开放科学数据研究综述
    黄永文, 张建勇, 黄金霞, 王昉
    现代图书情报技术. 2013, (5): 21-27.   DOI: 10.11925/infotech.1003-3513.2013.05.02
    摘要   HTML   PDF (506KB)
    介绍开放科学数据的含义和开放科学数据的相关政策,分析科学数据的引用格式及3个主要的开放科学数据仓储,总结开放科学数据的4种发现服务,提出图书馆可以开展科学数据的培训服务、存储和管理服务,以及开放科学数据的发现和再利用服务。
    参考文献 | 相关文章 | 多维度评价
    数字图书馆中层关联数据的创建与发布
    王忠义, 夏立新, 石义金, 郑森茂
    现代图书情报技术. 2013, (5): 28-33.   DOI: 10.11925/infotech.1003-3513.2013.05.03
    摘要   HTML   PDF (1266KB)
    为实现数字图书馆馆藏资源目录数据(中粒度)的中层关联数据的创建与发布,在对现有关联数据创建与发布方法进行研究的基础上,针对目录数据自身的特点,采用自动标引、主题词映射等技术实现目录数据的结构化,借助目录体系与文本匹配实现关联数据的关联发现,借助D2R最终实现中层关联数据的创建与发布。
    参考文献 | 相关文章 | 多维度评价
    知识组织与知识管理
    多因素影响的特征选择方法
    路永和, 李焰锋
    现代图书情报技术. 2013, (5): 34-39.   DOI: 10.11925/infotech.1003-3513.2013.05.04
    摘要   HTML   PDF (728KB)
    在特征选择过程中,通过特征选择评估函数得到的词的权值大小决定该词是否作为特征词,然而词的权值受多种因素影响,主要因素有词的重要性、特征性和代表性。从以上几个因素出发,构建新的特征选择函数TW,通过对词的卡方分布CHI、信息增益IG和新的特征选择函数TW做对比实验,验证TW能够提高类别中专有词汇的权值,降低常见但对分类不重要的特征的权值;将TW作为新的特征选择算法,通过在中文分类语料库中分别采用KNN、类中心和支持向量机(SVM)三种分类方法进行实际分类实验,并与其他特征选择算法进行比较,验证该特征选择算法的有效性。
    参考文献 | 相关文章 | 多维度评价
    跨语言术语同义关系推荐方法及其实证
    宋培彦, 李静静, 赵星
    现代图书情报技术. 2013, (5): 40-45.   DOI: 10.11925/infotech.1003-3513.2013.05.05
    摘要   HTML   PDF (613KB)
    同义关系是术语词间关系的基本类型。以英汉对齐词典为知识库、以等值翻译词对为知识表示形式,提出对中文术语和英文翻译进行双向推导的方法,建立树形拓扑结构并进行遍历操作,通过加权优选模型对同义词推荐结果进行优化。实验证明该方法对术语同义关系识别的准确率较高,在知识组织工具构建、百科知识服务、信息检索等领域有一定应用价值。
    参考文献 | 相关文章 | 多维度评价
    一种结合借阅时间特征分析的读者兴趣可视化识别方法
    李树青, 王建强
    现代图书情报技术. 2013, (5): 46-53.   DOI: 10.11925/infotech.1003-3513.2013.05.06
    摘要   HTML   PDF (711KB)
    利用用户访问中的时间信息可以增强对用户个性化兴趣特征的识别能力。结合图书馆的图书推荐服务,提出利用读者借阅记录中的时间信息来构造读者个性化模式的方法。首先介绍三个基于读者借阅时间特征分析的扩展时间指标,并对读者阅读兴趣程度的识别方法和读者兴趣时序演变趋势可视化设计两方面内容进行详细说明。最后,对相关测试实验及其改进效果进行必要的说明。
    参考文献 | 相关文章 | 多维度评价
    云模型和多特征的高校读者借阅偏好不确定性图书推荐研究
    李克潮, 蓝冬梅, 凌霄娥
    现代图书情报技术. 2013, (5): 54-58.   DOI: 10.11925/infotech.1003-3513.2013.05.07
    摘要   HTML   PDF (546KB)
    利用云模型表示自然界中模糊性、随机性等不确定性优势,提出云模型和读者多特征的借阅偏好不确定性。计算读者专业、性别、年级加权相似度,利用逆向云算法计算以云的期望、熵、超熵来表示的读者借还时间间隔偏好,再计算读者基于云的相似度。结合读者多特征相似度、云相似度,向读者推荐存在复本的图书,并通过实验验证算法的有效性。
    参考文献 | 相关文章 | 多维度评价
    情报分析与研究
    技术路线图中未来技术词表构建方法研究
    叶春蕾, 冷伏海
    现代图书情报技术. 2013, (5): 59-63.   DOI: 10.11925/infotech.1003-3513.2013.05.08
    摘要   HTML   PDF (487KB)
    利用文本挖掘技术,并结合科学计量、自然语言处理等方法,提出一种基于三重共现算法的技术路线图中未来技术词表构建方法,以揭示特定技术领域的未来技术发展方向和未来发展阶段水平特征,初步实现技术路线图中的未来技术分析目标。实验表明该方法能够在一定程度上支持技术路线图的未来技术分析研究。
    参考文献 | 相关文章 | 多维度评价
    复杂网络领域科研合著网络演化及知识传播特点研究
    李盛庆, 蔡国永
    现代图书情报技术. 2013, (5): 64-72.   DOI: 10.11925/infotech.1003-3513.2013.05.09
    摘要   HTML   PDF (736KB)
    以复杂网络研究领域1975年-2012年间的科研合著网络为例,分4个发展阶段对科研合著网络的静态特征、拓扑特征、动态演化特征等参数进行计算,来解释和说明科研合著网络的演化和知识传播特点。仿真实验表明:当知识传递率一定时,知识传播速度受到个体创新能力的影响较大;当个体创新能力一定时,知识传播速度受到知识传递率的影响较小。
    参考文献 | 相关文章 | 多维度评价
    微博舆论传播的集群行为执行意向规律感知比较实验
    王林, 赵杨, 时勘
    现代图书情报技术. 2013, (5): 73-79.   DOI: 10.11925/infotech.1003-3513.2013.05.10
    摘要   HTML   PDF (1080KB)
    基于微博舆论传播的网络集群行为执行意向的规律与感知探索已成为预警与舆情研究的热点。通过三个在线微博实验,从话题热度及走势、情绪热度、语义网络及微博影响力方面对微博舆论传播集群行为规律进行探索。结果发现:微博集群行为执行意向受到话题热度及走势、情绪热度、网络中心性、粉丝数、关注数和原创数的影响;微博集群行为的可控性、安全性和价值性执行意向规律在话题走势、情绪变化、微博影响力、语义网络等方面均存在差异性。本实验研究结果对于微博热点事件引导策略的制定有一定的启示意义,同时能够对于加强社会管理和危机应对提供实践指引。
    参考文献 | 相关文章 | 多维度评价
    应用实践
    利用主题自动标引生成技术功效矩阵
    王丽, 张冬荣, 张晓辉, 杨小薇, 吴鸣
    现代图书情报技术. 2013, (5): 80-86.   DOI: 10.11925/infotech.1003-3513.2013.05.11
    摘要   HTML   PDF (1791KB)
    构建一种标引功效矩阵自动化工具Patent-TEM,该工具通过词库构建、主题标引、功效矩阵、文本提取等步骤对专利文本进行挖掘和分析,自动生成专利功效矩阵图,能够大幅度提高传统功效矩阵分析的工作效率,实现专利微观分析工作的自动化与工具化。结合CMOS工艺技术专利分析的应用实践对Patent-TEM的设计和实现进行详细描述,并指出下一步研究工作的方向。
    参考文献 | 相关文章 | 多维度评价
    研究小间预约系统的设计与实现
    沈奎林, 赵华, 邵波
    现代图书情报技术. 2013, (5): 87-91.   DOI: 10.11925/infotech.1003-3513.2013.05.12
    摘要   HTML   PDF (1225KB)
    分析国内外一些开展信息共享空间服务的大学图书馆的研究小间的管理和应用现状,指出手工借阅的缺点和在线自助预约的优点,依托图书馆自助服务平台的支持,提出开发研究小间网上预约系统、现场预约系统以及手机预约APP的解决方案。以南京大学图书馆的研究小间预约系统为例,详细阐述实践过程和应用效果。
    参考文献 | 相关文章 | 多维度评价
    图书馆微博辅助管理程序设计
    朱玉强
    现代图书情报技术. 2013, (5): 92-92.   DOI: 10.11925/infotech.1003-3513.2013.05.13
    摘要   HTML   PDF (1033KB)
    针对管理员无法全天候管理微博的问题,基于新浪微博设计可利用信息库自动发布、利用知识库智能回复的辅助管理程序。通过操作网页文档对象、中文分词等获取微博数据,通过发送消息、模拟按键操作新浪微博官方PC客户端实现发布、回复。结果表明该程序辅助管理微博时可及时响应读者诉求。
    参考文献 | 相关文章 | 多维度评价
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn