Please wait a minute...
Advanced Search
  • 数据分析与知识发现
      2013年, 第29卷, 第3期 刊出日期:2013-03-25   
    选择: 合并摘要
    数字图书馆
    Curators of the Future
    Michael Lesk
    现代图书情报技术. 2013, 29 (3): 1-7.   DOI: 10.11925/infotech.1003-3513.2013.03.01
    摘要   HTML   PDF (588KB)
    Is there such a thing as too much data? If not, who is going to be responsible for selecting what we keep? There is only starting to be a profession of data curation. Data curation will need at least three skills: expertise from library, archive and museum studies about choosing, preserving and explaining to users; expertise from computer science and engineering about data processing, data exploration and data storage methods; and expertise from the subject area of the material, so as to know what the data means, where it came from, and what its significance is. Will we do this work with a committee, or train one person to do everything; and if the latter, is that person likely to start from the library, computing, or subject domain?
    参考文献 | 相关文章 | 多维度评价
    利用本体资源标注实现站内检索语境导航
    李晓鹏, 颜端武, 蔡金霞, 成晓
    现代图书情报技术. 2013, 29 (3): 8-13.   DOI: 10.11925/infotech.1003-3513.2013.03.02
    摘要   HTML   PDF (955KB)
    目前主题服务网站站内检索功能大多存在字面简单匹配、检索效果不佳、缺乏检索提示、导航机制不足等问题。结合“金陵旅游网”站内检索服务,提出一种基于本体资源标注的站内检索语境导航实现方案。通过旅游本体构建、网站资源对象的本体标注,设计实现信息提示导航和多维分类导航功能,可对用户提问和检索交互进行有效引导。测评效果表明,与传统站内检索方案相比,本文方案在行程安排、检索效率和用户体验等方面有明显提升。
    参考文献 | 相关文章 | 多维度评价
    面向本体构建的叙词表词间关系细化和应用研究
    薛建武, 赵娜, 王东娜
    现代图书情报技术. 2013, 29 (3): 14-20.   DOI: 10.11925/infotech.1003-3513.2013.03.03
    摘要   HTML   PDF (1014KB)
    对叙词表中的三类关系,即等同关系、等级关系和相关关系进行深入分析,将叙词表中粗粒度的词间关系细化为16种细粒度的子关系,并对几种主要概念间关系进行特征提取和描述。在这一细化研究的基础上,对导弹本体构建进行详细设计,以期为后续基于叙词表的航空领域本体构建研究提供研究思路与实践基础。
    参考文献 | 相关文章 | 多维度评价
    知识组织与知识管理
    面向关联数据的引文知识链接模式研究
    高劲松, 梁艳琪, 马倩倩, 周习曼, 付旭雄
    现代图书情报技术. 2013, 29 (3): 21-26.   DOI: 10.11925/infotech.1003-3513.2013.03.04
    摘要   HTML   PDF (1676KB)
    在分析传统引文知识链接模式的基础上,提出基于关联数据的引文知识链接模式,利用文献知识点抽取、文献信息语义化、知识链接发布、知识源链接及获取技术整合不同学科知识资源,构建语义Web环境下的知识网络。最后结合Parliament和OpenURL对该模式进行实验验证。
    参考文献 | 相关文章 | 多维度评价
    融合语义相似度的商务情报链接分析算法研究
    何超, 张玉峰
    现代图书情报技术. 2013, 29 (3): 27-32.   DOI: 10.11925/infotech.1003-3513.2013.03.05
    摘要   HTML   PDF (667KB)
    针对传统链接分析算法存在的链接丢失问题和语义异构问题,设计基于语义相似度的商务情报链接分析算法。该算法综合应用锚链文本和锚链结构信息解决链接丢失问题,应用领域本体提供语义知识解决语义异构问题。实验结果表明,该算法能够显著提高商务情报分析结果的准确性。
    参考文献 | 相关文章 | 多维度评价
    面向汉语句法功能分布知识库的词汇类别知识挖掘研究
    王东波, 朱丹浩
    现代图书情报技术. 2013, 29 (3): 33-37.   DOI: 10.11925/infotech.1003-3513.2013.03.06
    摘要   HTML   PDF (634KB)
    基于清华大学汉语树库,通过多叉树存储结构,构建汉语词汇的句法功能分布知识库。在构建的句法功能分布知识库基础上,利用Sparse Feature Clustering(SFC)中的K-medoids聚类算法,对汉语词汇的类别知识进行挖掘探究。
    参考文献 | 相关文章 | 多维度评价
    专利文本分类的基础问题研究
    屈鹏, 王惠临
    现代图书情报技术. 2013, 29 (3): 38-44.   DOI: 10.11925/infotech.1003-3513.2013.03.07
    摘要   HTML   PDF (612KB)
    对专利文本分类中的基础问题进行研究,包括术语作为专利文本分类特征的适用性,主权项字段分类研究和相近主题对分类结果的影响等。研究在两种朴素贝叶斯分类器、kNN、Racchio和支持向量机等5个分类器上进行,测试主要采用交叉验证的方法。研究结果显示,在同样的设定下,采用术语作为特征的分类结果优于使用一般特征词;使用摘要训练,对主权项进行分类有助于改善主权项的分类效果;相近主题会降低分准率,有必要设计层次的分类器进行分类试验。研究结果可以为专利文本分类研究和实践提供参考数据,并可作为信息分析等工作使用专利文本分类技术的参考。
    参考文献 | 相关文章 | 多维度评价
    情报分析与研究
    媒体作用下互联网舆情话题传播模型研究
    朱恒民, 刘凯, 卢子芳
    现代图书情报技术. 2013, 29 (3): 45-50.   DOI: 10.11925/infotech.1003-3513.2013.03.08
    摘要   HTML   PDF (1305KB)
    基于BA无标度网络和疾病传播SEIR模型,提出媒体作用下的舆情话题传播模型,该模型充分考虑到媒体数量、报道力度和可信度对舆情话题传播的影响作用,并对该模型进行数值仿真和模拟仿真分析。实验结果表明媒体作用下互联网舆情话题传播速度加快,传播范围变广,且传播弛豫时间减少。
    参考文献 | 相关文章 | 多维度评价
    突发事件网络衍生舆情监测模型研究
    兰月新
    现代图书情报技术. 2013, 29 (3): 51-57.   DOI: 10.11925/infotech.1003-3513.2013.03.09
    摘要   HTML   PDF (1368KB)
    分析突发事件衍生舆情传播特性,以突发事件网络舆情传播规律模型为铺垫,研究网络衍生舆情特点,通过定义描述舆情衍生程度的衍生率建立衍生舆情监测预警模型,并通过实例验证理论研究的可行性,以期为政府实现网络舆情管理提供参考。
    参考文献 | 相关文章 | 多维度评价
    基于LDA模型的社交网站自动量化评价研究
    王嘉琦, 徐朝军, 李艺
    现代图书情报技术. 2013, 29 (3): 58-64.   DOI: 10.11925/infotech.1003-3513.2013.03.10
    摘要   HTML   PDF (749KB)
    在海量数据背景下,针对社交网站中队成员关系、话题热度及内涵的价值倾向等评价问题,提出一个基于LDA的两阶段社交网站自动量化评价模型。首先通过LDA方法将文本内容映射到主题空间,依据文本所属主题和用户特征来剔除垃圾信息;对于筛选出的信息,从用户、话题和社区三个角度提出一个新的社交网站的量化分析方法。最后,通过对西祠胡同的实验分析验证该模型的有效性和可行性。
    参考文献 | 相关文章 | 多维度评价
    基于复杂在线网络的舆情传递研究——进化博弈视角
    魏静, 朱恒民, 洪小娟, 宋瑞晓, 许赞
    现代图书情报技术. 2013, 29 (3): 65-70.   DOI: 10.11925/infotech.1003-3513.2013.03.11
    摘要   HTML   PDF (701KB)
    以复杂网络为背景,研究在网络动态变化下的舆情传递博弈行为。构建基于复杂网络的互联网舆情传递进化博弈模型,对整个舆情传递的博弈进化过程进行仿真模拟,求出稳定进化策略。研究发现,初始博弈策略的选择个体比例,对舆情传递具有重要影响。随着个体“传递”策略博弈方比例的升高,网络连接数的增多,均衡状态实现得越快。并且,由于“非全连接”的网络结构和网络匿名性的特征,在舆情传递过程会存在停滞和游走现象,最终会因群体压力使舆情走向衰退。同时,也为舆情传递监督者控制和引导网络舆情传递提供理论依据。
    参考文献 | 相关文章 | 多维度评价
    应用实践
    开源分析工具在中文文献分析中的应用
    侯月明, 乔晓东, 孙卫, 李颖
    现代图书情报技术. 2013, 29 (3): 71-76.   DOI: 10.11925/infotech.1003-3513.2013.03.12
    摘要   HTML   PDF (876KB)
    对开源分析工具进行初步的调研,按照工具的开放性和可扩展性选取部分分析工具,对其技术特点和功能进行简要介绍。综合分析工具的特点,提出基于中文文献的分析工具组合应用方案:根据国内主要文献数据库导出数据格式,对SciMat的数据导入和预处理模块进行扩展,使其能够直接处理中文文献;利用NWB和Sci2中集成的大量文献分析算法,对文献数据进行多角度、多层面分析;通过GUESS和VOSViewer完成分析结果的可视化,增加分析结果的可读性。最后,通过案例演示分析过程,验证该方案的可行性。
    参考文献 | 相关文章 | 多维度评价
    采用混合方法抽取生物医学实体间语义关系
    王秀艳, 崔雷
    现代图书情报技术. 2013, 29 (3): 77-82.   DOI: 10.11925/infotech.1003-3513.2013.03.13
    摘要   HTML   PDF (489KB)
    以阿司匹林副作用为研究样本的主题,搜集PubMed数据库中与“药物副作用引起疾病”主题词关联规则相对应的文献记录,在文献摘要中提取出相应实体共现的句子,进而利用自然语言处理方法提取文献中表达生物医学实体间语义关系的动词,共提取出30个表示药物副作用与疾病关系的动词。研究结果表明:基于共现和自然语言处理提取语义关系动词的方法是可行的。
    参考文献 | 相关文章 | 多维度评价
    超高频RFID标签压缩算法的实现与应用研究 ——以条码压缩为例
    曲建峰, 陈进, 李鲍, 陈嘉懿
    现代图书情报技术. 2013, 29 (3): 83-87.   DOI: 10.11925/infotech.1003-3513.2013.03.14
    摘要   HTML   PDF (440KB)
    现阶段市场上超高频RFID标签的存储容量有限,因此对存入标签中的信息必须进行压缩。然而目前国内还没有统一的压缩算法标准。针对该问题,以标签存储中最常用的图书馆馆藏条码为例,研制在不同的条码长度与字符情况下存储在超高频RFID标签中的压缩方法和不同情况下所应当采用的算法原理与数据结构,并将该方法应用于不同的厂家进行测试,真正实现互相间无障碍的读写。
    参考文献 | 相关文章 | 多维度评价
    Linux实现的图书馆查询机
    卢明, 沈奎林, 邵波
    现代图书情报技术. 2013, 29 (3): 88-93.   DOI: 10.11925/infotech.1003-3513.2013.03.15
    摘要   HTML   PDF (573KB)
    针对图书馆查询机的特殊使用要求和使用过程中出现的普遍问题,结合南京大学图书馆工作人员的工作经验和多次实验尝试,提出一种全新的Linux实现方式。详细阐述查询机系统Linux化过程中的各个步骤,最终实现定时开关机、系统桌面精简、浏览器定向访问、远程系统更新等几个功能。
    参考文献 | 相关文章 | 多维度评价
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn