Please wait a minute...
Advanced Search
  • 数据分析与知识发现
      2014年, 第30卷, 第5期 刊出日期:2014-05-25   
    选择: 合并摘要
    数字图书馆
    我国教育科研机构知识库建设现状调查与分析
    姚晓霞, 聂华, 顾立平, 张冬荣, 吴越, 韦成府
    现代图书情报技术. 2014, 30 (5): 1-9.   DOI: 10.11925/infotech.1003-3513.2014.05.01
    摘要   HTML   PDF (4210KB)

    【目的】为求更好地了解中国机构知识库的发展现况, 以及提供未来发展战略的建议。【方法】 针对130个样本, 进行线上问卷调查。【结果】我国机构知识库在内容存储、系统平台、管理政策等三方面各有不同程度的发展。【局限】 总体调查规模有限, 调查结果的分析聚焦在已经建设机构知识库的单位。【结论】调查报告全面总结和分析我国教育科研机构知识库的建设现状, 建议未来进行机构知识库最佳案例的汇编。

    参考文献 | 相关文章 | 多维度评价
    IOPE视角下网格服务本体匹配算法研究*
    崔金栋, 徐宝祥
    现代图书情报技术. 2014, 30 (5): 10-17.   DOI: 10.11925/infotech.1003-3513.2014.05.02
    摘要   HTML   PDF (623KB)

    【目的】更好地根据用户的需求在网格服务本体库中查询相对应的本体, 进而找到对应的服务。【方法】把用户对服务的描述转化为网格服务描述本体, 在IOPE算法的基础上通过分析服务功能的语义描述, 逐级匹配从而实现匹配全过程的定量分析, 改进现有服务本体的匹配算法。【结果】实现真正本体之间的匹配, 即网格服务描述本体与存储在网格服务本体库中的网格服务本体之间的匹配, 仿真实验证明这能够有效地提高网格服务本体匹配的准确率。【局限】改进的算法只在网格仿真平台上经过验证, 并没有在更为复杂的网格环境中进行验证。【结论】改进的新算法可以实现匹配全过程的定量分析, 从而有效地提高查准率。

    参考文献 | 相关文章 | 多维度评价
    LDA模型下书目信息分类系统的研究与实现
    李湘东, 廖香鹏, 黄莉
    现代图书情报技术. 2014, 30 (5): 18-25.   DOI: 10.11925/infotech.1003-3513.2014.05.03
    摘要   HTML   PDF (1706KB)

    【目的】改善图书和期刊论文等的书目信息的分类性能。【应用背景】采用传统向量空间模型对图书和期刊论文等书目信息分类的效果不理想, 通过LDA模型挖掘文本隐含语义信息, 能有效提高分类效果。【方法】通过LDA建模, 用隐含主题表示文本并通过分类效果确定最优主题数, 在此基础上采用SVM算法分类。【结果】实验表明, 在复旦和Sogou公开语料库中的Macro_F1分别达到95.5%和93.5%; 在馆藏目录及电子期刊数据库等真实书目数据中的Macro_F1分别达到77.4%和87.6%。【结论】在真实数据上的分类性能比传统向量空间模型分别提高10%和3%, 达到实用水平。

    参考文献 | 相关文章 | 多维度评价
    知识组织与知识管理
    面向知识组织系统整合的英文同义关系自动发现算法研究*
    李晓瑛, 李丹亚, 钱庆, 孙海霞, 李军莲, 胡铁军
    现代图书情报技术. 2014, 30 (5): 26-32.   DOI: 10.11925/infotech.1003-3513.2014.05.04
    摘要   HTML   PDF (510KB)

    【目的】进行基于术语同义关系发现的知识组织系统整合研究。【方法】提出一种英文同义关系自动发现算法, 涉及基于词形还原的词形归并以及基于同义关系传递和来源词表颗粒度控制的语义归并等综合方法。 【结果】通过对多来源领域术语的大规模实验评估, 并与已有整合知识组织系统进行多指标比较, 获得较为满意的归并正确率, 体现出良好的可行性及实用价值。【结论】本算法可应用于大规模领域知识组织系统的整合研究中, 并对中文知识组织系统整合有一定借鉴意义。

    参考文献 | 相关文章 | 多维度评价
    面向知识关联的标签云优化机理研究*
    毕强, 周姗姗, 马志强, 滕广青
    现代图书情报技术. 2014, 30 (5): 33-40.   DOI: 10.11925/infotech.1003-3513.2014.05.05
    摘要   HTML   PDF (3956KB)

    【目的】通过揭示与呈现Folksonomy标签云中的关联关系, 对标签云优化机理进行探讨。【应用背景】 传统Folksonomy知识组织模式中的标签云由于无法体现主题知识之间的关联, 制约了标签云的感知有用性。 【方法】 通过对用户标签网络的属性分析以及模块化处理, 将标签云中的标签划分成若干个知识群落。借助连线、颜色、字号的相互配合, 从主题知识关联的视角优化标签云。【结果】 发现社群中隐含的知识群落具有稳健性, 能够呈现出知识间的关联关系。【结论】面向知识关联的标签云优化能够在多个粒度上提高标签云的感知有用性, 促进更科学实用的标签云体系研发。

    参考文献 | 相关文章 | 多维度评价
    中文UGC信息源的本体概念抽取研究*
    唐晓波, 胡华
    现代图书情报技术. 2014, 30 (5): 41-49.   DOI: 10.11925/infotech.1003-3513.2014.05.06
    摘要   HTML   PDF (590KB)

    【目的】实现基于UGC信息源的本体概念抽取。【方法】针对UGC信息源特征, 提出一种基于语言学的细粒度词抽取组合并应用统计过滤组成概念的本体概念抽取方法, 建立基于UGC信息源的概念抽取模型并对原型系统进行验证。【结果】在UGC信息源概念抽取实验中, 该方法的结果比其他4组概念抽取方法的表现更为优异, 准确率达68.42%, 召回率达85.35%。【局限】概念抽取的测试集来自信息质量较高的UGC信息源, 部分信息经过人工过滤, 语料规模存在不足。【结论】概念抽取方法与技术在实现基于UGC信息源的本体概念抽取中具有一定的意义。

    参考文献 | 相关文章 | 多维度评价
    P2P环境下基于社会化标签的个性化推荐模型研究
    赵艳, 王亚民
    现代图书情报技术. 2014, 30 (5): 50-57.   DOI: 10.11925/infotech.1003-3513.2014.05.07
    摘要   HTML   PDF (695KB)

    【目的】利用用户使用标签的频率和时间因素计算用户的标签偏好向量, 讨论用户兴趣的动态变化性对个性化推荐准确性的影响。【方法】构建P2P环境下基于社会化标签的个性化推荐模型, 详细说明用户偏好的计算过程及推荐流程, 并以西安某高校的P2P电影分享系统为对象进行实验验证。【结果】在随机选择的10名目标用户中, 对其中8名用户的推荐命中率均高于传统基于用户评分的协同过滤推荐, 说明综合用户标签使用频率和时间因素的推荐效果的优越性。【局限】由于本文主要研究用户兴趣的动态性对个性化推荐的影响, 因此只在实验时人工删除无意义标签、合并相似标签, 并没有引入有效的控制标签模糊性机制。【结论】在个性化推荐中, 考虑用户兴趣的动态变化性, 有助于提高推荐结果的准确性。

    参考文献 | 相关文章 | 多维度评价
    情报分析与研究
    卖家描述与买家评论相符度模型研究
    王倩倩, 袁勤俭
    现代图书情报技术. 2014, 30 (5): 58-65.   DOI: 10.11925/infotech.1003-3513.2014.05.08
    摘要   HTML   PDF (1328KB)

    【目的】通过构建买家评论与卖家描述的相符度模型, 对淘宝中卖家描述的商品特性与买家评论是否一致进行探讨。【方法】研究卖家的商品描述和买家的评论这两个文本信息, 提取产品属性特征词和判断情感词极性, 最后选取三家淘宝网店进行模型评估实验。【结果】发现B商家宝贝描述与买家评论相符度较高, A店次之, C店最差。其中, C店的“里衬”和“正品”两个产品属性, 卖家描述与买家评论不相符。【局限】卖家描述的内容和买家评论的内容未能全面涉及, 没有包括卖家的商品标题信息、卖家的图片说明信息以及买家秀中买家提供的照片信息。【结论】经过模型计算后的结果能够更细节、准确地反映出商品在哪些属性上相符以及多大程度上相符, 进而更有效地辅助消费者进行决策。

    参考文献 | 相关文章 | 多维度评价
    微博局部世界演化模型探究*
    何玉梅, 齐佳音, 刘慧丽
    现代图书情报技术. 2014, 30 (5): 66-73.   DOI: 10.11925/infotech.1003-3513.2014.05.09
    摘要   HTML   PDF (1901KB)

    【目的】通过研究微博网络的结构特征, 对微博局部世界演化模型进行探究。【方法】以新浪微博全网数据和典型用户拓扑结构为例, 引入舆论动力学理论和复杂网络理论进行模型探究。【结果】获取微博用户行为框架, 得出划分普通用户和意见领袖的依据, 并建立微博局部世界演化模型。【局限】典型用户的选取具有一定的局限性; 全网数据的分析具有一定的偏差。【结论】本文建立的微博局部世界演化模型符合真实微博网络的拓扑结构, 研究成果有助于了解微博的网络结构。

    参考文献 | 相关文章 | 多维度评价
    网络商品评论的特征-情感词本体构建与情感分析方法研究*
    杜嘉忠, 徐健, 刘颖
    现代图书情报技术. 2014, 30 (5): 74-82.   DOI: 10.11925/infotech.1003-3513.2014.05.10
    摘要   HTML   PDF (1227KB)

    【目的】解决情感分析领域使用通用情感词典进行情感分析时, 在特定领域内无法识别领域专用情感词, 以及同一情感词描述不同特征时可能表达出不同情感倾向的两个问题。【方法】提出一种基于领域专用情感词的网络评论情感分析方法。该方法构建特征-情感词本体, 利用本体对网络上的产品评论进行情感分析。并与基于Senti-HowNet词典的情感分析方法进行对比。【结果】本文方法在特征层的情感倾向分析的准确率和召回率都有显著提高。【局限】本文方法中的本体需要尽可能完整的特征词集和情感词集, 并且情感分析结果好坏直接依赖于本体的构建是否完善; 由于网络文本的不规范性, 特征词和情感词抽取以及情感分析的过程都不考虑句法结构; 数据分析过程对问题进行了简化, 仅考虑特征粒度的情感倾向, 未考虑连词等对情感倾向有影响的其他因素。【结论】对专用情感词和通用情感词进行分类管理, 解决了两个问题, 情感分析结果得到提高。

    参考文献 | 相关文章 | 多维度评价
    应用实践
    朴素贝叶斯算法与Bootstrapping方法相结合的中文物种描述文本语义标注研究*
    段宇锋, 朱雯晶, 陈巧, 崔红
    现代图书情报技术. 2014, 30 (5): 83-89.   DOI: 10.11925/infotech.1003-3513.2014.05.11
    摘要   HTML   PDF (1194KB)

    【目的】 降低中文物种描述文本语义标注的学习成本。【方法】 设计基于Bootstrapping的弱监督学习方法, 以少量数据为基础, 迭代执行学习和标注过程。在迭代过程中, 利用置信度最高的标注数据扩充知识库, 提升标注能力。【结果】运用15 041条数据测试算法效率, F-value的平均值达到0.911 2。【局限】对过于稀疏的数据, 标注效率相对较低。【结论】本研究设计的方法不仅有效降低系统学习对训练数据规模的要求, 而且可提高标注效率。

    参考文献 | 相关文章 | 多维度评价
    图像检索技术在“经典阅读”教学系统中的实现与应用*
    吴坤, 颉夏青, 白权威, 吴旭
    现代图书情报技术. 2014, 30 (5): 90-95.   DOI: 10.11925/infotech.1003-3513.2014.05.12
    摘要   HTML   PDF (3118KB)

    【目的】扩展“经典阅读”教学系统的图像检索途径, 提高经典名著教学资源的利用率。【应用背景】“经典阅读”系统是基于阅读学分机制的教学体系创新平台, 增加图像检索功能是对已有文本检索的补充和拓展, 能够提升教学效果。【方法】建立基于特征语义的图像检索模型进行图像特征值提取、归一化和相似性度量, 实现检索请求提交、图像检索、结果反馈和图片管理等功能模块。【结果】实现图像分类自动化, 能够通过相关图像检索到相应图书, 准确率介于92%到100%之间。【结论】提升“经典阅读”教学系统的用户体验, 改善“经典阅读”教学效果。

    参考文献 | 相关文章 | 多维度评价
    图书馆微信服务应用开发——以上海图书馆为例
    郭利敏, 张磊, 赵亮
    现代图书情报技术. 2014, 30 (5): 96-101.   DOI: 10.11925/infotech.1003-3513.2014.05.13
    摘要   HTML   PDF (1348KB)

    【目的】尝试将图书馆服务与第三方平台(微信平台)整合, 以提高图书馆信息化服务水平。【应用背景】微信活跃用户的快速增多, 微信公众号被细分为订阅号和服务号。【方法】利用微信平台提供的接口, 结合Java Servlet、WebService技术将图书馆馆藏查询、续借、逾期提醒、咨询、活动等服务整合进微信平台。【结果】读者可通过一键操作的形式便捷地使用图书馆资源和服务。【结论】本文开发的图书馆微信服务能够丰富图书馆的移动服务, 方便读者使用图书馆服务。

    参考文献 | 相关文章 | 多维度评价
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn