Please wait a minute...
Advanced Search
  • 数据分析与知识发现
      2015年, 第31卷, 第7-8期 刊出日期:2015-08-25   
    选择: 合并摘要
    专题
    学术博客:值得关注的非正式学术交流形式
    许鑫
    现代图书情报技术. 2015, 31 (7-8): 1-2.   DOI: 10.11925/infotech.1003-3513.2015.07.01
    摘要   HTML   PDF (304KB)
    参考文献 | 相关文章 | 多维度评价
    学术博客中的用户交流与知识传播研究述评
    翟姗姗, 许鑫, 夏立新
    现代图书情报技术. 2015, 31 (7-8): 3-12.   DOI: 10.11925/infotech.1003-3513.2015.07.02
    摘要   HTML   PDF (496KB)

    目的】全面梳理近年来国内外学术博客的研究重点, 进一步拓展用户行为、知识传播、知识服务研究的理论内涵与外延。【文献范围】在CNKI、万方、WoS数据库中以"学术博客"作为检索词, 通过阅读筛选获得60余篇国内外相关文献。【方法】在现有研究基础上, 从用户交流与知识内容本身两个层面分析学术博客的研究现状, 并从用户研究、知识传播与实证调研三个方面对其存在的主要问题进行深入的分析。【结果】证明从用户维与知识维两个维度构建基于学术博客的学科交流模式的必要性和可行性, 应更加关注学术博客社区中的隐性知识传播模式。【局限】学术博客的研究仍在不断发展之中, 其知识传播方法也不断得到改进, 本文仅通过用户交流与知识内容本身两个层面进行归纳与总结。【结论】有必要关注学术博客中隐性知识的挖掘和表达(将必要的隐性知识转化为显性知识), 研究隐性知识的传播渠道, 探索隐性知识的传播模式。

    参考文献 | 相关文章 | 多维度评价
    学术博客的学科交互实证分析——以科学网博客为例
    许鑫, 翟姗姗, 姚占雷
    现代图书情报技术. 2015, 31 (7-8): 13-23.   DOI: 10.11925/infotech.1003-3513.2015.07.03
    摘要   HTML   PDF (1157KB)

    目的】通过分析学术博客社区中的推荐和评论数据的, 探究网络学术社区中的学科间交互。【方法】利用社会网络分析方法, 对科学网博客2013全年数据进行学科推荐网络和学科评论网络的整体网络、局部网络、个体网络分析。【结果】交互方式上, 推荐行为比评论行为更为频繁; 交互网络的中心性上, 学科推荐矩阵和学科评论矩阵在点入中心性、点出中心性和内接近中心性上呈显著差异, 而在中间中心性和外接近中心性上无显著差异; 交互参数相关性上, 学科推荐数与学科推荐网络参数的相关性和学科评论数与学科评论网络参数的相关性表现一致。【局限】部分中心性较高的学科节点与其他学科之间的交互缺少深层次解读。【结论】学术博客具有承载不同学科学者之间的低门槛、多元化、大跨度交流的特点。

    参考文献 | 相关文章 | 多维度评价
    学术博客共推荐关系及核心结构特性研究——以科学网博客为例
    谭旻, 许鑫, 赵星
    现代图书情报技术. 2015, 31 (7-8): 24-30.   DOI: 10.11925/infotech.1003-3513.2015.07.04
    摘要   HTML   PDF (4467KB)

    目的】讨论共推荐这一结合信息推荐与信息共现的信息行为概念。【方法】以学术博客为考察场景, 科学网博客为应用实例, 利用网络分析方法探索性地研究共推荐关系在学术博客中的实证特性。【结果】实证结果显示, 相对于其他类型网络, 科学网博客中的共推荐关系具有高聚集性、行为活跃、强度均衡等结构特点; 在核心-边缘结构的分析中, 网络以节点群体作为网络核心; 在核心节点群体内部, 节点之间体现一定的均衡性。【局限】共推荐行为在不同应用领域中有不同动机和功用, 本文仅基于科学网学术博客社区进行实证。【结论】学术博客研究中, 共推荐关系可作为一种新的行为研究视角, 其在核心结构上体现出更为平等的特性。

    参考文献 | 相关文章 | 多维度评价
    学术博客推荐网络的h度实证——以科学网博客为例
    谭旻, 许鑫
    现代图书情报技术. 2015, 31 (7-8): 31-36.   DOI: 10.11925/infotech.1003-3513.2015.07.05
    摘要   HTML   PDF (1315KB)

    目的】研究h度这一新型带权信息网络分析框架在学术博客推荐网络中的特性。【方法】以科学网博客2013年数据为基础, 构建学术博客推荐网络, 计算h度等相关参数, 并辅以信息可视化进行讨论。【结果】学术博客推荐网络中, 高h度节点的产生可由信息源(博主)所持有的学术知识内涵导致, 也可因信息源提供话题的兴趣外延引发; h度(hA)与节点带权度(NA)之间存在形如NA=b×hA2的近似函数关系; 高h度节点通常成为网络中心部分的局部子群组织者。【局限】h度并非完美指标, 后续研究可试用改进型h度进行拓展。【结论】h度可作为学术博客推荐网络分析的测度工具之一, 对于此类社群的管理可从高h度节点入手。

    参考文献 | 相关文章 | 多维度评价
    综述评介
    关系数据库中实体解析研究综述
    高广尚, 张智雄
    现代图书情报技术. 2015, 31 (7-8): 37-47.   DOI: 10.11925/infotech.1003-3513.2015.07.06
    摘要   HTML   PDF (515KB)

    目的】分析关系数据库中实体解析技术的研究现状和未来研究方向。【方法】从实体解析的精度和效率两方面展开系统研究。精度方面基于增量式、统计方法和相关信息; 效率方面基于分块、字符串相似和其他方法。【结果】最大化实体解析精度和解析效率是实体解析技术研究的主要目标, 但在数据源的动态演化、异构性和非精确字符串匹配等方面的研究仍面临重大挑战。【局限】仅从实体解析过程中的精度和效率方面进行探讨, 对解析模型本身的特点和局限性关注不足。【结论】本研究有助于更全面了解关系数据库中实体解析的过程、研究现状和未来研究方向。

    参考文献 | 相关文章 | 多维度评价
    研究论文
    e-Science环境下科学数据语义组织模型框架研究
    马雨萌, 郭进京, 王昉
    现代图书情报技术. 2015, 31 (7-8): 48-57.   DOI: 10.11925/infotech.1003-3513.2015.07.07
    摘要   HTML   PDF (1133KB)

    目的】构建e-Science环境下组织和描述科学数据的通用语义模型, 为机构知识库等仓储的语义计算环境建设提供科学数据组织管理的语义层。【方法】调研分析科学数据组织模式需要考虑的因素, 通过概念分析和本体建模, 构建科学数据的语义组织框架以及各组成部分的本体模型, 设计基于模型的知识服务原型系统, 并对模型的部分应用进行实验。【结果】模型在支持科学数据的语义化关联组织方面获得较为理想的应用效果。【局限】模型的语义支撑效果还需基于其他模块的应用实验进一步验证。【结论】采用本体模型能够实现科学数据的语义化揭示和组织, 为知识服务平台的资源建设和服务提供语义化知识组织的基础。

    参考文献 | 相关文章 | 多维度评价
    基于知网的甲骨卜辞释义问题的可拓性研究
    高峰, 熊晶, 刘永革
    现代图书情报技术. 2015, 31 (7-8): 58-64.   DOI: 10.11925/infotech.1003-3513.2015.07.08
    摘要   HTML   PDF (796KB)

    目的】构建可拓的甲骨文语言模型并结合甲骨文知网知识库解决甲骨卜辞释义问题。【方法】借鉴知网的构建体系, 建立一个融合甲骨文、现代汉语的语义知识库, 对甲骨卜辞进行可拓语言建模, 结合知网的知识表示, 进行语义相似度计算和对应的可拓策略应用。【结果】实验结果表明, 该方法在甲骨卜辞的词义识别准确率可达到90%以上, 在甲骨卜辞的残辞语义推导上准确率可达75%以上, 能够有效解决甲骨卜辞释义问题。【局限】甲骨文知网的构建规模较小及可拓策略的成熟度不高制约着甲骨卜辞语义信息的自动理解。【结论】结合甲骨文可拓语言模型和甲骨文知网进行甲骨文信息处理研究, 为甲骨字的语义推导和残缺甲骨拓片的文本内容整合提供新的解决方案。

    参考文献 | 相关文章 | 多维度评价
    突发事件网络舆情中网民群体行为演化的Agent建模与仿真研究
    吴鹏, 杨爽, 张晶晶, 高庆宁
    现代图书情报技术. 2015, 31 (7-8): 65-72.   DOI: 10.11925/infotech.1003-3513.2015.07.09
    摘要   HTML   PDF (1164KB)

    目的】发现突发事件网络舆情演变过程中的网民群体行为模型、路径、规则以及与突发事件网络舆情演变的关系。【方法】基于Agent建模技术, 对突发事件中网络舆情演变过程中网民群体行为进行建模与仿真, 包括概念模型、Agent属性、交互规则、博弈规则的设计, 并基于NetLogo进行仿真与预测。【结果】结合典型突发事件网络舆情案例进行实证研究, 验证本文提出的Agent模型的科学性。【局限】本文提出的交互规则、博弈规则需要更多同类事件的对比和优化。【结论】基于Agent的建模方法能够综合现实情境和网民群体的行为, 进行突发事件网络舆情演变的建模、仿真, 揭示突发事件网络舆情演变的规律。

    参考文献 | 相关文章 | 多维度评价
    移动阅读应用的用户体验比较研究
    吴丹, 冉爱华
    现代图书情报技术. 2015, 31 (7-8): 73-79.   DOI: 10.11925/infotech.1003-3513.2015.07.10
    摘要   HTML   PDF (580KB)

    目的】研究比较典型移动阅读应用(掌阅iReader、多看阅读和亚马逊Kindle阅读软件)的用户体验差异, 并为移动阅读应用改善用户体验提出建议。【方法】设计移动阅读应用的评价指标和用户实验, 让用户完成指定的阅读任务后对三个不同移动阅读应用进行评分, 并利用统计方法对实验数据进行分析。【结果】多看阅读在界面布局、试读体验、阅读功能、社交性、友好易用、设计美观、实用性、必备性和整体体验这9个指标上的评价优于掌阅iReader和Kindle阅读软件, 掌阅iReader在安装过程、个人中心、响应速度和付费体验这4个指标上的评价最好, Kindle阅读软件则在资源内容质量这一指标上评价上最好。【局限】参与实验的用户数量和类型不够丰富。【结论】从用户评价的结果来看, 多看阅读的用户体验最好。移动阅读应用需要细化用户分类、深化个性化推荐, 坚持"内容为王"、深入挖掘用户需求, 并提升美学设计。

    参考文献 | 相关文章 | 多维度评价
    基于搜索日志的用户行为分析
    童国平, 孙建军
    现代图书情报技术. 2015, 31 (7-8): 80-88.   DOI: 10.11925/infotech.1003-3513.2015.07.11
    摘要   HTML   PDF (3069KB)

    目的】利用搜索引擎日志数据对用户查询行为特征进行分析。【方法】采用分词、统计分析、聚类分析、可视化等方法, 分别从用户的查询串、查询方式、查询主题、查询点击行为和用户类型5个方面对用户使用搜索引擎时的行为特征进行分析。【结果】发现搜索用户偏好使用2-5个中文名词短语组成的查询串; 更少使用口语化查询, 不爱使用高级检索功能; 查询用词变得多样化; 查询时间存在高峰低谷; 再次证实存在"翘尾现象"。【局限】使用的数据量不够大, 没有结合用户详细信息进行分析。【结论】使用搜索引擎日志可以获得用户行为特征, 并能为改善搜索引擎提供一些建议。

    参考文献 | 相关文章 | 多维度评价
    科研项目布局差异对比方法研究——以NSF和EUFP项目为例
    陈挺, 韩涛, 李泽霞, 李国鹏, 王小梅
    现代图书情报技术. 2015, 31 (7-8): 89-96.   DOI: 10.11925/infotech.1003-3513.2015.07.12
    摘要   HTML   PDF (1264KB)

    目的】弥补目前科研项目布局分析往往局限在单一资助机构简单数量统计上的不足, 从内容上提高资助机构布局差异的揭示能力。【方法】针对多源项目数据, 提出一种基于文本K-means++聚类算法的分析方法, 尝试从科研项目内容揭示不同资助机构的资助方向和布局重点, 分析比较各资助机构在研究方向上的资助差异。【结果】使用美国NSF与欧盟FP资助的项目信息进行方法验证与案例分析, 发现相对于多个关键词, 基于单个关键词构建的文本特征空间有更好的聚类效果。进一步去除项目申请书摘要中项目背景、未来影响等干扰信息, 只保留研究内容、研究方法等实质性研究描述文本, K-means++算法的聚类效果有进一步提升。【局限】数据清洗尚不能完全自动实现, 聚类参数的预设与调整也需人工参与。【结论】实验与案例证明该方法是可行的, 分析结果能够比较直观地反映资助机构的布局差异, 对科研管理与决策者审视宏观科研布局、前瞻科技发展方向起到一定的辅助作用。

    参考文献 | 相关文章 | 多维度评价
    利用类别引导词的投诉文本分类
    胡菊香, 吕学强, 刘克会
    现代图书情报技术. 2015, 31 (7-8): 97-103.   DOI: 10.11925/infotech.1003-3513.2015.07.13
    摘要   HTML   PDF (3159KB)

    目的】针对投诉事件文本具有信息量大、非结构化、规律性不强等特点, 当前城市投诉信息管理亟需寻找一种高效的分类方法, 提高管理人员的工作效率。【方法】分析投诉事件特点进而对其进行文本预处理; 借助句法分析器、同义词林, 并通过文档贡献度过滤引导词; 采用TF-IDF计算引导词权重系数, 并以VSM表示, 最后通过SVM对处理后的投诉事件文本进行分类。【结果】在多个类别投诉事件测试文本中, 该方法查准率和查全率平均值达到82.1%和82.3%。【局限】投诉事件文本的稀疏性在一定程度上影响分类结果。【结论】实验证明该方法在投诉事件文本分类中是有效的、可行的, 能够提高投诉文本分类效果。

    参考文献 | 相关文章 | 多维度评价
    面向主题的高质量评论挖掘模型研究
    唐晓波, 邱鑫
    现代图书情报技术. 2015, 31 (7-8): 104-112.   DOI: 10.11925/infotech.1003-3513.2015.07.14
    摘要   HTML   PDF (6034KB)

    目的】帮助消费者从海量的评论集合中识别高质量评论。【方法】利用LDA主题模型对消费者关注的主题进行分类, 借鉴改进的自动摘要的思想, 追踪评论主题下的高质量评论, 提出面向主题的高质量评论挖掘模型。【结果】自动提炼出每个主题下的高质量评论, 其准确率、召回率和F1值分别为80.73%、64.90%和71.95%, 并通过实证研究证明该模型的有效性和优越性。【局限】仅与部分典型模型作对比, 其他模型方法还未进行验证。【结论】该模型能从评论集中有效地挖掘出不同主题下的高质量评论, 从而能够更加高效地辅助消费者进行购买决策。

    参考文献 | 相关文章 | 多维度评价
    面向评论效用评估的文本情感特征提取
    聂卉, 容哲
    现代图书情报技术. 2015, 31 (7-8): 113-121.   DOI: 10.11925/infotech.1003-3513.2015.07.15
    摘要   HTML   PDF (673KB)

    目的】探测情感词典匹配方法以及机器学习方法抽取的情感特征对评论效用的预测作用。【方法】采用情感词典匹配法和机器学习分类法抽取评论情感特征。针对语料构建情感词典, 设计合理匹配算法, 探测最佳情感分类模型, 采用随机森林算法取不同情感特征组合对评论效用价值进行预测。【结果】结合两种情感分析方法对评论效用预测效果最好。其中情感词典匹配方法所得的评论情感均值和评论情感波动能有效识别评论效用, 效果优于机器学习方法。【局限】只针对搜索型商品的评论数据, 缺乏对体验型商品评论的相应分析, 研究数据的覆盖面存在局限。【结论】情感词典匹配法结合机器学习法能有效识别评论效用。

    参考文献 | 相关文章 | 多维度评价
    e-BRM:面向电子易货的多维信誉模型
    李聪, 马丽
    现代图书情报技术. 2015, 31 (7-8): 122-130.   DOI: 10.11925/infotech.1003-3513.2015.07.16
    摘要   HTML   PDF (916KB)

    目的】针对电子易货(e-Barter)这一新兴C2C在线交易模式, 提出优于其现有(1, 0, -1)评分制的多维信誉模型e-BRM。【方法】e-BRM基于Wilson评分区间计算易货者好评率, 基于等概率分布计算易货者好评覆盖率, 并通过时效衰减因子、差评惩罚因子、实名认证因子等指标实现对易货者交易值的聚合处理。【结果】e-BRM最终将得到的三元组 < 好评率, 覆盖率, 交易值 > 聚合为统一的易货者信誉度, 较(1, 0, -1)评分制更能表征易货者真实信誉水平。【局限】在实际应用e-BRM时, 可单独设计模型的在线增量更新机制以改善实时性。【结论】仿真实验结果能够证明e-BRM模型的有效性, 电子易货交易双方可据此做出合理交易决策以降低交易风险。

    参考文献 | 相关文章 | 多维度评价
    应用论文
    基于专利数据仓库的技术功效图挖掘方法研究——以3D打印技术为例
    翟东升, 蔡力伟, 张杰, 冯秀珍
    现代图书情报技术. 2015, 31 (7-8): 131-138.   DOI: 10.11925/infotech.1003-3513.2015.07.17
    摘要   HTML   PDF (762KB)

    目的】实现技术功效图微观钻取分析与技术功效图所涉及的具体专利识别。【方法】提出基于专利数据仓库的技术功效图挖掘方法, 通过清洗专利结构化信息与抽取非结构化信息特征词, 结合数据仓库技术, 实现技术功效图的构建与多维分析。【结果】实验结果证明, 该方法能快速实现技术功效图微观钻取分析及所涉及专利的识别。【局限】采用星型模型, 在专利数据量较大时会降低运行效率; 专利特征词抽取未实现完全自动化。【结论】本文提出的方法, 能够为技术功效图的构建与挖掘提供一种新的思路。

    参考文献 | 相关文章 | 多维度评价
    轻量级书目本体关联数据建设实践
    郭振英, 赵文兵, 魏育辉
    现代图书情报技术. 2015, 31 (7-8): 139-143.   DOI: 10.11925/infotech.1003-3513.2015.07.18
    摘要   HTML   PDF (615KB)

    目的】高校图书馆馆藏书目本体关联数据库建设实践探索。【应用背景】以高校馆藏书目数据为基础, 进行关联数据发布和知识发现的尝试。【方法】从用户认知的角度出发, 研究相关书目本体的标准, 扩展社会网络元数据, 构建实用可操作的轻量级书目本体, 重新组织书目数据, 通过D2R工具发布为关联数据。【结果】以计算机学科实际馆藏数据进行书目关联数据化实验, 可以实现版本、语种、主题等元素的内部聚合及基于著者构建链接的外部发现。【结论】基于轻量级书目本体进行关联数据建设是可行、可操作的, 但书目规范缺失的实际状况导致聚合链接实现困难。

    参考文献 | 相关文章 | 多维度评价
    微信二维码用于图书馆读者身份认证的实践
    郭利敏, 刘悦如, 相明琼
    现代图书情报技术. 2015, 31 (7-8): 144-147.   DOI: 10.11925/infotech.1003-3513.2015.07.19
    摘要   HTML   PDF (830KB)

    目的】尝试将上海图书馆的"我的图书馆"系统与第三方平台(微信平台)进行整合, 利用微信二维码扫描功能优化读者登录操作, 以提高图书馆信息化服务水平。【应用背景】随着HTTP长连接技术的广泛应用, 微信、QQ、新浪微博等推出二维码登录服务。【方法】利用微信二维码结合HTTP长连接技术实现微信系统与"我的图书馆"系统间的交叉认证, 以实现二维码扫描登录"我的图书馆"系统。【结果】将二维码与认证系统相结合, 使读者可以通过扫描二维码的形式登录系统。【结论】为读者提供新的登录渠道, 方便读者使用, 同时进一步扩展二维码在图书馆的应用范围。

    参考文献 | 相关文章 | 多维度评价
    Drupal数据采集在构建特色数字资源中的实践
    李丹, 闫晓弟, 魏青山
    现代图书情报技术. 2015, 31 (7-8): 148-154.   DOI: 10.11925/infotech.1003-3513.2015.07.20
    摘要   HTML   PDF (1220KB)

    目的】解决特色数据库建设过程中数据抓取困难、多类型数字资源难以整合等问题。【应用背景】特色资源信息生命短暂, 陕西省已建特色库平台差异较大, 支持RSS接口有限, 数据格式复杂。【方法】利用Drupal Feeds, XPath Parser, Crawls, Image Grabber等Web数据采集技术, 结合数据清洗、剔除手段, 实现Web数据采集的系统化和专业化。【结果】对Feeds RSS 采集, HTML/XML网页分析自动采集, 特别是数据采集中需要针对不同特色资源修改规则及采集网页中流媒体等问题进行探讨。【结论】丰富陕西省特色数字资源平台的数据来源, 部分解决数据采集困难、数据格式不规范、数据来源途径有限的问题。

    参考文献 | 相关文章 | 多维度评价
    图书馆微信座位预约应用开发——以西北民族大学为例
    周瑶, 刘畅, 李建东
    现代图书情报技术. 2015, 31 (7-8): 155-159.   DOI: 10.11925/infotech.1003-3513.2015.07.21
    摘要   HTML   PDF (3393KB)

    目的】利用微信公众平台设计一款座位预约系统软件, 扩展传统座位预约系统功能。【应用背景】传统座位预约系统缺乏在移动平台领域的应用, 而微信是目前移动终端的主要应用入口, 拥有大量使用人群, 适用于新型座位预约系统。【方法】采用ASP.NET技术开发平台, 结合HTML5、CSS3、AJAX等技术进行前台设计, 利用微信公众平台消息回复接口, 将座位预约系统的基本功能嵌入到微信平台中。【结果】用户可通过微信客户端查询自习室座位使用情况, 搜索好友座位位置, 预约座位等功能。【结论】本应用探索了在移动平台上的开发模式, 对此类微信公众号的开发具有一定借鉴意义。

    参考文献 | 相关文章 | 多维度评价
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn