期刊首页 当期目录

2017年, 第1卷, 第5期 
刊出日期:2017-05-25
  

  • 全选
    |
    专题
  • 吴丹
    数据分析与知识发现. 2017, 1(5): 1-1. https://doi.org/10.11925/infotech.2096-3467.2017.05.01
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
  • 吴丹, 李翼, 董晶
    数据分析与知识发现. 2017, 1(5): 2-11. https://doi.org/10.11925/infotech.2096-3467.2017.05.02
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】研究有无时间限制如何影响用户的步行导航行为和交互体验。【方法】采用用户实验法, 招募20名大学生并随机分成两组(时间限制组和非时间限制组)参与户外导航实验, 并完成两个不同类型的导航任务: 室外导航和室内导航任务。【结果】实验结果发现, 时间限制会产生时间压力, 但是对产生的时间压力的强度并没有显著性的影响; 当用户既不知道自己要去某地且不知某地的具体位置时, 时间限制对用户的任务完成时长、文本页面的停留时长和滑动次数有显著性影响; 当用户寻找一个不知道具体位置的地点时, 时间限制对用户的导航行为没有显著性影响; 室内导航中, 时间限制对用户的缩放次数和上滑次数有显著性影响。【局限】实验用户规模较小。【结论】时间限制影响用户的导航行为, 当时间限制时, 用户会通过减少屏幕操作次数从而加快到达目的地。

  • 吴丹, 程磊
    数据分析与知识发现. 2017, 1(5): 12-22. https://doi.org/10.11925/infotech.2096-3467.2017.05.03
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】分析不同情境因素对用户步行路线规划的影响, 构建用户路线规划的情境模型。【方法】邀请30名用户完成室外步行导航实验, 对用户路线规划的情境和行为进行Spearman相关性分析和多元线性回归分析。【结果】初始规划阶段, 目的地选择次数越多, 用户搜索时长越长; 对估计时间在意程度越高, 对路线的浏览时长越长。重新规划阶段, 不同性别和年龄的用户其主观时间压力不同; 任务困难度越高时其操作次数反而会减少。【局限】数据处理存在一定的主观性; 实验中其他因素给用户的心理和行为产生潜在影响, 可能会对实验结果造成一定的干扰。【结论】步行路线规划情境模型更关注行为因素, 揭示初始路线规划和重新规划路线的各个情境因素的关系, 为移动地图开发者提供参考价值。

  • 吴丹, 陆柳杏
    数据分析与知识发现. 2017, 1(5): 23-31. https://doi.org/10.11925/infotech.2096-3467.2017.05.04
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】研究用户步行导航中的关注点及变化, 检验出声思考法是否适用于研究室外真实环境下的用户信息行为, 并从用户关注点角度出发为移动地图APP提供改进建议。【方法】设计三个室外真实环境下的步行导航实验, 要求用户一边操作一边出声思考。【结果】步行导航中用户对搜索系统的关注多于对外部信息的关注; 在步行导航过程中用户对搜索系统结果显示的关注高, 在步行前、中、后期对外部信息的主要关注呈现出“环境状况-位置-目的地情况”的变化。【局限】手工将数据按照三个时间段划分, 存在不可避免的误差。【结论】出声思考法适用于室外真实环境下的用户交互研究; 从用户关注的外部信息和搜索系统本身出发来优化地图功能, 可以给予用户更好的用户体验。

  • 吴丹, 袁方
    数据分析与知识发现. 2017, 1(5): 32-41. https://doi.org/10.11925/infotech.2096-3467.2017.05.05
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】分析定位准确度不一样的情况下用户分心的情况, 并提出有效减少用户分心的建议与策略。【方法】采用基于真实场景的模拟实验方式, 通过设置对照组, 使用描述性统计方法和差异性检验来分析和比较在是否开启GPS定位的两种情况下, 用户分心次数和时长的情况。【结果】研究结果表明, 开启GPS定位的情况下, 用户对地图路线依赖度会明显增加, 导致用户更加关注GPS定位点的指向, 增加用户中途停留行为, 但是会减少操作地图的行为。【局限】实验设计中无法排除实验者个体因素对实验结果的影响, 并且可参考的理论依据较少。【结论】步行导航中出现分心会增加步行时长, 降低满意度, 增加错误率。为了减少用户分心, 不仅用户需要减少对手机地图规划的路线的依赖度, 地图导航系统应该提供具体化、全面化导航信息。

  • 吴丹, 刘畅, 李翼
    数据分析与知识发现. 2017, 1(5): 42-51. https://doi.org/10.11925/infotech.2096-3467.2017.05.06
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】优化用户体验, 提高用户对导航系统的持续使用性。【方法】采用用户实验和基于情感词典的情感分析方法, 使用程度副词系数量、中文情感词汇本体、极性短语的强度计算公式等对情感短语进行量化, 分析影响情感的因素及其变化规律。【结果】用户在步行导航过程中的情感变化主要受到系统因素和环境因素的影响, 系统更新的不及时、定位不准、环境恶劣均会对用户的情感造成影响。【局限】情感是一个复杂而且涵盖广泛的概念, 仅通过文本分析可能存在不足。【结论】通过改进系统本身和增添人性化的设置提高用户对导航系统的持续使用性, 为系统未来的升级提供有效参考。

  • 研究论文
  • 张肃
    数据分析与知识发现. 2017, 1(5): 52-61. https://doi.org/10.11925/infotech.2096-3467.2017.05.07
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】信息消费已成为日益增长的消费热点, 为了促进城镇居民的信息消费水平, 对其影响因素进行研究。【方法】分析中国城镇居民信息消费的发展状况及空间相关性, 以及当期信息消费会受到的三种内、外部影响, 构建相应的理论模型, 进一步基于动态空间杜宾模型进行实证研究。【结果】当期信息消费支出对相邻地区并没有产生空间溢出效应, 信息消费表现出耐用性特征, 而居民信息消费会受相邻地区居民信息消费习惯的影响; 影响因素中物价和收入的提升, 短期内会促使本地居民信息消费支出增加; 而受教育水平和信息基础设施水平的提升, 短期内会对相邻地区产生显著的正向空间溢出效应; 长期效应中, 只有物价和收入对本地居民信息消费支出有影响。【局限】由于数据的可获得性, 选用物价指数、受教育水平、信息基础设施、网民人数、收入等5个因素进行分析, 未考虑的因素可能会对分析结果产生影响。【结论】在研究居民消费的影响因素时, 必须考虑空间效应的各种影响, 否则估计结果可能是有偏的。

  • 王晓玉, 李斌
    数据分析与知识发现. 2017, 1(5): 62-70. https://doi.org/10.11925/infotech.2096-3467.2017.05.08
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】验证中古时期分词一致性和语料类别对CRFs分词效率的影响, 在此基础上进一步提高分词效率, 降低人工校对的工作量。【方法】以中古时期的史书、佛经、小说类语料为例, 针对中古汉语的自动分词问题, 优化分词原则, 运用CRFs模型和词典相结合的方法, 消除中古汉语人工分词结果中易出现的分词不一致问题; 同时在CRFs分词中引入字符分类、字典信息两种特征, 并通过对比实验选取每种特征最合适的分词模板。【结果】实验结果显示, 分词结果的总F值在封闭测试中达到99%以上, 开放测试的综合测试中也达到89%-95%。【局限】分词不一致研究主要针对双字词, 因此三字以上词语(多字词)的识别效果稍有欠缺。【结论】在有效提高分词一致性的前提下, 字符分类、词典标记特征能够有效提高中古汉语CRFs分词的精确度。同时本文提出的中古汉语分词系统可以服务于中古时期多类别的汉语语料。

  • 张庆庆, 刘西林
    数据分析与知识发现. 2017, 1(5): 71-81. https://doi.org/10.11925/infotech.2096-3467.2017.05.09
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】针对基于机器学习的文本情感分类研究中的文本特征表示向量高维性问题, 提出BPSO与随机子空间方法结合的选择性集成算法。【方法】在分析BPSO与随机子空间原理的基础上给出BPSO随机子空间的模型框架及算法流程。将中文评论语料进行特征化表示后, 使用BPSO随机子空间进行实验验证和分析。【结果】通过改变随机子空间中子空间率的取值, 研究标准随机子空间与BPSO随机子空间选择性集成对分类准确率和系统差异度的影响, 结果表明BPSO随机子空间无论在分类准确率还是在系统差异度上均高于标准随机子空间。【局限】尚未在英文数据上进行验证。【结论】将BPSO应用于随机子空间方法构成一种新颖的选择性集成模型, 不仅解决了特征向量空间高维性的问题, 而且提高了分类的准确率和泛化能力, 为中文文本情感分类提供了有效的方法。

  • 夏立新, 杨金庆, 程秀峰
    数据分析与知识发现. 2017, 1(5): 82-93. https://doi.org/10.11925/infotech.2096-3467.2017.05.10
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】为移动环境下数据采集与分析提供一种基于情境感知技术(Context Awareness)的设计框架, 以优化移动数据自动化采集过程。【应用背景】尽管基于移动端的情景感知数据采集较之传统网络环境下的人工与半自动方式有所发展, 但利用移动端底层传感器直接获取实时用户信息, 实现实时、动态、全面的数据采集与挖掘进而达到主动提供服务的目的, 这方面的应用仍处于发展阶段。【方法】利用Android自带的众多传感器, 设计了客户端自动采集、服务器主动接收的数据采集框架。在实证与评价方面, 设计了一个通过动态情境感知推荐高层服务的实例。【结果】实证结果表明: 该系统能够针对某一情境采集移动用户数据, 为高层推荐服务提供良好支持。【局限】采集到的数据具有较大的冗余度, 未进行多角度、全面、深度的情境推理, 需要在以后的研究中针对用户数据进行深入分析。【结论】基于情境感知的移动数据自动采集系统能够进行移动数据的主动采集, 并依据采集结果对个体或群体进行推送服务, 对移动环境下用户行为研究与情境计算研究都起到较好的支撑作用。

  • 陈梅梅, 薛康杰
    数据分析与知识发现. 2017, 1(5): 94-101. https://doi.org/10.11925/infotech.2096-3467.2017.05.11
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】在基于多构面信任关系的个性化推荐中, 解决构面难以定义以及传统信任强度计算方法的局限所导致的推荐准确性低的问题。【方法】提出一种基于标签簇的多构面信任关系定义的方法, 在标签聚类得到的标签簇基础上, 引用TF-IDF思想及Pearson相似度定义簇间和簇内信任关系, 构建有利于反映不同构面信任强度的信任张量, 并融入基于张量分解模型的个性化推荐算法中。【结果】基于Last.fm数据集的仿真实验表明: 从准确率、召回率和F1值各项指标上, 本文提出的个性化推荐算法均有良好表现, 在F1值上平均提升达2.29%。【局限】仿真实验未针对其他领域的数据集进行进一步验证, 如微博、Twitter等。【结论】基于标签簇多构面信任关系的个性化推荐算法通过有效定义并全面、客观地量化用户间信任关系, 从而实现推荐准确性的提高, 有利于社交网络环境下提供更令用户满意的资源。