期刊首页 当期目录

2018年, 第2卷, 第2期 
刊出日期:2018-02-25
  

  • 全选
    |
    专题
  • 王曰芬
    数据分析与知识发现. 2018, 2(2): 1-1.
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏
  • 王曰芬, 傅柱, 吴鹏
    数据分析与知识发现. 2018, 2(2): 2-10. https://doi.org/10.11925/infotech.2096-3467.2017.0896
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】为提升概念设计的质量和效率, 研究概念设计中基于知识流的语义化知识管理技术框架。【方法】在现有设计知识管理研究的基础上, 针对概念设计环节引入知识流理论; 从知识管理过程和概念设计过程两个视角对概念设计知识管理中的知识流进行简要分析和建模, 结合知识管理和现代设计两个领域中的知识流理论, 对两个过程进行连接和集成, 形成基于知识流的语义化知识管理技术框架, 并进一步分析技术框架的需求、组成、功能等内容。【结果】从知识管理过程视角出发, 提出知识管理过程中的知识流参考模型; 从概念设计过程视角出发, 提出基于角色模型的工作流和知识流整合模型; 从技术框架中知识的流动角度, 提出基于知识流的语义化知识管理技术框架模型; 从技术框架的层次结构角度, 提出基于层次结构的语义化知识管理技术框架模型。【局限】从宏观角度对该技术框架进行研究, 但未能细化框架的各部分内容。【结论】技术框架能够系统地揭示现代设计知识管理技术的内涵和机理, 为后续概念设计知识管理技术及其应用研究提供参考和借鉴。

  • 丁晟春, 刘梦露, 傅柱
    数据分析与知识发现. 2018, 2(2): 11-19. https://doi.org/10.11925/infotech.2096-3467.2017.0905
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】为实现概念设计知识的有效管理和重用, 研究概念设计中的多维设计知识统一建模技术。【方法】从知识管理和知识重用两个方面分析多维设计知识的统一建模需求; 基于知识流理论, 从设计过程和知识属性两个角度对概念设计知识进行分类和定义; 以静态设计对象和动态设计流程为核心, 构建多维设计知识统一建模体系; 借助本体模型实现概念设计中多维设计知识的统一建模。【结果】将概念设计知识分为设计对象、设计流程、设计组织、设计资源、设计准则、设计案例6类; 以设计对象和设计流程为核心, 提出对象-流程双核知识驱动的多维设计知识统一建模体系; 构建对象-流程双核知识本体模型, 进而对设计组织、设计资源、设计准则、设计案例4类知识进行建模和组织。【局限】未对统一建模技术进行进一步验证。【结论】所提出的统一建模技术能够从动态性角度对概念设计知识进行全面、有效的建模。

  • 傅柱, 姜宇星, 王曰芬
    数据分析与知识发现. 2018, 2(2): 20-28. https://doi.org/10.11925/infotech.2096-3467.2017.0906
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】为实现概念设计过程中动态设计知识的有效管理和重用, 研究概念设计过程知识的语义建模技术。【方法】从知识管理和知识重用两个角度分析设计过程知识语义建模需求, 集成模板技术和组件技术, 借助语义化方法构建设计过程知识语义建模技术体系; 以技术体系为指导和支撑, 实现设计过程中设计流程知识的语义建模, 并进一步对设计流和知识流进行集成建模。【结果】提出可配置流程模板和可配置知识组件相结合的双层模块化封装技术, 基于该技术构建设计过程知识语义建模技术体系; 利用可配置流程模板实现设计流程知识进行语义建模, 利用可配置知识组件实现设计流和知识流进行集成建模。【局限】未进行实例分析和验证。【结论】所构建的设计过程知识语义建模体系能够对概念设计过程中的动态设计知识进行有效建模。

  • 羊柳, 傅柱, 王曰芬
    数据分析与知识发现. 2018, 2(2): 29-36. https://doi.org/10.11925/infotech.2096-3467.2017.0897
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】探究概念设计过程知识的获取方法, 为设计过程知识的模块化建模和表示提供知识素材, 进而实现动态设计过程知识的管理和重用。【方法】从知识内容角度对设计过程知识获取需求进行分析; 结合访谈调查法和研究设计的双层流程获取模板对设计过程知识获取实验进行设计; 采用访谈调查法初步获取组织内隐性的设计过程知识, 利用双层流程获取模板进一步对设计过程知识进行模块化处理。【结果】以某制退机概念设计为例, 采用访谈法获取初始设计过程知识; 利用设计流程获取模板对设计流程知识进行整理和规范, 利用设计步骤获取模板对规范后的设计流程知识进行拆解和封装。【局限】实验开展及结果数据处理都依靠人工方式, 其效率有待提高。【结论】所提出的知识获取方法能够以模块化形式有效地获取概念设计中隐性、动态的设计过程知识。

  • 研究论文
  • 吴江, 贺超城, 龚正
    数据分析与知识发现. 2018, 2(2): 37-45. https://doi.org/10.11925/infotech.2096-3467.2017.0893
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】定量研究组织的中心化水平及其对球队绩效的影响。【方法】以2017年NBA总决赛为例, 人工记录球队的传接球关系并构建网络, 原创地提出加权有向网络熵(Weighted Directed Network Entropy, WDNE)的定义与算法, 分析传接球网络。【结果】WDNE值越大, 网络的去中心化程度越高。当球队传接球网络的WDNE差距较大时, 得分差距也拉大; 反之, 得分差距也小。【局限】人工记录会导致遗漏与偏差, 同时数据量也偏小。【结论】研究发现去中心化水平对球队的绩效、球队网络的鲁棒性、球队凝聚力有积极影响。

  • 张凌, 罗曼曼, 朱礼军
    数据分析与知识发现. 2018, 2(2): 46-57. https://doi.org/10.11925/infotech.2096-3467.2017.0898
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】针对社交网络中的营销信息扩散过程进行分析, 识别最优扩散节点。【方法】以华为Mate 9手机为例, 研究Twitter网络中人们发布、转发、评论等用户关系网络, 对信息扩散过程进行分析与建模。最后通过独立级联模型对网络进行扩散预测, 探索基于不同度量指标选择的初始扩散节点对信息扩散的影响。【结果】仿真结果表明: 基于高入度中心性可激活节点数最多, 激活节点总数达到所有节点的23.54%; 基于高出度中心性节点激活总数非常低, 只能激活不到3%的节点。【局限】独立级联模型的参数设置有进一步优化空间。【结论】企业除了需要关注官方节点外, 提前预知并合理利用“意外”节点对于市场营销人员获取市场反馈具有很强的现实意义。

  • 周倩伊, 王亚民, 王闯
    数据分析与知识发现. 2018, 2(2): 58-63. https://doi.org/10.11925/infotech.2096-3467.2017.0809
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】基于现有的脱敏技术, 改进匿名组的划分效果, 得到较优的脱敏模型及算法。【方法】基于k-匿名技术, 改进维度划分标准, 以KD树作为存储结构, 构造新算法。利用Python实现程序, 比较所产生的匿名组数量、NCP百分比, 验证算法的可行性与有效性。【结果】新算法能够使得脱敏后整个数据集所生成的匿名组个数达到最大。且NCP百分比低于同类算法。【局限】对于有某一属性离散程度显著的数据集, 循环计算划分维度较为繁琐。【结论】新算法相比于传统算法增加了匿名组个数, 相比于同类算法, 信息损失较低。

  • 王璟琦, 李锐, 吴华意
    数据分析与知识发现. 2018, 2(2): 64-73. https://doi.org/10.11925/infotech.2096-3467.2017.0929
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】研究网络舆情话题演化中存在的时空分布规律, 正确把握网络舆情的发展态势。【方法】基于LDA模型提取网络舆情话题并定义话题强度定量测度指标; 基于空间自相关理论分析不同区域话题强度空间分布及其时间变化规律, 并采用Moran’s I统计量对空间聚集性进行度量; 以“旅游”话题为例, 研究网络舆情话题演化的时空规律。【结果】网络舆情话题强度的空间分布具有聚集性, 聚集性随话题强度的升高而增强, 表现为全局Moran’s I统计量随话题强度的升高而升高, 并且存在话题强度的局部热点区域和异常高值与低值。【局限】数据来源较为单一, 研究结果的普适性有待提升。【结论】本文提出的网络舆情话题演化定量分析方法, 可以有效挖掘网络舆情话题演化的时空规律, 为舆情监测预警提供更为科学的决策支持。

  • 刘洪伟, 高鸿铭, 陈丽, 詹明君, 梁周扬
    数据分析与知识发现. 2018, 2(2): 74-85. https://doi.org/10.11925/infotech.2096-3467.2017.0886
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】了解用户在线购物中的兴趣需求变化有利于个性化推荐。本文提出结合用户浏览行为分析的隐式动态兴趣识别和管理模型。【方法】通过三阶段实验构造用户点击流数据, 以天猫和淘宝网页功能键为数据粒度对页面分类, 再采用Bisecting K-means聚类算法进行兴趣状态挖掘, 最后总结归纳兴趣与行为的特征映射。【结果】用户隐式兴趣存在4种状态: 关注、理解信息、态度和购买意图, 在态度和购买意图状态下, 更倾向于产生购买; 在不同状态的浏览路径特征有所差异。【局限】未添加网页广告促销等非结构化数据进行分析。【结论】从实时动态兴趣的角度, 对购物决策中兴趣的状态进行验证挖掘, 拓展动态兴趣研究; 为电商网站管理用户行为提供了一个实现动态个性化推荐的视角。

  • 贾晓婷, 王名扬, 曹宇
    数据分析与知识发现. 2018, 2(2): 86-95. https://doi.org/10.11925/infotech.2096-3467.2017.0626
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】引入深度神经网络模型Doc2Vec, 以综合考察文本的上下文语境信息。结合改进的K-means聚类算法, 实现中文单文档摘要的提取。【方法】利用Doc2Vec模型, 提取语句的语义、语法、语序等特征, 将其转化为固定维度的向量。基于密度最大距离最远原则为K-means聚类算法选取初始聚类中心, 对语句向量进行聚类。在每个类簇内计算句子的信息熵, 提取类内与其他语句均具有较高相似度的句子作为摘要句。【结果】相对于传统的向量化表示方法PLSA, 利用本文方法生成的摘要效果在准确率、召回率、F值上分别提高了9.57%、7.62%、10.30%。【局限】提取的摘要句来源于正文, 而标准摘要是对正文的高度凝练总结, 二者通常难以完全匹配。【结论】实验结果表明, 相对于常见的向量化表示方法, 本文提出的方法能较为显著地提升自动摘要的效果, 对多文档自动摘要的实现提供了一种思路。

  • 倪维健, 孙浩浩, 刘彤, 曾庆田
    数据分析与知识发现. 2018, 2(2): 96-104. https://doi.org/10.11925/infotech.2096-3467.2017.0990
    摘要 ( ) PDF全文 ( ) HTML ( )   可视化   收藏

    目的】对现有中文分词方法在领域文献上的分词结果进行调整, 以提升领域文献上的分词效果。【方法】对传统中文分词方法处理领域文献的不足进行分析, 以此为基础设计一个反映领域文献构词特点的分词指标——词频偏差, 并基于该指标提出一个无监督的分词结果优化方法。【结果】基于农业领域语料开展实验, 结果表明该方法对比ICTCLAS、THULAC和LTP的分词结果F1值提升2%-3%, 并具有实现简单、参数鲁棒性强的特点。【局限】提升召回率方面效果不佳。【结论】基于词频偏差的分词结果优化算法能够有效提升已有分词结果的准确性, 且无需领域词表及人工标注语料, 具有良好的领域适用性。