%A 钱晓东, 李敏 %T 基于复杂网络重叠社区的电子商务用户复合类型识别* %0 Journal Article %D 2018 %J 数据分析与知识发现 %R 10.11925/infotech.2096-3467.2018.0101 %P 79-91 %V 2 %N 6 %U {https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/abstract/article_4521.shtml} %8 2018-06-25 %X

目的】由用户特征的多样性可知, 用户往往是多重角色的混合体, 而已有研究很少涉及用户复合类型, 这不利于电子商务运营商全面地了解客户。本文提出一种电子商务用户复合类型的识别算法, 为运营商的个性化营销提供数量化依据。【方法】基于用户访问序列的特点构建节点距离矩阵; 从重定义匹配数、编辑代价和编辑规则等方面改进Jaro-Winkler Distance算法, 计算用户访问序列距离矩阵; 以距离矩阵为基础, 区分中心用户和非中心用户, 并构建用于用户复合类型识别的复杂网络; 从改进初始模块度增量矩阵等方面改进CNM算法, 获得用户类型初始划分; 再利用模糊隶属函数进行用户优化, 最终得到电子商务用户复合类型。【结果】以CONGA算法作为比较基准, 首先采用LFR基准程序生成的网络测试本文算法性能, 计算结果表明本文算法的NMI值较基准算法最高提高了15.60%; 再利用用户真实在线数据进行算法应用, 计算结果表明本文算法的整体聚类系数值较基准算法最高提高了10.87%; 且算法的时间复杂度低于基准算法。【局限】本文算法需要主观设定三个参数。【结论】用户网络符合小世界模型特性, 具有复杂网络的典型形态; 利用本文算法可以有效识别电子商务用户复合类型。