%A 张李义, 张皎 %T 一种基于主成分分析和随机森林的刷客识别方法 %0 Journal Article %D 2015 %J 数据分析与知识发现 %R 10.11925/infotech.1003-3513.2015.10.09 %P 65-71 %V 31 %N 10 %U {https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/abstract/article_4144.shtml} %8 2015-10-25 %X

[目的] 针对刷客识别的指标维数较高, 识别的准确率和效率较低的问题, 提出新的识别模型, 提高刷客的识别准确率和效率。[方法] 采用主成分分析法对用户指标进行降维, 并运用随机森林算法识别刷客。为了反映该模型在刷客识别方面的优越性, 分别建立基于K近邻判断分析、支持向量机理论的识别模型, 用相同的数据针对不同模型进行训练, 比较不同模型的识别分类准确率和效率。[结果] 实验结果表明, 基于主成分分析和随机森林理论的刷客识别模型识别的准确率为88.0%, 识别时间为3分钟。[局限] 刷客数据主要来源于第三方刷单平台, 不能全面反映所有刷客类型。[结论] 基于主成分分析和随机森林的刷客识别模型对刷客识别具有较高的准确率和较优的效率, 可以为电子商务平台识别刷单交易提供参考。