Please wait a minute...
Advanced Search
现代图书情报技术  2015, Vol. 31 Issue (11): 41-50    DOI: 10.11925/infotech.1003-3513.2015.11.07
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于模板用户信息搜索行为和统计分析的共谋销量欺诈识别
王忠群, 乐元, 修宇, 皇苏斌, 汪千松
安徽工程大学管理工程学院 芜湖 241000
Collusive Sales Fraud Detection Based on Users' Information Search Behavior Template and Statistical Analysis
Wang Zhongqun, Le Yuan, Xiu Yu, Huang Subin, Wang Qiansong
School of Management Engineering, Anhui Polytechnic University, Wuhu 241000, China
全文: PDF(791 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

[目的]针对电子商务推广中出现的共谋虚增销量的欺诈问题, 提出一种基于模板用户信息搜索行为和统计分析的共谋销量识别方法。[方法]为了刻画用户在C2C网站购物时的信息搜索行为, 提出一种带关键字的用户信息搜索行为模型以及信息搜索行为的相似度计算方法; 依据共谋用户信息搜索行为的相似性, 提出一种基于层次聚类的欺诈嫌疑挖掘算法; 给出基于统计分析的欺诈识别方法从欺诈嫌疑中识别共谋买家, 以实现对卖家销售记录中虚增销量的识别。[结果]在改进的数据集上验证该方法的召回率和准确率分别为88.6%和90.1%。[局限]不能动态调整用于识别欺诈嫌疑行为是否为“刷单”的阈值。[结论]该方法可有效识别基于模板用户信息搜索行为的共谋虚增销量。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
Abstract

[Objective] Aiming at collusive sales inflation fraud in e-commerce promotion, this paper presents a collusive product sales fraud detection method based on users' information search behavior.[Methods] Firstly, in order to describe users' information search behavior in online shopping, a model for user information search behavior with keywords and a similarity calculating method for users' information search behavior are proposed. Secondly, a suspicious fraud mining algorithm based on hierarchical clustering algorithm for inflation sales is proposed, which depends on the similarity between users' information search behavior. Finally, this paper proposes a method for detecting suspicious fraud based on statistical analysis, to identify inflating sales in sale record of illegal vendors.[Results] The experimental results show that the recall and precision of the method are 88.6% and 90.1% respectively based on the improved data set.[Limitations] The threshold value predetermined for judging whether the fraudulent behavior is “scalping” behavior is fixed.[Conclusions] The method is effective for the detection of collusive sales inflation fraud based on users' information search behavior template.

收稿日期: 2015-06-04     
:  G202  
基金资助:

本文系国家自然科学基金项目“C2C市场中基于行为树的销量识别与发布研究”(项目编号:71371012)、教育部人文社会科学规划项目“C2C市场中基于参与者行为的‘打榜'识别模型与应用研究”(项目编号:13YJA630098)和安徽省高校省级科学研究项目“C2C市场中基于参与者决策信息搜寻行为的虚假交易早期识别研究”(项目编号:TSKJ2014B10)的研究成果之一。

通讯作者: 王忠群, ORCID: 0000-0002-5307-5706, E-mail: zqwang@ahpu.edu.cn。     E-mail: zqwang@ahpu.edu.cn
作者简介: 作者贡献声明:王忠群: 研究方案设计, 论文最终版本修订; 乐元: 论文撰写, 实验验证;修宇, 皇苏斌, 汪千松: 算法设计, 以及部分实验工作。
引用本文:   
王忠群, 乐元, 修宇, 皇苏斌, 汪千松. 基于模板用户信息搜索行为和统计分析的共谋销量欺诈识别[J]. 现代图书情报技术, 2015, 31(11): 41-50.
Wang Zhongqun, Le Yuan, Xiu Yu, Huang Subin, Wang Qiansong. Collusive Sales Fraud Detection Based on Users' Information Search Behavior Template and Statistical Analysis. New Technology of Library and Information Service, DOI:10.11925/infotech.1003-3513.2015.11.07.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2015.11.07

[1] 中国电子商务研究中心. 2012年(上)中国电子商务用户体验与投诉监测报告[EB/OL]. [2013-06-28]. http://www. 100ec.cn/zt/upload_data/down/yhty.pdf. (China Electronic Commerce Research Center. 2012 (a) Chinese E-commerce User Experience and Complaints Monitoring Reports [EB/OL]. [2013-06-28]. http://www. 100ec.cn/zt/upload_data/ down/yhty.pdf.)
[2] 威客–猪八戒网.需求和任务推广[EB/OL]. [2014-07-26]. http://www.zhubajie.com/wdtg/. (Wik-Zhubajie Website. Needs and Tasks Promotion [EB/OL]. [2014-07-26]. http://www. zhubajie.com/ wdtg/. )
[3] 王烁, 徐健, 刘颖. 网络“水军”探测方法研究[J]. 现代图书情报技术, 2014(7-8): 92-100. (Wang Shuo, Xu Jian, Liu Ying. Research on Online “Water Army” Detection Methods [J]. New Technology of Library and Information Service, 2014(7-8): 92-100.)
[4] Chen C C, Tseng Y. Quality Evaluation of Product Reviews Using an Information Quality Framework [J]. Decision Support Systems, 2011, 50(4): 755-768.
[5] 李霄, 丁晟春. 垃圾商品评论信息的识别研究[J].现代图书情报技术, 2013(1): 63-68. (Li Xiao, Ding Shengchun. Research on Review Spam Recognition [J]. New Technology of Library and Information Service, 2013(1): 63-68.)
[6] 伍之昂, 王有权, 曹杰. 推荐系统托攻击模型与检测技术[J]. 科学通报, 2014, 59(7): 551-560. (Wu Zhiang, Wang Youquan, Cao Jie. A Survey on Attack Models and Detection Techniques for Recommender Systems [J]. Chinese Science Bulletin, 2014, 59(7): 551-560.)
[7] You W J, Liu L, Xia M, Lv C G. Reputation Inflation Detection in a Chinese C2C Market [J]. Electronic Commerce Research and Applications, 2011, 10(5): 510-519.
[8] Chang W. H, Chang J S. An Effective Early Fraud Detection Method for Online Auction [J]. Electronic Commerce Research and Applications, 2012, 11(4): 346-360.
[9] Lian Q, Zhang Z, Yang Mei, et al. An Empirical Study of Collusion Behavior in the Maze P2P File Sharing System [C]. In: Proceedings of the 27th International Conference on Distributed Computing Systems. 2007.
[10] Uyar M, Yildirim S, Gencoglu M T. An Expert System Based on S-transform and Neural Network for Automatic Classification of Power Quality Disturbances [J]. Expert Systems with Applications, 2009, 36: 5962-5975.
[11] 郑华, 吴克文, 朱庆华. 基于神经网络和SNA的C2C电子商务信誉欺诈识别研究[J]. 计算机应用研究, 2011, 28(5): 1883-1885. (Zheng Hua, Wu Kewen, Zhu Qinghua. Detection of C2C Reputation Fraud Activities Based on Neural Network and SNA [J]. Application Research of Computers, 2011, 28(5): 1883-1885.)
[12] 尤薇佳, 刘鲁, 杨俊杰, 等. 基于交易记录的欺诈识别[C]. 见: 第二届网商及电子商务生态学术研讨会论文集. 杭州: 浙江大学出版社, 2009: 178-182. (You Weijia, Liu Lu, Yang Junjie, et al. Fraud Detection Based on Transaction Records [C]. In: Proceedings of the Second Netrepreneurs and E-business Ecosystem Seminar. Hangzhou: Zhejiang University Press, 2009: 178-182.)
[13] Wang J, Chiu C. Detecting Online Auction Inflated-Reputation Behaviors Using Social Network Analysis [C]. In: Poceedings of the 2005 North American Association for Computational Social and Organizational Science.2005.
[14] Zhu H S, Xiong H, Ge Y, et al. Discovery of Ranking Fraud for Mobile Apps [J]. Transactions on Knowledge and Data Engineering, 2015, 27(1): 74-87.
[15] 王实, 高文, 李锦涛, 等. 路径聚类: 在Web站点中的知识发现[J]. 计算机研究与发展, 2001, 38(4): 482-486. (Wang Shi, Gao Wen, Li Jintao, et al. Path Clustering: Discover the Knowledge in the Website [J]. Journal of Computer Research and Development, 2001, 38(4): 482-486.)
[16] 业宁, 李威, 梁作鹏, 等. 一种Web用户行为聚类算法[J]. 小型微型计算机系统, 2004, 25(7): 1364-1367. (Ye Ning, Li Wei, Liang Zuopeng, et al. Web User Action Clustering Algorithm [J]. Journal of Chinese Computer Systems, 2004, 25(7): 1364-1367.)
[17] 陈敏, 苗夺谦, 段其国. 基于用户浏览行为聚类Web用户[J]. 计算机科学, 2008, 35(3): 186-187. (Chen Min, Miao Duoqian, Duan Qiguo. Clustering Web Users Based on Users Browsing Action [J]. Computer Science, 2008, 35(3): 186-187.)
[18] 孙吉贵, 刘杰, 赵连宇. 聚类算法研究[J]. 软件学报, 2008, 19(1): 48-58. (Sun Jigui, Liu Jie, Zhao Lianyu. Clustering Algorithms Research [J]. Journal of Software, 2008, 19(1): 48-58.)
[19] 天池数据实验室[EB/OL]. [2015-05-25]. http://tianchi.aliyun. com/datalab/dataSet.htm?spm=5176.100073.888.7.u6vPAh&id=2. (Tianchi DataLab [EB/OL]. [2015-05-25]. http://tianchi. aliyun.com/datalab/dataSet.htm?spm=5176.100073.888.7.u6vPAh&id=2.)
[20] ICTCLAS [EB/OL]. [2014-11-28]. http://ictclas.nlpir.org/.

[1] 宋梅青. 面向协同过滤推荐的多粒度用户偏好挖掘研究[J]. 现代图书情报技术, 2015, 31(12): 28-33.
[2] 何跃, 宋灵犀, 齐丽云. 负面事件中的品牌网络口碑溢出效应研究——以“圆通夺命快递”事件为例[J]. 现代图书情报技术, 2015, 31(10): 58-64.
[3] 张李义, 张皎. 一种基于主成分分析和随机森林的刷客识别方法[J]. 现代图书情报技术, 2015, 31(10): 65-71.
[4] 王忠群, 皇苏斌, 修宇, 张义. 基于领域专家和商品特征概念树的在线商品评论深刻性度量[J]. 现代图书情报技术, 2015, 31(9): 17-25.
[5] 盈艳, 曹妍, 牟向伟. 基于项目评分预测的混合式协同过滤推荐[J]. 现代图书情报技术, 2015, 31(6): 27-32.
[6] 赵静娴. 基于决策树的网络伪舆情识别研究[J]. 现代图书情报技术, 2015, 31(6): 78-84.
[7] 伍杰华, 朱岸青. 混合拓扑因子的科研网络合作关系预测[J]. 现代图书情报技术, 2015, 31(4): 65-71.
[8] 李胜, 王叶茂. 一种基于本体和位置感知的图书馆书籍推荐模型[J]. 现代图书情报技术, 2015, 31(3): 58-66.
[9] 陈涛, 张永娟, 陈恒. Web数据到RDF数据的框架实现[J]. 现代图书情报技术, 2015, 31(2): 1-6.
[10] 王伟军, 宋梅青. 一种面向用户偏好定向挖掘的协同过滤个性化推荐算法[J]. 现代图书情报技术, 2014, 30(6): 25-32.
[11] 吴珊燕, 许鑫. 基于案例推理的菜谱推荐系统研究[J]. 现代图书情报技术, 2013, (12): 34-41.
[12] 刘勘, 朱怀萍, 刘秀芹. 基于支持向量机的网络伪舆情识别研究[J]. 现代图书情报技术, 2013, 29(11): 75-80.
[13] 熊涛, 何跃. 微博转发网络中意见领袖的识别与分析[J]. 现代图书情报技术, 2013, (6): 55-62.
[14] 李树青, 王建强. 一种结合借阅时间特征分析的读者兴趣可视化识别方法[J]. 现代图书情报技术, 2013, (5): 46-53.
[15] 寇继虹, 戴亦舒, 刘芳, 吴珺, 徐承欢, 曹倩. 动态思维导图软件TheBrain的功能机制分析[J]. 现代图书情报技术, 2012, (12): 45-51.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn