Please wait a minute...
Advanced Search
现代图书情报技术  2015, Vol. 31 Issue (11): 41-50     https://doi.org/10.11925/infotech.1003-3513.2015.11.07
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于模板用户信息搜索行为和统计分析的共谋销量欺诈识别
王忠群, 乐元, 修宇, 皇苏斌, 汪千松
安徽工程大学管理工程学院 芜湖 241000
Collusive Sales Fraud Detection Based on Users' Information Search Behavior Template and Statistical Analysis
Wang Zhongqun, Le Yuan, Xiu Yu, Huang Subin, Wang Qiansong
School of Management Engineering, Anhui Polytechnic University, Wuhu 241000, China
全文: PDF (791 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

[目的]针对电子商务推广中出现的共谋虚增销量的欺诈问题, 提出一种基于模板用户信息搜索行为和统计分析的共谋销量识别方法。[方法]为了刻画用户在C2C网站购物时的信息搜索行为, 提出一种带关键字的用户信息搜索行为模型以及信息搜索行为的相似度计算方法; 依据共谋用户信息搜索行为的相似性, 提出一种基于层次聚类的欺诈嫌疑挖掘算法; 给出基于统计分析的欺诈识别方法从欺诈嫌疑中识别共谋买家, 以实现对卖家销售记录中虚增销量的识别。[结果]在改进的数据集上验证该方法的召回率和准确率分别为88.6%和90.1%。[局限]不能动态调整用于识别欺诈嫌疑行为是否为“刷单”的阈值。[结论]该方法可有效识别基于模板用户信息搜索行为的共谋虚增销量。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
Abstract

[Objective] Aiming at collusive sales inflation fraud in e-commerce promotion, this paper presents a collusive product sales fraud detection method based on users' information search behavior.[Methods] Firstly, in order to describe users' information search behavior in online shopping, a model for user information search behavior with keywords and a similarity calculating method for users' information search behavior are proposed. Secondly, a suspicious fraud mining algorithm based on hierarchical clustering algorithm for inflation sales is proposed, which depends on the similarity between users' information search behavior. Finally, this paper proposes a method for detecting suspicious fraud based on statistical analysis, to identify inflating sales in sale record of illegal vendors.[Results] The experimental results show that the recall and precision of the method are 88.6% and 90.1% respectively based on the improved data set.[Limitations] The threshold value predetermined for judging whether the fraudulent behavior is “scalping” behavior is fixed.[Conclusions] The method is effective for the detection of collusive sales inflation fraud based on users' information search behavior template.

收稿日期: 2015-06-04      出版日期: 2016-04-06
:  G202  
基金资助:

本文系国家自然科学基金项目“C2C市场中基于行为树的销量识别与发布研究”(项目编号:71371012)、教育部人文社会科学规划项目“C2C市场中基于参与者行为的‘打榜'识别模型与应用研究”(项目编号:13YJA630098)和安徽省高校省级科学研究项目“C2C市场中基于参与者决策信息搜寻行为的虚假交易早期识别研究”(项目编号:TSKJ2014B10)的研究成果之一。

通讯作者: 王忠群, ORCID: 0000-0002-5307-5706, E-mail: zqwang@ahpu.edu.cn。     E-mail: zqwang@ahpu.edu.cn
作者简介: 作者贡献声明:王忠群: 研究方案设计, 论文最终版本修订; 乐元: 论文撰写, 实验验证;修宇, 皇苏斌, 汪千松: 算法设计, 以及部分实验工作。
引用本文:   
王忠群, 乐元, 修宇, 皇苏斌, 汪千松. 基于模板用户信息搜索行为和统计分析的共谋销量欺诈识别[J]. 现代图书情报技术, 2015, 31(11): 41-50.
Wang Zhongqun, Le Yuan, Xiu Yu, Huang Subin, Wang Qiansong. Collusive Sales Fraud Detection Based on Users' Information Search Behavior Template and Statistical Analysis. New Technology of Library and Information Service, 2015, 31(11): 41-50.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2015.11.07      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2015/V31/I11/41

[1] 中国电子商务研究中心. 2012年(上)中国电子商务用户体验与投诉监测报告[EB/OL]. [2013-06-28]. http://www. 100ec.cn/zt/upload_data/down/yhty.pdf. (China Electronic Commerce Research Center. 2012 (a) Chinese E-commerce User Experience and Complaints Monitoring Reports [EB/OL]. [2013-06-28]. http://www. 100ec.cn/zt/upload_data/ down/yhty.pdf.)
[2] 威客–猪八戒网.需求和任务推广[EB/OL]. [2014-07-26]. http://www.zhubajie.com/wdtg/. (Wik-Zhubajie Website. Needs and Tasks Promotion [EB/OL]. [2014-07-26]. http://www. zhubajie.com/ wdtg/. )
[3] 王烁, 徐健, 刘颖. 网络“水军”探测方法研究[J]. 现代图书情报技术, 2014(7-8): 92-100. (Wang Shuo, Xu Jian, Liu Ying. Research on Online “Water Army” Detection Methods [J]. New Technology of Library and Information Service, 2014(7-8): 92-100.)
[4] Chen C C, Tseng Y. Quality Evaluation of Product Reviews Using an Information Quality Framework [J]. Decision Support Systems, 2011, 50(4): 755-768.
[5] 李霄, 丁晟春. 垃圾商品评论信息的识别研究[J].现代图书情报技术, 2013(1): 63-68. (Li Xiao, Ding Shengchun. Research on Review Spam Recognition [J]. New Technology of Library and Information Service, 2013(1): 63-68.)
[6] 伍之昂, 王有权, 曹杰. 推荐系统托攻击模型与检测技术[J]. 科学通报, 2014, 59(7): 551-560. (Wu Zhiang, Wang Youquan, Cao Jie. A Survey on Attack Models and Detection Techniques for Recommender Systems [J]. Chinese Science Bulletin, 2014, 59(7): 551-560.)
[7] You W J, Liu L, Xia M, Lv C G. Reputation Inflation Detection in a Chinese C2C Market [J]. Electronic Commerce Research and Applications, 2011, 10(5): 510-519.
[8] Chang W. H, Chang J S. An Effective Early Fraud Detection Method for Online Auction [J]. Electronic Commerce Research and Applications, 2012, 11(4): 346-360.
[9] Lian Q, Zhang Z, Yang Mei, et al. An Empirical Study of Collusion Behavior in the Maze P2P File Sharing System [C]. In: Proceedings of the 27th International Conference on Distributed Computing Systems. 2007.
[10] Uyar M, Yildirim S, Gencoglu M T. An Expert System Based on S-transform and Neural Network for Automatic Classification of Power Quality Disturbances [J]. Expert Systems with Applications, 2009, 36: 5962-5975.
[11] 郑华, 吴克文, 朱庆华. 基于神经网络和SNA的C2C电子商务信誉欺诈识别研究[J]. 计算机应用研究, 2011, 28(5): 1883-1885. (Zheng Hua, Wu Kewen, Zhu Qinghua. Detection of C2C Reputation Fraud Activities Based on Neural Network and SNA [J]. Application Research of Computers, 2011, 28(5): 1883-1885.)
[12] 尤薇佳, 刘鲁, 杨俊杰, 等. 基于交易记录的欺诈识别[C]. 见: 第二届网商及电子商务生态学术研讨会论文集. 杭州: 浙江大学出版社, 2009: 178-182. (You Weijia, Liu Lu, Yang Junjie, et al. Fraud Detection Based on Transaction Records [C]. In: Proceedings of the Second Netrepreneurs and E-business Ecosystem Seminar. Hangzhou: Zhejiang University Press, 2009: 178-182.)
[13] Wang J, Chiu C. Detecting Online Auction Inflated-Reputation Behaviors Using Social Network Analysis [C]. In: Poceedings of the 2005 North American Association for Computational Social and Organizational Science.2005.
[14] Zhu H S, Xiong H, Ge Y, et al. Discovery of Ranking Fraud for Mobile Apps [J]. Transactions on Knowledge and Data Engineering, 2015, 27(1): 74-87.
[15] 王实, 高文, 李锦涛, 等. 路径聚类: 在Web站点中的知识发现[J]. 计算机研究与发展, 2001, 38(4): 482-486. (Wang Shi, Gao Wen, Li Jintao, et al. Path Clustering: Discover the Knowledge in the Website [J]. Journal of Computer Research and Development, 2001, 38(4): 482-486.)
[16] 业宁, 李威, 梁作鹏, 等. 一种Web用户行为聚类算法[J]. 小型微型计算机系统, 2004, 25(7): 1364-1367. (Ye Ning, Li Wei, Liang Zuopeng, et al. Web User Action Clustering Algorithm [J]. Journal of Chinese Computer Systems, 2004, 25(7): 1364-1367.)
[17] 陈敏, 苗夺谦, 段其国. 基于用户浏览行为聚类Web用户[J]. 计算机科学, 2008, 35(3): 186-187. (Chen Min, Miao Duoqian, Duan Qiguo. Clustering Web Users Based on Users Browsing Action [J]. Computer Science, 2008, 35(3): 186-187.)
[18] 孙吉贵, 刘杰, 赵连宇. 聚类算法研究[J]. 软件学报, 2008, 19(1): 48-58. (Sun Jigui, Liu Jie, Zhao Lianyu. Clustering Algorithms Research [J]. Journal of Software, 2008, 19(1): 48-58.)
[19] 天池数据实验室[EB/OL]. [2015-05-25]. http://tianchi.aliyun. com/datalab/dataSet.htm?spm=5176.100073.888.7.u6vPAh&id=2. (Tianchi DataLab [EB/OL]. [2015-05-25]. http://tianchi. aliyun.com/datalab/dataSet.htm?spm=5176.100073.888.7.u6vPAh&id=2.)
[20] ICTCLAS [EB/OL]. [2014-11-28]. http://ictclas.nlpir.org/.

[1] 范涛,王昊,吴鹏. 基于图卷积神经网络和依存句法分析的网民负面情感分析研究*[J]. 数据分析与知识发现, 2021, 5(9): 97-106.
[2] 周泽聿,王昊,赵梓博,李跃艳,张小琴. 融合关联信息的GCN文本分类模型构建及其应用研究*[J]. 数据分析与知识发现, 2021, 5(9): 31-41.
[3] 冯勇,刘洋,徐红艳,王嵘冰,张永刚. 融合近邻评论的GRU商品推荐模型*[J]. 数据分析与知识发现, 2021, 5(3): 78-87.
[4] 邬金鸣,侯跃芳,崔雷. 基于医学主题词标引规则的词共现聚类分析结果自动判读和表达的研究[J]. 数据分析与知识发现, 2020, 4(9): 133-144.
[5] 赵旸, 张智雄, 刘欢, 丁良萍. 基于BERT模型的中文医学文献分类研究*[J]. 数据分析与知识发现, 2020, 4(8): 41-49.
[6] 张智雄,刘欢,丁良萍,吴朋民,于改红. 不同深度学习模型的科技论文摘要语步识别效果对比研究 *[J]. 数据分析与知识发现, 2019, 3(12): 1-9.
[7] 俞琰,陈磊,姜金德,赵乃瑄. 结合词向量和统计特征的专利相似度测量方法 *[J]. 数据分析与知识发现, 2019, 3(9): 53-59.
[8] 熊回香, 叶佳鑫, 蒋武轩. 改进的DBSCAN聚类算法在社会化标注中的应用*[J]. 数据分析与知识发现, 2018, 2(12): 77-88.
[9] 何伟林, 奉国和, 谢红玲. 基于CSToT模型的科技文献主题发现与演化研究*[J]. 数据分析与知识发现, 2018, 2(11): 64-72.
[10] 殷聪, 张李义. 基于TF-IDF的情境后过滤推荐算法研究*——以餐饮业O2O为例[J]. 数据分析与知识发现, 2018, 2(11): 28-36.
[11] 胡家珩, 岑咏华, 吴承尧. 基于深度学习的领域情感词典自动构建*——以金融领域为例[J]. 数据分析与知识发现, 2018, 2(10): 95-102.
[12] 徐建民, 许彩云. 基于文本和公式的科技文档相似度计算*[J]. 数据分析与知识发现, 2018, 2(10): 103-109.
[13] 张艳丰, 李贺, 彭丽徽, 侯力铁. 基于情感语义特征抽取的在线评论有用性分类算法与应用[J]. 数据分析与知识发现, 2017, 1(12): 74-83.
[14] 魏星, 胡德华, 易敏寒, 朱启贞, 朱文婕. 基于数据立方体挖掘疾病-基因-药物新关联*[J]. 数据分析与知识发现, 2017, 1(10): 94-104.
[15] 王忠群, 吴东胜, 蒋胜, 皇苏斌. 一种基于主流特征观点对的评论可信性排序研究*[J]. 数据分析与知识发现, 2017, 1(10): 32-42.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn