Please wait a minute...
Advanced Search
现代图书情报技术  2014, Vol. 30 Issue (7): 92-100     https://doi.org/10.11925/infotech.1003-3513.2014.07.13
  情报分析与研究 本期目录 | 过刊浏览 | 高级检索 |
网络“水军”探测方法研究
王烁1, 徐健1, 刘颖2
1. 中山大学资讯管理学院, 广州510006;
2. 中山大学图书馆, 广州510275
Research on Online "Water Army" Detection Methods
Wang Shuo1, Xu Jian1, Liu Ying2
1. School of Information Management, Sun Yat-Sen University, Guangzhou 510006, China;
2. Sun Yat-Sen University Libraries, Guangzhou 510275, China
全文: PDF (900 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 

[目的]针对网络“水军”所引发的网络信息失真问题,提出“水军”探测方法,从宏观上探测出“水军”。[应用背景]对网络上电影、音乐、书籍等的在线评分进行统计分析,识别出存在“水军”刷分现象的对象。[方法]从宏观上提出基于正态分布拟合的静态探测方法及基于时间序列法的动态探测方法进行“水军”探测,并设计反映某一天评论数量相对于总体情况波动的“水军”强度指标。[结果]对“显瓣电影网”2012年的近千部电影进行探测,将结果与部分媒体曝光的存在“水军’,情况的电影进行相互印证,证明上述方法的探测效果。[结论]“水军”静态及动态探测相结合的方法可以对网络上存在的“水军”现象进行探测,但也存在评分数据量不足影响探测效果的局限等。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
刘颖
王烁
徐健
Abstract

[Objective] The online "water army" causes the distortion of network information. The paper proposes two methods to detect water army.[Context] Use the methods to detect the "water army" existed on movie website,e-commerce website and so on.[Methods] The paper proposes static and dynamic methods to detect water army, and designs an intensity index to show the fluctuations of the number of reviews relative to the overall in one day.[Results]The paper uses mining technology to collect rating data of Douban movie site, then analyses the ratings to identify the"water army", which verifies the effectiveness of two detection methods.[Conclusions] The combination of the static and dynamic detection methods can detect the existence of "water army" phenomenon effectively. But it also has some limitations, for example, the insufficient rating data affects the detection.

Key wordsNetwork information authenticity    "Water Army"    detection    Normality fitting    Time fragment analysis    "Water Army"    strength
收稿日期: 2013-12-31      出版日期: 2014-10-20
:  G250  
基金资助:

国家社会科学基金项目“用户评论情感分析及其在竞争情报服务中的应用研究”(项目编号:11CTQ022)的研究成果之一

通讯作者: 徐健E-mail:issxj@mail.sysu.edu.cn     E-mail: issxj@mail.sysu.edu.cn
作者简介: 作者贡献声明:徐健:提出研究思路,设计研究方案;工烁,刘颖:进行实验;采集、清洗和分析数据;工烁,徐健,刘颖:论文起草;徐健:论文最终版本修订。
引用本文:   
王烁, 徐健, 刘颖. 网络“水军”探测方法研究[J]. 现代图书情报技术, 2014, 30(7): 92-100.
Wang Shuo, Xu Jian, Liu Ying. Research on Online "Water Army" Detection Methods. New Technology of Library and Information Service, 2014, 30(7): 92-100.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2014.07.13      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2014/V30/I7/92

[1] 百度百科. “水军”现象[EB/OL].[2013-10-25]. http://baike. baidu.com/view/3098178.htm.(Baidupedia.The Phenomenon of Water Army[EB/OL].[2013-10-25]. http://baike.baidu.com/view/3098178.htm.)
[2] 新华网.三星“水军”营销遭曝光: 诋毁对手被罚千万台币[EB/OL].[2013-10-28]. http://news.xinhuanet.com/finance/2013-10/28/c_125607898.htm. (XinhuaNet. Water Army
Marketing of Samsung is Exposed: Discredit Opponents Lead to be Fined Ten Million NT Dollars[EB/OL].[2013-10-28]. http://news.xinhuanet.com/finance/2013-10/28/c_125607898.htm.)
[3] 王淑敏, 李军豪. 蜜罐技术在社交网络反垃圾信息中应用[J]. 煤炭技术, 2011, 30(7): 154-155. (Wang Shumin, Li Junhao. Honeypot Technology Applicationin Social Networks of SPAM[J]. Coal Technology, 2011, 30(7): 154-155.)
[4] 隆承志, 周杰. 基于特征共享的垃圾邮件过滤方法[C]. 见: 2010年基于互联网的商业管理学术会议论文集. 2010. (Long Chengzhi, Zhou Jie. Characteristics Sharing Based Spam Filtering Method[C]. In: Proceedings of the Conference on Web Based Business Management.2010.)
[5] Chen C C, Tseng Y. Quality Evaluation of Product Reviews Using an Information Quality Framework[J]. Decision Support Systems, 2011, 50(4): 755-768.
[6] Liu Y, Jin J, Ji P, et al. Identifying Helpful Online Reviews: A Product Designer’s Perspective[J]. Computer-Aided Design, 2013, 45(2): 180-194.
[7] 苏雪佳. B2C在线评论有用性影响因素研究——以亚马逊网站为例[D]. 武汉: 中南民族大学, 2012. (Su Xuejia. A Study of the Impact Factors of the Helpfulness of B2C Online Reviews —— A Case Study of Amazon[D]. Wuhan: South- Central University for Nationalities, 2012.)
[8] 江海洋. 基于评论挖掘和用户偏好学习的评分预测协同过滤[J]. 计算机应用研究, 2010, 27(12): 4430-4432. (Jiang Haiyang. Collaborative Filtering Based on Opinion Mining and User Preference Learning[J]. Application Research of Computers, 2010, 27(12): 4430-4432.)
[9] 盛骤, 谢式千, 潘承毅. 概率论与数理统计[M]. 第三版. 北京: 高等教育出版社, 2001. (Sheng Zhou, Xie Shiqian, Pan Chengyi. Probability Theory and Mathematical Statistics[M]. The 3rd Edition. Beijing: Higher Education Press, 2001.)
[10] 查先进. 信息分析[M].武汉: 武汉大学出版社, 2011. (Zha Xianjin. Information Analysis[M]. Wuhan: Wuhan University Press, 2011.)

[1] 柴庆凤, 史霖炎, 梅珊, 熊海涛, 贺惠新. 基于人工特征和机器特征融合的科技文献知识元抽取*[J]. 数据分析与知识发现, 2021, 5(8): 132-144.
[2] 谭荧, 唐亦非. 基于指代消解的引文内容抽取研究*[J]. 数据分析与知识发现, 2021, 5(8): 25-33.
[3] 王勤洁, 秦春秀, 马续补, 刘怀亮, 徐存真. 基于作者偏好和异构信息网络的科技文献推荐方法研究*[J]. 数据分析与知识发现, 2021, 5(8): 54-64.
[4] 韩普,张展鹏,张明淘,顾亮. 基于多特征融合的中文疾病名称归一化研究*[J]. 数据分析与知识发现, 2021, 5(5): 83-94.
[5] 李贺,刘嘉宇,李世钰,吴迪,金帅岐. 基于疾病知识图谱的自动问答系统优化研究*[J]. 数据分析与知识发现, 2021, 5(5): 115-126.
[6] 李跃艳,王昊,邓三鸿,王伟. 近十年信息检索领域的研究热点与演化趋势研究——基于SIGIR会议论文的分析[J]. 数据分析与知识发现, 2021, 5(4): 13-24.
[7] 伊惠芳,刘细文. 一种专利技术主题分析的IPC语境增强Context-LDA模型研究[J]. 数据分析与知识发现, 2021, 5(4): 25-36.
[8] 王红斌,王健雄,张亚飞,杨恒. 主题不平衡新闻文本数据集的主题识别方法研究*[J]. 数据分析与知识发现, 2021, 5(3): 109-120.
[9] 常志军,钱力,谢靖,吴振新,张鹄,于倩倩,王颖,王永吉. 基于分布式技术的科技文献大数据平台的建设研究*[J]. 数据分析与知识发现, 2021, 5(3): 69-77.
[10] 胡少虎,张颖怡,章成志. 关键词提取研究综述*[J]. 数据分析与知识发现, 2021, 5(3): 45-59.
[11] 刘彤, 刘琛, 倪维健. 多层次数据增强的半监督中文情感分析方法 [J]. 数据分析与知识发现, 0, (): 1-.
[12] 王红斌, 王健雄, 张亚飞, 杨恒. 主题不平衡新闻文本数据集的主题识别方法研究 [J]. 数据分析与知识发现, 0, (): 1-.
[13] 张思凡, 牛振东, 陆浩, 朱一凡, 王荣荣. 基于图卷积嵌入与特征交叉的文献被引量预测方法:以交通运输领域为例 [J]. 数据分析与知识发现, 0, (): 1-.
[14] 祁瑞华, 简悦, 郭旭, 关菁华, 杨明昕. 融合特征与注意力的跨领域产品评论情感分析 [J]. 数据分析与知识发现, 0, (): 1-.
[15] 李娇, 黄永文, 罗婷婷, 赵瑞雪, 鲜国建. 基于多因子算法的自动分类研究 [J]. 数据分析与知识发现, 0, (): 1-.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn