基于用户-评论-商户关系的虚假用户识别研究:用户偏差分析的视角
|
孟园,王悦
|
Identifying Fake Accounts with User-Review-Shop Relationship and User Deviation Analysis
|
Meng Yuan,Wang Yue
|
|
表2 描述性统计
|
Table 2 Descriptive Statistics
|
|
对象 | 指标 | 描述 | 最小值 | 最大值 | 中位数 | 均值 | 标准差 | 用户 | UL | 用户活跃等级 | 6.000 0 | 45.000 0 | 17.000 0 | 16.840 0 | 3.460 0 | UF | 用户社交粉丝数 | 0.000 0 | 5 927.000 0 | 1 182.000 0 | 960.820 0 | 520.730 0 | UQA | 用户提问与回答比 | 0.000 0 | 1.000 0 | 0.000 0 | 0.040 7 | 0.156 6 | UTS | 用户评论时间间隔 | 1.000 0 | 4 087.000 0 | 2 049.000 0 | 1 985.270 0 | 433.970 0 | URB | 用户突发评论数 | 1.000 0 | 132.000 0 | 2.000 0 | 2.780 0 | 7.290 0 | URN | 用户评论次数 | 51.000 0 | 301.000 0 | 54.000 0 | 56.600 0 | 12.600 0 | URF | 用户评论频率 | 0.014 2 | 64.000 0 | 0.026 9 | 0.093 0 | 1.539 6 | URC | 用户评论集中度 | 0.012 2 | 0.987 6 | 0.037 0 | 0.043 0 | 0.066 2 | USC | 用户在商户中评论集中度 | 0.181 8 | 1.000 0 | 1.000 0 | 0.994 3 | 0.022 5 | 评论 | RL | 评论长度 | 0.000 0 | 576.000 0 | 9.000 0 | 12.470 0 | 13.330 0 | RR | 极端评分 | 0.000 0 | 5.000 0 | 5.000 0 | 4.430 0 | 0.770 0 | RPN | 图片数 | 0.000 0 | 10.000 0 | 0.000 0 | 0.002 0 | 0.058 0 | RS | 评论相似度 | 0.000 0 | 1.000 0 | 0.028 0 | 0.039 0 | 0.045 0 | 商户 | SA | 商户年龄 | 0.000 0 | 108.000 0 | 8.000 0 | 9.807 6 | 7.612 7 | SS | 商户规模 | 1.000 0 | 1 500.000 0 | 80.000 0 | 102.070 0 | 92.610 0 | SRN | 商户早期评论数 | 1.000 0 | 73.000 0 | 5.000 0 | 7.596 5 | 9.910 7 | SUN | 商户高评论用户数(≥50) | 2.000 0 | 73.000 0 | 5.000 0 | 7.551 3 | 9.782 0 |
|
|
|