基于主成分分析和随机森林的恶意网站评估与识别*
陈远, 王超群, 胡忠义, 吴江

Identifying Malicious Websites with PCA and Random Forest Methods
Chen Yuan,Wang Chaoqun,Hu Zhongyi,Wu Jiang
表3 方差极大法旋转之后的主成分结果
变量 RC1 RC2 RC3 RC4 RC5 h2 u2
MozDomain
Authority
0.88 0.09 0.09 -0.01 0.03 0.80 0.2034
MozTotalBacklinks 0.08 0.13 -0.02 -0.04 0.88 0.80 0.1994
MozRank 0.86 0.06 0.03 0.08 0.04 0.74 0.2556
GooglePageRank 0.91 0.07 0.08 -0.01 0.00 0.83 0.1695
FacebookShares -0.02 0.79 0.02 0.04 -0.10 0.64 0.3572
TwitterTweets 0.08 0.78 -0.01 0.00 -0.11 0.62 0.3798
GooglePlusShares 0.32 0.13 -0.08 -0.24 -0.30 0.27 0.7308
AlexaMedianLoad 0.53 0.04 0.11 0.53 -0.03 0.57 0.4283
AlexaRanks 0.00 0.00 -0.05 0.90 0.00 0.81 0.1931
Alexa1MthReach 0.09 -0.01 0.99 0.00 0.00 0.99 0.0097
Alexa3MthReach 0.08 0.00 0.99 0.00 0.00 0.99 0.0110
GooglePageSpeed 0.42 -0.03 -0.03 0.18 -0.03 0.21 0.7901
MajesticCitation
Flow
0.93 0.16 0.05 -0.03 0.08 0.90 0.1026
MajesticTrustFlow 0.92 0.15 0.08 -0.07 0.07 0.88 0.1170
MajesticBacklinks 0.17 0.73 -0.02 -0.04 0.40 0.73 0.2710
MajesticReference domains 0.21 0.77 -0.02 -0.05 0.40 0.79 0.2088