基于主成分分析和随机森林的恶意网站评估与识别*
|
陈远, 王超群, 胡忠义, 吴江
|
Identifying Malicious Websites with PCA and Random Forest Methods
|
Chen Yuan,Wang Chaoqun,Hu Zhongyi,Wu Jiang
|
|
表3 方差极大法旋转之后的主成分结果 |
|
|
变量 | RC1 | RC2 | RC3 | RC4 | RC5 | h2 | u2 | MozDomain Authority | 0.88 | 0.09 | 0.09 | -0.01 | 0.03 | 0.80 | 0.2034 | MozTotalBacklinks | 0.08 | 0.13 | -0.02 | -0.04 | 0.88 | 0.80 | 0.1994 | MozRank | 0.86 | 0.06 | 0.03 | 0.08 | 0.04 | 0.74 | 0.2556 | GooglePageRank | 0.91 | 0.07 | 0.08 | -0.01 | 0.00 | 0.83 | 0.1695 | FacebookShares | -0.02 | 0.79 | 0.02 | 0.04 | -0.10 | 0.64 | 0.3572 | TwitterTweets | 0.08 | 0.78 | -0.01 | 0.00 | -0.11 | 0.62 | 0.3798 | GooglePlusShares | 0.32 | 0.13 | -0.08 | -0.24 | -0.30 | 0.27 | 0.7308 | AlexaMedianLoad | 0.53 | 0.04 | 0.11 | 0.53 | -0.03 | 0.57 | 0.4283 | AlexaRanks | 0.00 | 0.00 | -0.05 | 0.90 | 0.00 | 0.81 | 0.1931 | Alexa1MthReach | 0.09 | -0.01 | 0.99 | 0.00 | 0.00 | 0.99 | 0.0097 | Alexa3MthReach | 0.08 | 0.00 | 0.99 | 0.00 | 0.00 | 0.99 | 0.0110 | GooglePageSpeed | 0.42 | -0.03 | -0.03 | 0.18 | -0.03 | 0.21 | 0.7901 | MajesticCitation Flow | 0.93 | 0.16 | 0.05 | -0.03 | 0.08 | 0.90 | 0.1026 | MajesticTrustFlow | 0.92 | 0.15 | 0.08 | -0.07 | 0.07 | 0.88 | 0.1170 | MajesticBacklinks | 0.17 | 0.73 | -0.02 | -0.04 | 0.40 | 0.73 | 0.2710 | MajesticReference domains | 0.21 | 0.77 | -0.02 | -0.05 | 0.40 | 0.79 | 0.2088 |
|
|
|