基于主成分分析和随机森林的恶意网站评估与识别*
陈远, 王超群, 胡忠义, 吴江

Identifying Malicious Websites with PCA and Random Forest Methods
Chen Yuan,Wang Chaoqun,Hu Zhongyi,Wu Jiang
表1 网站评测指标体系
指标来源 指标名称 指标含义
Moz Moz’s Domain Authority Moz公司对域名在搜索引擎中排名的预测
Moz’s total backlinks 网站的所有反向链接
MozRank 链接流行度评分
Majestic Majestic’s Citation Flow 通过引用排名, 度量引用来源
Majestic’s Trust Flow 通过衡量一个网站和可信赖网站的亲密程度, 度量信任来源
Majestic’s backlinks 网站反向链接的指标
Majestic’s reference domains 外部链接指向当前网站的个数
Google Google’s Page Rank Google通过网站之间的超链接关系确定的网站排行榜
Google’s Page Speed Google评估网页加载速度的指标
Alexa Alexa’s rank 通过网站的访问量确定网站排名
Alexa’s 1 month reach 网站最近1个月的平均每天访问量
Alexa’s 3 month reach 网站最近3个月的平均每天访问量
Alexa’s median load 使用Alexa特有的算法计算出的页面的平均加载速度
社交网站 Facebook shares 在Facebook的受欢迎程度
Twitter tweets 在Twitter的受欢迎程度
Google plus shares 在Google Plus的受欢迎程度