基于主成分分析和随机森林的恶意网站评估与识别*
|
陈远, 王超群, 胡忠义, 吴江
|
Identifying Malicious Websites with PCA and Random Forest Methods
|
Chen Yuan,Wang Chaoqun,Hu Zhongyi,Wu Jiang
|
|
表1 网站评测指标体系 |
|
|
指标来源 | 指标名称 | 指标含义 | Moz | Moz’s Domain Authority | Moz公司对域名在搜索引擎中排名的预测 | Moz’s total backlinks | 网站的所有反向链接 | MozRank | 链接流行度评分 | Majestic | Majestic’s Citation Flow | 通过引用排名, 度量引用来源 | Majestic’s Trust Flow | 通过衡量一个网站和可信赖网站的亲密程度, 度量信任来源 | Majestic’s backlinks | 网站反向链接的指标 | Majestic’s reference domains | 外部链接指向当前网站的个数 | Google | Google’s Page Rank | Google通过网站之间的超链接关系确定的网站排行榜 | Google’s Page Speed | Google评估网页加载速度的指标 | Alexa | Alexa’s rank | 通过网站的访问量确定网站排名 | Alexa’s 1 month reach | 网站最近1个月的平均每天访问量 | Alexa’s 3 month reach | 网站最近3个月的平均每天访问量 | Alexa’s median load | 使用Alexa特有的算法计算出的页面的平均加载速度 | 社交网站 | Facebook shares | 在Facebook的受欢迎程度 | Twitter tweets | 在Twitter的受欢迎程度 | Google plus shares | 在Google Plus的受欢迎程度 |
|
|
|