基于机器学习的社交媒体用户分类研究
*
李纲,周华阳,毛进,陈思菁
Classifying Social Media Users with Machine Learning
Gang Li,Huayang Zhou,Jin Mao,Sijing Chen
表1
用户分类特征集
特征组
特征编号
特征说明
备注
人口统计学
特征
F1
用户粉丝数
取值为0-9
通过为1, 否则
为0
F2
用户关注数
F3
用户被标记数
F4
是否通过认证
命名特征
F5
用户名的命名模式
英文字母搭配
方式
F6
昵称命名模式
F7
昵称和用户名相似度
自我描述
特征
F8-F2395
词汇出现的词频-
逆频率