基于机器学习的社交媒体用户分类研究 *
李纲,周华阳,毛进,陈思菁

Classifying Social Media Users with Machine Learning
Gang Li,Huayang Zhou,Jin Mao,Sijing Chen
表1 用户分类特征集
特征组 特征编号 特征说明 备注
人口统计学
特征
F1 用户粉丝数 取值为0-9
通过为1, 否则
为0
F2 用户关注数
F3 用户被标记数
F4 是否通过认证
命名特征 F5 用户名的命名模式 英文字母搭配
方式
F6 昵称命名模式
F7 昵称和用户名相似度
自我描述
特征
F8-F2395 词汇出现的词频-
逆频率