基于用户特征抽取和随机森林分类的用户创新社区领先用户识别研究*
原欣伟, 杨少华, 王超超, 杜占河

Identifying Lead Players of User Innovation Communities Based on Feature Extraction and Random Forest Classification
Yuan Xinwei,Yang Shaohua,Wang Chaochao,Du Zhanhe
表2 用户行为特征数据抽取
行为特征 具体指标 指标含义 体现的领先用户特征
参与 积分 用户通过签到、发表主题和评论、保持在线以及参与社区论坛活动等方式获得的积分 参与性、产品知识
和使用经验
主题数 用户发表主题的数量
评论数 用户对他人主题的评论数
在线时长 用户在社区中所花费的时间长短
社区影响 贡献值 社区对用户贡献的认可, 在一些社区通过贡献值这一指标体现出来 产品知识和使用经验、
意见领袖潜质、创新
能力
威望值 社区对用户发表主题质量的肯定, 在一些社区通过威望值这一指标体现出来
主题平均回复量 用户发表的主题所获得的平均回复数量,
即主题平均回复量=主题总回复数量/主题数量
主题平均点击量 用户发表的主题所获得的平均点击数量,
即主题平均点击量=主题总点击数量/主题数量
精华帖数量 当用户发表的主题得到社区认可的精华帖数量
关系建立 好友数 用户在社区中的好友数量 参与性、意见领袖潜质
空间访问量 用户在社区中的个人主页空间的被访问数量