在线音乐歌单播放量预测及影响因素分析*
刘渊晨,王昊,高亚琪

Predicting Online Music Playbacks and Influencing Factors
Liu Yuanchen,Wang Hao,Gao Yaqi
表2 获取的歌单数据信息
Table 2 Music List Data Information
序号 字段名称 字段类型 主要内容 组合标记
1 歌单链接 字符型 用于唯一表示每个歌单(只用于标识,不作为特征选取)
2 歌单起始播放量 数值型 第一次爬取歌单信息时歌单的播放量 F1
3 歌单收藏量 数值型 歌单被多少个用户收藏,方便用户反复收听
4 歌单转发量 数值型 歌单被多少个用户转发分享至其他平台(如微信朋友圈、微博、QQ空间等)
5 歌单评论数 数值型 用户对该歌单发表的评论数
6 歌单歌曲数 数值型 歌单共收录了多少歌曲 F2
7 歌单推荐顺序 数值型 按照每个类别下歌单排列的位置顺序依次标号
8 歌单类别 数值型 12个类别,用数字1~12表示
9 歌单创建时间 数值型 将创建日期换算为距2020.5.24(即爬取数据当日)的天数
10 用户昵称 字符型 创建歌单的用户名称(只用于标识,不作为特征选取)
11 用户动态数 数值型 创建歌单的用户个人主页中发表的动态总数 F3
12 用户关注数 数值型 创建歌单的用户关注其他用户的数量
13 用户粉丝数 数值型 创建歌单的用户被其他用户关注的数量
14 用户等级 数值型 创建歌单的用户等级,一般等级越高,代表活跃度越高
15 用户创建歌单数 数值型 创建歌单的用户创建的歌单总数
16 歌单名称 文本型 由中英文、特殊符号等组成的文本数据,不允许为空值 F4
17 歌单简介 文本型 由中英文、特殊符号等组成的文本数据,通常是对歌单特征、内容的描述
18 12h后歌单播放量 数值型 间隔12h后第二次爬取时歌单的播放量,即本文进行预测的数值