序号 | 字段名称 | 字段类型 | 主要内容 | 组合标记 | 1 | 歌单链接 | 字符型 | 用于唯一表示每个歌单(只用于标识,不作为特征选取) | | 2 | 歌单起始播放量 | 数值型 | 第一次爬取歌单信息时歌单的播放量 | F1 | 3 | 歌单收藏量 | 数值型 | 歌单被多少个用户收藏,方便用户反复收听 | 4 | 歌单转发量 | 数值型 | 歌单被多少个用户转发分享至其他平台(如微信朋友圈、微博、QQ空间等) | 5 | 歌单评论数 | 数值型 | 用户对该歌单发表的评论数 | 6 | 歌单歌曲数 | 数值型 | 歌单共收录了多少歌曲 | F2 | 7 | 歌单推荐顺序 | 数值型 | 按照每个类别下歌单排列的位置顺序依次标号 | 8 | 歌单类别 | 数值型 | 12个类别,用数字1~12表示 | 9 | 歌单创建时间 | 数值型 | 将创建日期换算为距2020.5.24(即爬取数据当日)的天数 | 10 | 用户昵称 | 字符型 | 创建歌单的用户名称(只用于标识,不作为特征选取) | | 11 | 用户动态数 | 数值型 | 创建歌单的用户个人主页中发表的动态总数 | F3 | 12 | 用户关注数 | 数值型 | 创建歌单的用户关注其他用户的数量 | 13 | 用户粉丝数 | 数值型 | 创建歌单的用户被其他用户关注的数量 | 14 | 用户等级 | 数值型 | 创建歌单的用户等级,一般等级越高,代表活跃度越高 | 15 | 用户创建歌单数 | 数值型 | 创建歌单的用户创建的歌单总数 | 16 | 歌单名称 | 文本型 | 由中英文、特殊符号等组成的文本数据,不允许为空值 | F4 | 17 | 歌单简介 | 文本型 | 由中英文、特殊符号等组成的文本数据,通常是对歌单特征、内容的描述 | 18 | 12h后歌单播放量 | 数值型 | 间隔12h后第二次爬取时歌单的播放量,即本文进行预测的数值 | |
|