基于物品质量和用户评分修正的协同过滤推荐算法 *

doi:10.11925/infotech.2096-3467.2018.1000

基于物品质量和用户评分修正的协同过滤推荐算法 ^*

焦富森, 李树青^,^,

南京财经大学信息工程学院南京 210046

Collaborative Filtering Recommendation Based on Item Quality and User Ratings

Jiao Fusen, Li Shuqing^,^,

College of Information Engineering, Nanjing University of Finance & Economics, Nanjing 210046, China

通讯作者: 李树青, ORCID: 0000-0001-9814-5766, E-mail:leeshuqing@163.com。

收稿日期: 2018-08-25 修回日期: 2018-10-30 网络出版日期: 2019-08-25

基金资助:

*本文系江苏省研究生科研与实践创新计划项目“面向个性化推荐服务的互联网用户画像关键技术研究”. KYCX17_1208
国家社会科学基金项目“基于大数据分析的数字图书馆个性化服务模式创新研究”的研究成果之一. 16BTQ030

Received: 2018-08-25 Revised: 2018-10-30 Online: 2019-08-25

摘要

【目的】在个性化推荐中, 考虑物品质量和用户评分倾向性对用户打分的影响, 提高推荐效果。【方法】提出一种改进的协同过滤推荐算法: 利用物品质量评估算法实现了用户评分修正, 可以改进查找与用户兴趣相似的最近邻过程, 并在此基础上进行推荐。【结果】利用MovieLens数据集进行测试, 与传统协同过滤算法相比, 改进算法的MAE提高4.7%; 与其他几种改进算法相比, 精确度均有不同程度的提高。【局限】只关注现有的评分修正, 并没有考虑用户的兴趣漂移, 在一定程度上影响推荐效果。【结论】本文提出的算法推荐结果更加精确, 有效地减少了物品质量和用户评分倾向性对推荐结果的影响, 提高了推荐质量。

关键词： 推荐系统 ; 协同过滤 ; 物品质量 ; 评分修正

Abstract

[Objective] This paper proposes a modified collaborative filtering algorithm, aiming to improve the results of personalized recommendations. [Methods] First, we evaluated item quality and corrected user ratings based on their previous records. Then, we identified users with similar interests to generate better recommendations. [Results] We tested the new algorithm on MovieLens dataset and found the MAE was 4.7% higher than those of the traditional or other modified methods. [Limitations] The new algorithm does not address the interests drifting issues. [Conclusions] The proposed algorithm could recommend products to consumers more effectively.

Keywords： Recommender System ; Collaborative Filtering ; Item Quality ; User Rating Correction

PDF (512KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文

本文引用格式

焦富森, 李树青. 基于物品质量和用户评分修正的协同过滤推荐算法 ^*. 数据分析与知识发现[J], 2019, 3(8): 62-67 doi:10.11925/infotech.2096-3467.2018.1000

Jiao Fusen. Collaborative Filtering Recommendation Based on Item Quality and User Ratings. Data Analysis and Knowledge Discovery[J], 2019, 3(8): 62-67 doi:10.11925/infotech.2096-3467.2018.1000

1 引言

近年, 网络的飞速发展引发了数据量的爆炸式增长。数据中蕴含着无穷的价值, 同时也引发了严重的“信息过载”问题。推荐系统是一种帮助用户快速发现有用信息的工具, 正逐步成为解决信息过载问题的主要发展方向。和搜索引擎不同的是, 推荐系统不需要用户提供明确的需求, 而是通过分析用户的历史行为给用户的兴趣建模, 从而主动向用户推荐能够满足其兴趣和需求的信息。

协同过滤算法是应用最广泛、同时也是发展比较成熟的一种推荐算法。其基本思想是根据用户的浏览记录、购买记录、评分记录或者主页的标注标签等历史信息, 向用户主动推荐信息或预测用户的兴趣偏好, 以实现个性化推荐。电商网站亚马逊的个性化推荐系统有着“推荐系统之王”的美誉, 其核心就是协同过滤算法。然而现有的协同过滤算法只考虑用户或物品之间的相似程度, 忽略了用户的评分是多重因素的结果, 可能是用户习惯于打出高分, 也有可能是用户对质量较好的物品做出的客观评价。现有协同过滤不能体现这些影响因素, 从而导致系统推荐的物品偏离了用户的真实喜好。因此, 如何在海量数据中有效发现用户的兴趣喜好成为推荐系统中一个重要的研究领域。

2 文献回顾

推荐算法是整个推荐系统中最核心和关键的部分, 在很大程度上决定了推荐系统性能的优劣。传统的推荐方法主要包括基于协同过滤的推荐方法、基于内容的推荐方法和混合推荐方法。其中协同过滤以其模型通用性强、不需要太多对应数据领域的专业知识、算法实现简单、推荐效果理想等优点成为工业界应用最为广泛的推荐算法^[1]。

主流的协同过滤推荐算法分为两类: 基于用户的协同过滤推荐算法^[2]和基于项目的协同过滤推荐算法^[3]。基于用户的协同过滤基于这样一个假设: 如果用户对一些项目的评分比较相似, 则他们对其他项目的评分也比较相似。算法根据用户对项目的评分矩阵, 计算用户之间的相似度, 找出目标用户的最近邻居集合。最后, 对最近邻居集合进行加权, 从而产生目标用户的推荐集^[4]。其中近邻的选择是基于用户的协同过滤推荐算法最关键的一步^[5]。

然而, 现实应用环境中, 用户评分数据极其稀疏, 用户间的共同评分数量极少, 这种方法得到的用户间相似性的可靠性和准确性都难以保证。此外, 用户对物品的评分是多重因素的结果。用户可能并不是真正感兴趣, 只是对质量好的物品做出客观评价。用户打分还有可能受到当前推荐系统的影响^[6]。

针对上述问题, 研究人员提出多种改进方法优化近邻的选择以提高推荐准确度。具体到方法而言, 主要分为以下几类:

(1) 关于评分矩阵填充的方法, 有学者提出计算用户对某一物品的偏好度结合平均值对矩阵进行填充^[7], 还有学者通过属性的信息熵构造加权Jaccard系数相似度, 结合项目属性和评分的综合相似度, 依据项目的综合相似度预先对评分矩阵进行填充^[8]。但是, 这种方法存在信息失真或者填充值不可靠的问题, 反而会导致推荐质量的下降^[9]。

(2) 关于用户群体划分的方法很多, 有学者根据用户评分倾向性将其分为积极、消极评分两类用户群体, 然后在与目标用户评分一致的用户群体中计算得到近邻集合, 最后使用共同评分项进行修正^[10]。有学者为了利用所有评分信息, 提出全局、局部相似性计算方法, 并联合两者进行近邻选择^[11]。

(3) 在相似性阈值计算方面, 有学者提出采用相似性阈值过滤的近邻选择策略^[12]。还有学者先将所有邻居候选用户与目标用户的相似性均值设定为阈值, 动态选取与目标用户兴趣相似的用户集合, 然后以用户间的信任度为基准进行二次筛选^[13]。

上述文献虽然从不同角度提升了推荐的准确度, 但仍存在某些问题。首先, 在计算用户间相似性时没有考虑目标用户的影响, 认为每个共同项目的评分有相同的贡献度, 且不随目标项目而动态变化, 导致针对不同项目计算出目标与其他用户间的相似性结果保持不变。其次, 忽略了邻居用户对目标用户的推荐贡献能力, 导致近邻集合中与目标用户相似性较高但对其推荐能力较差的伪近邻比例增高, 导致推荐质量下降^[14]。

用户对一个物品的评分是多种因素的结果, 并不一定代表用户对物品真正感兴趣, 很有可能是对质量较高的物品做出的客观评价, 亦或是用户习惯了给出高分, 只有遇到质量较差的物品才给出低分。现有文献中, 鲜有从这个角度入手。有学者利用物品质量和用户评分偏好计算用户评分趋势和电影流行度趋势, 并利用决策函数预测用户评分^[15]。该算法改进了协同过滤中存在的扩展问题, 然而却简单地用平均分作为物品质量的评分依据。此外, 评分预测被简单地视作趋势的走向, 导致推荐精度下降。

针对上述问题, 本文在已有研究基础上利用物品的质量对已有评分矩阵进行修正, 改进了查找与目标用户兴趣相似的最近邻集合的准确度。

3 物品质量分析

在实际应用中, 推荐系统通常会给出公众对这项物品的评分结果作为用户参考, 常见的物品质量分析方法有平均分、链接分析法^[16]、贝叶斯估计法^[17], 还有物品评论情感分析^[18]等。一种评估物品质量的简单方式就是利用用户对物品打分的平均分。平均分可以反映用户对物品评分的总体情况, 也是基于用户的协同过滤推荐算法的重要组成部分, 但是这种方法也存在以下问题, 如对于消费较少的物品往往难以测度物品的真实质量、相关推荐算法易于被攻击等。

3.1 HITS算法

在HITS算法^[19]中, 每个网络节点被赋予两个属性: Hub属性和Authority属性。同时, 网络节点被分为两种: Hub节点和Authority节点。Hub是中心的意思, 所以Hub节点指那些包含很多指向Authority节点链接的节点, 比如国内的一些门户网站; Authority节点则指那些包含有实质性内容的节点。HITS算法的目的是当用户查询时, 返回给用户高质量的Authority节点。

利用用户和电影构建二部图结构, 其中的链接关系如图1所示。使用HITS算法进行迭代计算, 在权值稳定后迭代完成, 算法返回已经按权值排好序的Authority集, 即用户所观看的电影项目集合, 因为这些电影代表了能够满足用户观看情况的高质量电影集合。

图1

新窗口打开| 下载原图ZIP| 生成PPT

图1 用户电影二部图

使用HITS算法作为物品质量分析方法存在一些问题:

(1) 由于要进行大量迭代计算, 导致算法性能极其低下;

(2) HITS从机制上很容易被作弊者操纵;

(3) 新的物品由于评分较少, 迭代计算后其权值很小, 对新事物不太友好。

3.2 基于贝叶斯估计的物品质量评估

考虑如下两种情况: 电影A: 1条评分, 平均分5分; 电影B: 50条评分, 平均分为4.5分。直观上人们认为电影B的质量要优于电影A的质量, 这里需要去测度这两个电影的质量。

思路一: 设定阈值K, 利用评分数量高于K的部分计算平均分以评估电影的质量, 低于K的则暂时丢弃。然而这种方法存在以下问题: 如何去选定阈值K; 如果只有一个评分数大于K, 并且它的评分很低, 此时可能得出与事实相左的结论。

思路二: 基于贝叶斯估计的物品质量评估。贝叶斯估计既考虑到没有足够的数据通过均值进行估计, 又包含了其他观测值的所有数据。贝叶斯估计允许不直接计算有限数量的估计值, 而是计算出已知值的概率分布, 然后利用这个概率分布获取估计值。这个方法也是当前IMDB^[20]用来计算其Top250电影的方法, 如公式(1)所示。

(1)$WR=\frac{V}{V+\text{M}}\times R+\frac{M}{V+M}\times X$

其中, R表示电影的平均分, V表示电影的观看频次, M表示要进入榜单的最少观看频次, X表示整个榜单的平均观看次数。对公式(1)稍作改动, 得到公式(2)。

(2)$r=\frac{C\times m+\sum{ratings}}{C+N}$

其中, m代表评分值的先验, C代表对先验的置信度, N表示电影观看的频次。

设定m=3、C=5, 则电影A和电影B的评分分别是: ${{r}_{A}}=\frac{5\times 3+5\times 1}{5+1}=3.3$; ${{r}_{B}}=\frac{5\times 3+4.5\times 50}{5+50}=4.36$

可见电影B的质量比电影A的质量好, 符合最初的设想。

4 用户评分修正

考虑以下两种情况: 用户A对电影的评分是3、3、5, 用户B对相同电影的评分为5、5、5, 用户A和用户B对同一部电影的5分代表的意义不同。用户A对电影的5分可能代表他非常喜欢这部电影, 而用户B可能只是习惯于打高分。并且对一部高质量的电影, 用户也很少会打出低评分, 这会影响发掘用户的兴趣特征, 因此需要对现有评分矩阵进行修正, 利用修正后的评分反应用户对电影真实的兴趣。

用户对一部电影的评分是多重因素下的结果, 可以通过从用户原来的评分中剔除电影质量的贡献度, 得到用户对电影的兴趣度。定义公式修正用户对电影的评分, 称为兴趣度, 如公式(3)所示。

(3)${{\tau }_{u,i}}=\frac{{{r}_{u,i}}-{{q}_{i}}}{\overline{{{r}_{u}}}}$

兴趣度表示用户的评分和电影质量之间的差值, 可以为正值或负值。正值表明用户倾向于评分高于电影质量, 表明用户对电影感兴趣的程度。基于物品质量和用户评分修正的协同过滤算法如下所示。

算法1 基于物品质量和用户评分修正的协同过滤算法

输入: 完整的训练集用户评分矩阵

输出: 测试集用户的预测评分

过程:

①利用公式(2)计算训练集中每部电影i的电影质量;

②利用公式(3)计算训练集中每个用户u的评分兴趣度并输出兴趣度矩阵;

③将兴趣度矩阵计算皮尔逊系数并得到候选用户u的Top-N近邻;

④利用基于用户的协同过滤计算目标用户的预测评分。

5 实验说明

本文采用的数据集是明尼苏达大学GroupLens小组发布的最新MovieLens Latest数据集, 包含270 000个用户对45 000部电影的26 000 000条评分记录, 评分范围为1-5, 在数据集中随机划分80%作为训练集、20%作为测试集。

5.1 电影质量

对数据集分别使用平均分、HITS算法、贝叶斯估计方法得到排名前10的电影与从IMDB官网获取的Top250进行对比, 如表1所示。

表1 Item质量实验对比

Average	HITS	Bayes	IMDB
Planet Earth	Forrest Gump	The Shawshank Redemption	The Shawshank Redemption
The Shawshank Redemption	Pulp Fiction	The Godfather	The Godfather
The Usual Suspects	The Matrix	The Usual Suspects	The Godfather: Part II
Schindler’s List	The Shawshank Redemption	The Godfather: Part II	The Dark Knight
The Godfather: Part II	The Silence of the Lambs	Schindler’s List	12 Angry Men
12 Angry Men	Jurassic Park	Seven Samurai	Schindler’s List
Fight Club	Star Wars: Episode IV	Fight Club	The Lord of the Rings: The Return of the King
Pulp Fiction	Star Wars: Episode V	12 Angry Men	Pulp Fiction
Planet Earth	Terminator 2: Judgment Day	Spirited Away	Il buono, il brutto, il cattivo
Human Planet	Braveheart	Pulp Fiction	Fight Club

新窗口打开| 下载CSV

以IMDB Top250电影作为基准, 定义命中率为电影数量在IMDB Top250中的比率, 如公式(4)所示。

(4)$P=\frac{Q}{I}$

其中, Q为算法得到的电影, I代表IMDB Top250获取的电影。如表1中HITS排名前10的电影与IMDB中有2个重合, 则命中率为0.2, 贝叶斯排名前10的电影与IMDB有7个重合, 则命中率为0.7。三种电影质量的命中率如图2所示。

图2

新窗口打开| 下载原图ZIP| 生成PPT

图2 Item质量实验对比

从图2中可以看出, 随着电影数量的增加, Bayes计算出来的结果始终拥有最高的命中率。此外, 从表1中可以看出, 在Bayes方法中得到的结果与IMDB官网上Top250的排名位次也颇为接近。因此, 可以利用Bayes算法作为电影质量评估的依据。

5.2 针对评分修正的实验结果

考察用户的评分修正能否真正提高推荐的质量。本次实验采用基于用户的协同过滤推荐算法, 用户间的相似度采用皮尔逊相似度得到。实验目的在于验证用户评分修正的有效性, 相似度k在[0.4,0.9]内变动, 利用平均绝对误差(MAE)作为评估算法的度量指标, MAE越小则说明算法准确性越高。对比基于标准协同过滤(CF), 基于评分矩阵填充与用户兴趣(PICF)^[7], 基于目标用户近邻修正(TUNMCF)^[10], 以及本文所提修正的协同过滤方法(Fixed CF, FixCF), 实验对比结果如图3所示。

图3

新窗口打开| 下载原图ZIP| 生成PPT

图3 算法对比实验

从图3可以看出, 随着用户间相似度k的增大, 无论是传统的协同过滤方法还是改进后的协同过滤方法, MAE值都在变小, 推荐精度都在提升。而本文算法FixCF相较之下有更好的精度, 这表明用户评分修正的方法确实可以进一步提高推荐质量。

6 结语

本文在总结用户评分受物品质量和用户倾向性影响的基础上, 提出基于物品质量和用户评分修正的协同过滤推荐算法以提高推荐质量, 初步实现了预期的设计目标。该方法还存在需要进一步研究和改进之处, 主要有以下几点:

(1) 用户的评分偏好信息需要改进, 因为用户的评分偏好信息对推荐评分的预测有重大影响;

(2) 用户的兴趣度算法改进, 可以增加影响因子来修正物品质量对用户评分影响的大小;

(3) 用户的兴趣会随着时间而变化, 将时间信息纳入到计算之中。

作者贡献声明

焦富森, 李树青: 提出研究思路, 采集分析数据, 起草及修改论文;

焦富森: 进行实验。

利益冲突声明

所有作者声明不存在利益冲突关系。

支撑数据

支撑数据由作者自存储, E-mail: jiaorocks@gmail.com。

[1] 焦富森. ml-latest. ratings.csv. 实验数据集.

参考文献

原文顺序

文献年度倒序

文中引用次数倒序

被引期刊影响因子

[1]

许海玲, 吴潇, 李晓东 , 等.

互联网推荐系统比较研究

[J]. 软件学报, 2009,20(2):350-362.