Advanced Search

数据分析与知识发现, 2019, 3(8): 62-67 doi: 10.11925/infotech.2096-3467.2018.1000

研究论文

基于物品质量和用户评分修正的协同过滤推荐算法 *

焦富森, 李树青,,

南京财经大学信息工程学院 南京 210046

Collaborative Filtering Recommendation Based on Item Quality and User Ratings

Jiao Fusen, Li Shuqing,,

College of Information Engineering, Nanjing University of Finance & Economics, Nanjing 210046, China

通讯作者: 李树青, ORCID: 0000-0001-9814-5766, E-mail:leeshuqing@163.com

收稿日期: 2018-08-25   修回日期: 2018-10-30   网络出版日期: 2019-08-25

基金资助: *本文系江苏省研究生科研与实践创新计划项目“面向个性化推荐服务的互联网用户画像关键技术研究”.  KYCX17_1208
国家社会科学基金项目“基于大数据分析的数字图书馆个性化服务模式创新研究”的研究成果之一.  16BTQ030

Received: 2018-08-25   Revised: 2018-10-30   Online: 2019-08-25

摘要

【目的】在个性化推荐中, 考虑物品质量和用户评分倾向性对用户打分的影响, 提高推荐效果。【方法】提出一种改进的协同过滤推荐算法: 利用物品质量评估算法实现了用户评分修正, 可以改进查找与用户兴趣相似的最近邻过程, 并在此基础上进行推荐。【结果】利用MovieLens数据集进行测试, 与传统协同过滤算法相比, 改进算法的MAE提高4.7%; 与其他几种改进算法相比, 精确度均有不同程度的提高。【局限】只关注现有的评分修正, 并没有考虑用户的兴趣漂移, 在一定程度上影响推荐效果。【结论】本文提出的算法推荐结果更加精确, 有效地减少了物品质量和用户评分倾向性对推荐结果的影响, 提高了推荐质量。

关键词: 推荐系统 ; 协同过滤 ; 物品质量 ; 评分修正

Abstract

[Objective] This paper proposes a modified collaborative filtering algorithm, aiming to improve the results of personalized recommendations. [Methods] First, we evaluated item quality and corrected user ratings based on their previous records. Then, we identified users with similar interests to generate better recommendations. [Results] We tested the new algorithm on MovieLens dataset and found the MAE was 4.7% higher than those of the traditional or other modified methods. [Limitations] The new algorithm does not address the interests drifting issues. [Conclusions] The proposed algorithm could recommend products to consumers more effectively.

Keywords: Recommender System ; Collaborative Filtering ; Item Quality ; User Rating Correction

PDF (512KB) 元数据 多维度评价 相关文章 导出 EndNote| Ris| Bibtex  收藏本文

本文引用格式

焦富森, 李树青. 基于物品质量和用户评分修正的协同过滤推荐算法 *. 数据分析与知识发现[J], 2019, 3(8): 62-67 doi:10.11925/infotech.2096-3467.2018.1000

Jiao Fusen. Collaborative Filtering Recommendation Based on Item Quality and User Ratings. Data Analysis and Knowledge Discovery[J], 2019, 3(8): 62-67 doi:10.11925/infotech.2096-3467.2018.1000

1 引 言

近年, 网络的飞速发展引发了数据量的爆炸式增长。数据中蕴含着无穷的价值, 同时也引发了严重的“信息过载”问题。推荐系统是一种帮助用户快速发现有用信息的工具, 正逐步成为解决信息过载问题的主要发展方向。和搜索引擎不同的是, 推荐系统不需要用户提供明确的需求, 而是通过分析用户的历史行为给用户的兴趣建模, 从而主动向用户推荐能够满足其兴趣和需求的信息。

协同过滤算法是应用最广泛、同时也是发展比较成熟的一种推荐算法。其基本思想是根据用户的浏览记录、购买记录、评分记录或者主页的标注标签等历史信息, 向用户主动推荐信息或预测用户的兴趣偏好, 以实现个性化推荐。电商网站亚马逊的个性化推荐系统有着“推荐系统之王”的美誉, 其核心就是协同过滤算法。然而现有的协同过滤算法只考虑用户或物品之间的相似程度, 忽略了用户的评分是多重因素的结果, 可能是用户习惯于打出高分, 也有可能是用户对质量较好的物品做出的客观评价。现有协同过滤不能体现这些影响因素, 从而导致系统推荐的物品偏离了用户的真实喜好。因此, 如何在海量数据中有效发现用户的兴趣喜好成为推荐系统中一个重要的研究领域。

2 文献回顾

推荐算法是整个推荐系统中最核心和关键的部分, 在很大程度上决定了推荐系统性能的优劣。传统的推荐方法主要包括基于协同过滤的推荐方法、基于内容的推荐方法和混合推荐方法。其中协同过滤以其模型通用性强、不需要太多对应数据领域的专业知识、算法实现简单、推荐效果理想等优点成为工业界应用最为广泛的推荐算法[1]

主流的协同过滤推荐算法分为两类: 基于用户的协同过滤推荐算法[2]和基于项目的协同过滤推荐算 法[3]。基于用户的协同过滤基于这样一个假设: 如果用户对一些项目的评分比较相似, 则他们对其他项目的评分也比较相似。算法根据用户对项目的评分矩阵, 计算用户之间的相似度, 找出目标用户的最近邻居集合。最后, 对最近邻居集合进行加权, 从而产生目标用户的推荐集[4]。其中近邻的选择是基于用户的协同过滤推荐算法最关键的一步[5]

然而, 现实应用环境中, 用户评分数据极其稀疏, 用户间的共同评分数量极少, 这种方法得到的用户间相似性的可靠性和准确性都难以保证。此外, 用户对物品的评分是多重因素的结果。用户可能并不是真正感兴趣, 只是对质量好的物品做出客观评价。用户打分还有可能受到当前推荐系统的影响[6]

针对上述问题, 研究人员提出多种改进方法优化近邻的选择以提高推荐准确度。具体到方法而言, 主要分为以下几类:

(1) 关于评分矩阵填充的方法, 有学者提出计算用户对某一物品的偏好度结合平均值对矩阵进行填充[7], 还有学者通过属性的信息熵构造加权Jaccard系数相似度, 结合项目属性和评分的综合相似度, 依据项目的综合相似度预先对评分矩阵进行填充[8]。但是, 这种方法存在信息失真或者填充值不可靠的问题, 反而会导致推荐质量的下降[9]

(2) 关于用户群体划分的方法很多, 有学者根据用户评分倾向性将其分为积极、消极评分两类用户群体, 然后在与目标用户评分一致的用户群体中计算得到近邻集合, 最后使用共同评分项进行修正[10]。有学者为了利用所有评分信息, 提出全局、局部相似性计算方法, 并联合两者进行近邻选择[11]

(3) 在相似性阈值计算方面, 有学者提出采用相似性阈值过滤的近邻选择策略[12]。还有学者先将所有邻居候选用户与目标用户的相似性均值设定为阈值, 动态选取与目标用户兴趣相似的用户集合, 然后以用户间的信任度为基准进行二次筛选[13]

上述文献虽然从不同角度提升了推荐的准确度, 但仍存在某些问题。首先, 在计算用户间相似性时没有考虑目标用户的影响, 认为每个共同项目的评分有相同的贡献度, 且不随目标项目而动态变化, 导致针对不同项目计算出目标与其他用户间的相似性结果保持不变。其次, 忽略了邻居用户对目标用户的推荐贡献能力, 导致近邻集合中与目标用户相似性较高但对其推荐能力较差的伪近邻比例增高, 导致推荐质量下降[14]

用户对一个物品的评分是多种因素的结果, 并不一定代表用户对物品真正感兴趣, 很有可能是对质量较高的物品做出的客观评价, 亦或是用户习惯了给出高分, 只有遇到质量较差的物品才给出低分。现有文献中, 鲜有从这个角度入手。有学者利用物品质量和用户评分偏好计算用户评分趋势和电影流行度趋势, 并利用决策函数预测用户评分[15]。该算法改进了协同过滤中存在的扩展问题, 然而却简单地用平均分作为物品质量的评分依据。此外, 评分预测被简单地视作趋势的走向, 导致推荐精度下降。

针对上述问题, 本文在已有研究基础上利用物品的质量对已有评分矩阵进行修正, 改进了查找与目标用户兴趣相似的最近邻集合的准确度。

3 物品质量分析

在实际应用中, 推荐系统通常会给出公众对这项物品的评分结果作为用户参考, 常见的物品质量分析方法有平均分、链接分析法[16]、贝叶斯估计法[17], 还有物品评论情感分析[18]等。一种评估物品质量的简单方式就是利用用户对物品打分的平均分。平均分可以反映用户对物品评分的总体情况, 也是基于用户的协同过滤推荐算法的重要组成部分, 但是这种方法也存在以下问题, 如对于消费较少的物品往往难以测度物品的真实质量、相关推荐算法易于被攻击等。

3.1 HITS算法

在HITS算法[19]中, 每个网络节点被赋予两个属性: Hub属性和Authority属性。同时, 网络节点被分为两种: Hub节点和Authority节点。Hub是中心的意思, 所以Hub节点指那些包含很多指向Authority节点链接的节点, 比如国内的一些门户网站; Authority节点则指那些包含有实质性内容的节点。HITS算法的目的是当用户查询时, 返回给用户高质量的Authority节点。

利用用户和电影构建二部图结构, 其中的链接关系如图1所示。使用HITS算法进行迭代计算, 在权值稳定后迭代完成, 算法返回已经按权值排好序的Authority集, 即用户所观看的电影项目集合, 因为这些电影代表了能够满足用户观看情况的高质量电影集合。

图1

图1   用户电影二部图


使用HITS算法作为物品质量分析方法存在一些问题:

(1) 由于要进行大量迭代计算, 导致算法性能极其低下;

(2) HITS从机制上很容易被作弊者操纵;

(3) 新的物品由于评分较少, 迭代计算后其权值很小, 对新事物不太友好。

3.2 基于贝叶斯估计的物品质量评估

考虑如下两种情况: 电影A: 1条评分, 平均分5分; 电影B: 50条评分, 平均分为4.5分。直观上人们认为电影B的质量要优于电影A的质量, 这里需要去测度这两个电影的质量。

思路一: 设定阈值K, 利用评分数量高于K的部分计算平均分以评估电影的质量, 低于K的则暂时丢弃。然而这种方法存在以下问题: 如何去选定阈值K; 如果只有一个评分数大于K, 并且它的评分很低, 此时可能得出与事实相左的结论。

思路二: 基于贝叶斯估计的物品质量评估。贝叶斯估计既考虑到没有足够的数据通过均值进行估计, 又包含了其他观测值的所有数据。贝叶斯估计允许不直接计算有限数量的估计值, 而是计算出已知值的概率分布, 然后利用这个概率分布获取估计值。这个方法也是当前IMDB[20]用来计算其Top250电影的方法, 如公式(1)所示。

$WR=\frac{V}{V+\text{M}}\times R+\frac{M}{V+M}\times X$

其中, R表示电影的平均分, V表示电影的观看频次, M表示要进入榜单的最少观看频次, X表示整个榜单的平均观看次数。对公式(1)稍作改动, 得到公式(2)。

$r=\frac{C\times m+\sum{ratings}}{C+N}$

其中, m代表评分值的先验, C代表对先验的置信度, N表示电影观看的频次。

设定m=3、C=5, 则电影A和电影B的评分分别是: ${{r}_{A}}=\frac{5\times 3+5\times 1}{5+1}=3.3$; ${{r}_{B}}=\frac{5\times 3+4.5\times 50}{5+50}=4.36$

可见电影B的质量比电影A的质量好, 符合最初的设想。

4 用户评分修正

考虑以下两种情况: 用户A对电影的评分是3、3、5, 用户B对相同电影的评分为5、5、5, 用户A和用户B对同一部电影的5分代表的意义不同。用户A对电影的5分可能代表他非常喜欢这部电影, 而用户B可能只是习惯于打高分。并且对一部高质量的电影, 用户也很少会打出低评分, 这会影响发掘用户的兴趣特征, 因此需要对现有评分矩阵进行修正, 利用修正后的评分反应用户对电影真实的兴趣。

用户对一部电影的评分是多重因素下的结果, 可以通过从用户原来的评分中剔除电影质量的贡献度, 得到用户对电影的兴趣度。定义公式修正用户对电影的评分, 称为兴趣度, 如公式(3)所示。

${{\tau }_{u,i}}=\frac{{{r}_{u,i}}-{{q}_{i}}}{\overline{{{r}_{u}}}}$

兴趣度表示用户的评分和电影质量之间的差值, 可以为正值或负值。正值表明用户倾向于评分高于电影质量, 表明用户对电影感兴趣的程度。基于物品质量和用户评分修正的协同过滤算法如下所示。

算法1 基于物品质量和用户评分修正的协同过滤算法

输入: 完整的训练集用户评分矩阵

输出: 测试集用户的预测评分

过程:

①利用公式(2)计算训练集中每部电影i的电影质量;

②利用公式(3)计算训练集中每个用户u的评分兴趣度并输出兴趣度矩阵;

③将兴趣度矩阵计算皮尔逊系数并得到候选用户u的Top-N近邻;

④利用基于用户的协同过滤计算目标用户的预测评分。

5 实验说明

本文采用的数据集是明尼苏达大学GroupLens小组发布的最新MovieLens Latest数据集, 包含270 000个用户对45 000部电影的26 000 000条评分记录, 评分范围为1-5, 在数据集中随机划分80%作为训练集、20%作为测试集。

5.1 电影质量

对数据集分别使用平均分、HITS算法、贝叶斯估计方法得到排名前10的电影与从IMDB官网获取的Top250进行对比, 如表1所示。

表1   Item质量实验对比

AverageHITSBayesIMDB
Planet EarthForrest GumpThe Shawshank RedemptionThe Shawshank Redemption
The Shawshank RedemptionPulp FictionThe GodfatherThe Godfather
The Usual SuspectsThe MatrixThe Usual SuspectsThe Godfather: Part II
Schindler’s ListThe Shawshank RedemptionThe Godfather: Part IIThe Dark Knight
The Godfather: Part IIThe Silence of the LambsSchindler’s List12 Angry Men
12 Angry MenJurassic ParkSeven SamuraiSchindler’s List
Fight ClubStar Wars: Episode IVFight ClubThe Lord of the Rings: The Return of the King
Pulp FictionStar Wars: Episode V12 Angry MenPulp Fiction
Planet EarthTerminator 2: Judgment DaySpirited AwayIl buono, il brutto, il cattivo
Human PlanetBraveheartPulp FictionFight Club

新窗口打开| 下载CSV


以IMDB Top250电影作为基准, 定义命中率为电影数量在IMDB Top250中的比率, 如公式(4)所示。

$P=\frac{Q}{I}$

其中, Q为算法得到的电影, I代表IMDB Top250获取的电影。如表1中HITS排名前10的电影与IMDB中有2个重合, 则命中率为0.2, 贝叶斯排名前10的电影与IMDB有7个重合, 则命中率为0.7。三种电影质量的命中率如图2所示。

图2

图2   Item质量实验对比


图2中可以看出, 随着电影数量的增加, Bayes计算出来的结果始终拥有最高的命中率。此外, 从表1中可以看出, 在Bayes方法中得到的结果与IMDB官网上Top250的排名位次也颇为接近。因此, 可以利用Bayes算法作为电影质量评估的依据。

5.2 针对评分修正的实验结果

考察用户的评分修正能否真正提高推荐的质量。本次实验采用基于用户的协同过滤推荐算法, 用户间的相似度采用皮尔逊相似度得到。实验目的在于验证用户评分修正的有效性, 相似度k在[0.4,0.9]内变动, 利用平均绝对误差(MAE)作为评估算法的度量指标, MAE越小则说明算法准确性越高。对比基于标准协同过滤(CF), 基于评分矩阵填充与用户兴趣(PICF)[7], 基于目标用户近邻修正(TUNMCF)[10], 以及本文所提修正的协同过滤方法(Fixed CF, FixCF), 实验对比结果如图3所示。

图3

图3   算法对比实验


图3可以看出, 随着用户间相似度k的增大, 无论是传统的协同过滤方法还是改进后的协同过滤方法, MAE值都在变小, 推荐精度都在提升。而本文算法FixCF相较之下有更好的精度, 这表明用户评分修正的方法确实可以进一步提高推荐质量。

6 结 语

本文在总结用户评分受物品质量和用户倾向性影响的基础上, 提出基于物品质量和用户评分修正的协同过滤推荐算法以提高推荐质量, 初步实现了预期的设计目标。该方法还存在需要进一步研究和改进之处, 主要有以下几点:

(1) 用户的评分偏好信息需要改进, 因为用户的评分偏好信息对推荐评分的预测有重大影响;

(2) 用户的兴趣度算法改进, 可以增加影响因子来修正物品质量对用户评分影响的大小;

(3) 用户的兴趣会随着时间而变化, 将时间信息纳入到计算之中。

作者贡献声明

焦富森, 李树青: 提出研究思路, 采集分析数据, 起草及修改 论文;

焦富森: 进行实验。

利益冲突声明

所有作者声明不存在利益冲突关系。

支撑数据

支撑数据由作者自存储, E-mail: jiaorocks@gmail.com。

[1] 焦富森. ml-latest. ratings.csv. 实验数据集.

参考文献

许海玲, 吴潇, 李晓东 , .

互联网推荐系统比较研究

[J]. 软件学报, 2009,20(2):350-362.

[本文引用: 1]

( Xu Hailing, Wu Xiao, Li Xiaodong , et al.

Comparison Study of Internet Recommendation System

[J]. Journal of Software, 2009,20(2):350-362.)

[本文引用: 1]

邓爱林, 朱扬勇, 施伯乐 .

基于项目评分预测的协同过滤推荐算法

[J]. 软件学报, 2003,14(9):1621-1628.

[本文引用: 1]

( Deng Ailin, Zhu Yangyong, Shi Bole .

A Collaborative Filtering Recommendation Algorithm Based on Item Rating Prediction

[J]. Journal of Software, 2003,14(9):1621-1628.)

[本文引用: 1]

Linden G, Smith B, York J .

Amazon.com Recommendations: Item-to-Item Collaborative Filtering

[J]. IEEE Internet Computing, 2003,7(1):76-80.

[本文引用: 1]

马宏伟, 张光卫, 李鹏 .

协同过滤推荐算法综述

[J]. 小型微型计算机系统, 2009,30(7):1282-1288.

[本文引用: 1]

( Ma Hongwei, Zhang Guangwei, Li Peng .

Survey of Collaborative Filtering Algorithms

[J]. Journal of Chinese Computer Systems, 2009,30(7):1282-1288.)

[本文引用: 1]

Kaleli C .

An Entropy-Based Neighbor Selection Approach for Collaborative Filtering

[J]. Knowledge-Based Systems, 2014,56:273-280.

[本文引用: 1]

Cosley D, Lam S K, Albert I, et al.

Is Seeing Believing?: How Recommender System Interfaces Affect Users’ Opinions

[C]//Proceedings of the SIGCHI Conference on Human Factors in Computing Systems. ACM, 2003: 585-592.

[本文引用: 1]

韩亚楠, 曹菡, 刘亮亮 .

基于评分矩阵填充与用户兴趣的协同过滤推荐算法

[J]. 计算机工程, 2016,42(1):36-40.

DOI:10.3969/j.issn.1000-3428.2016.01.007      Magsci     [本文引用: 2]

针对传统协同过滤推荐算法评分矩阵稀疏和推荐精度不高的问题,提出一种改进的协同过滤推荐算法。通过用户属性偏好和项目流行度计算用户对项目的偏好度,结合用户平均评分对评分矩阵中未评分项目进行填充。考虑到用户兴趣随时间的变化,将基于时间的兴趣度权重函数和偏好度引入到项目相似度计算和推荐过程中,确定项目最近邻集合,从而实现最优推荐。实验结果表明,与传统协同过滤推荐算法相比,该算法较准确地反映了用户的兴趣变化趋势,并且在有效解决评分矩阵稀疏问题的同时提高了推荐准确率。

( Han Ya’nan, Cao Han, Liu Liangliang .

Collaborative Filtering Recommendation Algorithm Based on Score Matrix Filling and User Interest

[J]. Computer Engineering, 2016,42(1):36-40.)

DOI:10.3969/j.issn.1000-3428.2016.01.007      Magsci     [本文引用: 2]

针对传统协同过滤推荐算法评分矩阵稀疏和推荐精度不高的问题,提出一种改进的协同过滤推荐算法。通过用户属性偏好和项目流行度计算用户对项目的偏好度,结合用户平均评分对评分矩阵中未评分项目进行填充。考虑到用户兴趣随时间的变化,将基于时间的兴趣度权重函数和偏好度引入到项目相似度计算和推荐过程中,确定项目最近邻集合,从而实现最优推荐。实验结果表明,与传统协同过滤推荐算法相比,该算法较准确地反映了用户的兴趣变化趋势,并且在有效解决评分矩阵稀疏问题的同时提高了推荐准确率。

彭石, 周志彬, 王国军 .

基于评分矩阵预填充的协同过滤算法

[J]. 计算机工程, 2013,39(1):175-178.

DOI:10.3969/j.issn.1000-3428.2013.01.037      Magsci     [本文引用: 1]

随着用户和项目数量的增长,用户-项目评分矩阵变得极其稀疏,导致基于相似度计算的推荐算法精度降低。为此,提出一种基于加权Jaccard系数的综合项目相似度度量方法,使用项目综合相似度对评分矩阵进行预填充。实验结果表明,在用户-项目评分矩阵极其稀疏的情况下,该算法能产生比传统算法更精确的推荐结果。

( Peng Shi, Zhou Zhibin, Wang Guojun .

Collaborative Filtering Algorithm Based on Rating Matrix Pre-filling

[J]. Computer Engineering, 2013,39(1):175-178.)

DOI:10.3969/j.issn.1000-3428.2013.01.037      Magsci     [本文引用: 1]

随着用户和项目数量的增长,用户-项目评分矩阵变得极其稀疏,导致基于相似度计算的推荐算法精度降低。为此,提出一种基于加权Jaccard系数的综合项目相似度度量方法,使用项目综合相似度对评分矩阵进行预填充。实验结果表明,在用户-项目评分矩阵极其稀疏的情况下,该算法能产生比传统算法更精确的推荐结果。

贾伟洋, 李书琴, 李昕宇 , .

基于离散量和用户兴趣贴近度的协同过滤推荐算法

[J]. 计算机工程, 2018,44(1):226-232.

Magsci     [本文引用: 1]

针对传统协同过滤算法在计算用户相似度过程中,由于数据稀疏性导致的无法计算、失真、虚高等问题,提出一种融合离散量和兴趣贴近度的相似度度量方法。收集用户对项目的评分数据,从全信息量角度进行分析,通过引入离散量相关理论进行用户评分向量间的相似度计算,对评分相似的用户进行初步筛选,利用用户兴趣贴近度对相似度结果进行进一步加权处理,得到融合用户兴趣偏好信息的相似度结果,以此为基础,采用协同过滤算法进行个性化推荐。实验结果表明,该算法可有效提高信息推荐系统的推荐质量,在数据极端稀疏的情况下也能保持较好的性能。

( Jia Weiyang, Li Shuqin, Li Xinyu , et al.

Collaborative Filtering Recommendation Algorithm Based on Discrete Quantity and User Interests Approach Degree

[J]. Computer Engineering, 2018,44(1):226-232.)

Magsci     [本文引用: 1]

针对传统协同过滤算法在计算用户相似度过程中,由于数据稀疏性导致的无法计算、失真、虚高等问题,提出一种融合离散量和兴趣贴近度的相似度度量方法。收集用户对项目的评分数据,从全信息量角度进行分析,通过引入离散量相关理论进行用户评分向量间的相似度计算,对评分相似的用户进行初步筛选,利用用户兴趣贴近度对相似度结果进行进一步加权处理,得到融合用户兴趣偏好信息的相似度结果,以此为基础,采用协同过滤算法进行个性化推荐。实验结果表明,该算法可有效提高信息推荐系统的推荐质量,在数据极端稀疏的情况下也能保持较好的性能。

张佳, 林耀进, 林梦雷 , .

基于目标用户近邻修正的协同过滤算法

[J]. 模式识别与人工智能, 2015,28(9):802-810.

DOI:10.16451/j.cnki.issn1003-6059.201509005      Magsci     [本文引用: 2]

在基于用户的协同过滤算法中,用户评分倾向性和评分矩阵的稀疏性致使难以准确可靠地搜寻目标用户的近邻.基于此,文中提出基于目标用户近邻修正的协同过滤算法.首先定义积极评分和消极评分两类用户群体,选择从目标用户评分倾向性一致的用户群体中寻找其近邻.然后对与目标用户共同评分项数量少而相似度可能高的近邻进行修正,为目标用户寻找更准确的近邻集合.实验表明,文中算法在一定程度上能有效提高推荐质量.

( Zhang Jia, Lin Yaojin, Lin Menglei , et al.

Target User’s Neighbors Modification Based Collaborative Filtering

[J]. Pattern Recognition and Artificial Intelligence, 2015,28(9):802-810.)

DOI:10.16451/j.cnki.issn1003-6059.201509005      Magsci     [本文引用: 2]

在基于用户的协同过滤算法中,用户评分倾向性和评分矩阵的稀疏性致使难以准确可靠地搜寻目标用户的近邻.基于此,文中提出基于目标用户近邻修正的协同过滤算法.首先定义积极评分和消极评分两类用户群体,选择从目标用户评分倾向性一致的用户群体中寻找其近邻.然后对与目标用户共同评分项数量少而相似度可能高的近邻进行修正,为目标用户寻找更准确的近邻集合.实验表明,文中算法在一定程度上能有效提高推荐质量.

Anand D, Bharadwaj K K .

Utilizing Various Sparsity Measures for Enhancing Accuracy of Collaborative Recommender Systems Based on Local and Global Similarities

[J]. Expert Systems with Applications, 2011,38(5):5101-5109.

[本文引用: 1]

Kim T H, Yang S B.

An Effective Threshold-Based Neighbor Selection in Collaborative Filtering

[C]// Proceedings of the 29th European Conference on IR Research. Springer, 2007: 712-715.

[本文引用: 1]

贾冬艳, 张付志 .

基于双重邻居选取策略的协同过滤推荐算法

[J]. 计算机研究与发展, 2013,50(5):1076-1084.

Magsci     [本文引用: 1]

协同过滤是电子商务推荐系统中应用最成功的推荐技术之一,但是传统的协同过滤推荐算法存在推荐精度低和抗攻击能力差的缺陷.针对这些问题,提出了一种基于双重邻居选取策略的协同过滤推荐算法.首先基于用户相似度计算的结果,动态选取目标用户的兴趣相似用户集.然后提出了一种用户信任计算模型,根据用户的评分信息,计算得到目标用户对兴趣相似用户的信任度,并以此作为选取可信邻居用户的依据.最后,利用双重邻居选取策略,完成对目标用户的推荐.实验结果表明该算法不仅提高了系统推荐精度,而且具有较强的抗攻击能力.

( Jia Dongyan, Zhang Fuzhi .

A Collaborative Filtering Recommendation Algorithm Based on Double Neighbor Choosing Strategy

[J]. Journal of Computer Research and Development, 2013,50(5):1076-1084.)

Magsci     [本文引用: 1]

协同过滤是电子商务推荐系统中应用最成功的推荐技术之一,但是传统的协同过滤推荐算法存在推荐精度低和抗攻击能力差的缺陷.针对这些问题,提出了一种基于双重邻居选取策略的协同过滤推荐算法.首先基于用户相似度计算的结果,动态选取目标用户的兴趣相似用户集.然后提出了一种用户信任计算模型,根据用户的评分信息,计算得到目标用户对兴趣相似用户的信任度,并以此作为选取可信邻居用户的依据.最后,利用双重邻居选取策略,完成对目标用户的推荐.实验结果表明该算法不仅提高了系统推荐精度,而且具有较强的抗攻击能力.

于阳, 于洪涛, 黄瑞阳 .

基于熵优化近邻选择的协同过滤推荐算法

[J]. 计算机应用研究, 2017,34(9):2618-2623.

[本文引用: 1]

( Yu Yang, Yu Hongtao, Huang Ruiyang .

Collaborative Filtering Recommendation Algorithm Based on Entropy Optimization Nearest-neighbor Selection

[J]. Application Research of Computers, 2017,34(9):2618-2623.)

[本文引用: 1]

Guan Y, Cai S, Shang M .

Recommendation Algorithm Based on Item Quality and User Rating Preferences

[J]. Frontiers of Computer Science, 2014,8(2):289-297.

[本文引用: 1]

Page L, Brin S, Motwani R , et al.

The PageRank Citation Ranking: Bringing Order to the Web[R]

Stanford InfoLab, 1999.

[本文引用: 1]

Radde S, Freitag B.

Using Bayesian Networks to Infer Product Rankings from User Needs

[C]// Proceedings of the UMAP 2010 Workshop on Intelligent Techniques for Web Personalization and Recommender Systems. 2010.

[本文引用: 1]

侯银秀, 李伟卿, 王伟军 , .

基于用户偏好与商品属性情感匹配的图书个性化推荐研究

[J]. 数据分析与知识发现, 2017,1(8):9-17.

[本文引用: 1]

( Hou Yinxiu, Li Weiqing, Wang Weijun , et al.

Personalized Book Recommendation Based on User Preferences and Commodity Features

[J]. Data Analysis and Knowledge Discovery, 2017,1(8):9-17.)

[本文引用: 1]

Kleinberg J M .

Authoritative Sources in a Hyperlinked Environment

[J]. Journal of the ACM, 1999,46(5):604-632.

[本文引用: 1]

IMDB. Ratings and Reviews for New Movies and TV Shows - IMDb[EB/OL].[2019-08-01]. .

URL     [本文引用: 1]

/

版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn