王代琳, 刘丽娜, 刘美玲, 刘亚秋
[目的]针对现有的推荐算法多以根据图书的书名、关键字、摘要进行推荐,或根据读者的图书浏览行为挖掘读者兴趣偏好进行推荐,而忽略了读者对于图书的内容框架——目录的关注,为了解决现有方法缺乏表达读者对于图书目录的关注而导致推荐准确度不高的问题,本文提出一种基于图书目录注意力机制的读者偏好分析方法及其个性化推荐模型IABiLSTM。
[方法]根据图书标题和目录内容提取出图书的语义特征:利用BiLSTM网络捕获文本的长距离依赖和语序上下文信息,使用双层Self-Attention机制增强图书目录特征更深层次的语义表达;分析读者历史浏览行为,使用兴趣函数拟合量化读者兴趣度;将图书的语义特征和读者兴趣度相结合生成读者偏好向量,计算候选图书语义特征向量和读者偏好向量的相似度来预测评分完成个性化图书推荐。
[结果]模型分别在豆瓣读书和Amazon两个数据集上对MSE、Precision、Recall三项指标进行了考察,当N值为50时结果分别为1.14%和1.20%、89%和75%、85%和73%,优于对比模型,验证本文模型有效提升了图书推荐的准确度。
[局限]模型仅在豆瓣读书和Amazon两个数据集上进行了验证,在其他数据集上的泛化性能有待进一步验证。
[结论]本文通过提高对图书目录的注意力关注度和对读者历史浏览交互行为的分析,有效表达读者的兴趣偏好,为提高图书推荐的准确度做了重要贡献。本文所提模型不仅适用于基于图书内容和读者浏览行为隐形偏好挖掘的推荐任务,在其他常见的NLP任务中亦能提供重要的借鉴意义。