基于商品领域知识的交互式推荐系统
胡新明, 罗建军, 夏火松
武汉纺织大学管理学院 武汉 430200
通讯作者: 胡新明:E-mail:huxinming@sina.com

作者贡献声明:

胡新明, 夏火松: 提出研究命题和研究思路、设计研究方案;

胡新明, 罗建军: 设计与开发原型系统, 实施研究过程, 获取与分析数据, 起草论文;

胡新明: 论文最终版本修订。

摘要

【目的】 研究缺少消费者行为信息的情况下, 商品信息推荐系统的框架和流程。【应用背景】推荐系统是解决信息过剩问题的有效手段, 但是过度依赖消费者行为信息的推荐过程会遇到系统的冷启动问题, 也会引起消费者对隐私问题的忧虑。【方法】 在推荐过程中引入商品领域知识, 以交互的方式将消费者对商品定性的用途需求转变为消费者对商品定量的属性需求, 为消费者推荐合适的商品信息。【结果】 设计构建原型系统, 实验结果表明消费者对该推荐过程有较高的满意度。【结论】 本文提出的方法能够在一定程度上解决推荐系统的冷启动问题和隐私保护问题。

关键词: 推荐系统; 冷启动; 隐私保护; 商品领域知识
中图分类号:TP391
Research on Interactive Recommender System Based on Commodity Domain Knowledge
Hu Xinming, Luo Jianjun, Xia Huosong
School of Management, Wuhan Textile University, Wuhan 430200, China
Abstract

[Objective] This paper researches the flow and framework of commodity information recommender system in the absence of consumers behavior information. [Context] Recommender system is an effective means to reduce information overload. But for the overreliance on consumers behavior information, it may have the cold-start problem, and raise consumer’s privacy concerns also.[Methods] With the help of commodity domain knowledge, the interactive recommender system ascertains the consumer’s commodity quanticational attribute requirement according to the rough use demand, and then recommends the right product information to the consumer.[Results] A prototype system is designed for experimental study, and the results show high customer satisfactions.[Conclusions] The proposed method can solve the cold-start problem and consumer’s privacy concerns to some extent.

Keyword: Recommender system; Cold-start problem; Privacy protection; Commodity domain knowledge
1 引言

通过国际互联网能够快速地获取针对任何主题的大量信息, 这些信息不仅在数量上经常会超越人们正常的信息处理能力, 而且在质量及可信度上也可能是良莠不齐的, 在决策过程中人们会经常发现自己真正需要的或感兴趣的信息被掩埋在大量无关的信息甚至是垃圾信息中, 这就是电子商务时代的信息过载问题[ 1]。电子商务时代困扰人类的不再是信息的贫乏, 而是信息的过剩, 是如何快速高效地在过量的信息中找到自己真正需要而有用的信息。

电子商务推荐系统被认为是最有可能解决信息过载问题的智能代理软件, 它能够预测消费者的需求, 主动而智能展示消费者最可能感兴趣的信息[ 2]。近年来很多网站尝试借助推荐系统将浏览者转变为真正的消费者, 提高企业的盈利能力和消费者的忠诚度[ 3]。尽管采用推荐方法可能略有不同, 目前的推荐系统大多数包括对消费者行为信息的学习过程[ 4], 通过收集并保存消费者对相关商品的显性或隐性的评分, 分析学习消费者的偏好模型, 进而预测并个性化地展示消费者最可能感兴趣的商品信息, 在这种推荐过程中如果收集的用户信息较少, 冷启动问题和稀疏矩阵问题就会影响推荐的准确性, 如果超过一定期限用户还不能感受到推荐信息的有用性, 他们就可能不再使用推荐系统[ 5], 而大量收集用户行为信息和个人数据又会引起用户对隐私的忧虑从而拒绝使用推荐系统[ 6]。本文尝试在推荐过程中引入专家商品领域知识, 在尽可能少地收集和使用用户行为信息的前提下进行商品推荐, 使推荐系统在冷启动和用户隐私保护情况下仍能正常发挥作用。

2 相关工作

为了能够准确预测用户的需求, 国内外学者针对影响推荐效果的稀疏矩阵和冷启动问题进行广泛的探讨并取得了丰富的成果。总体上可以将这些解决方法分为三种类型:

(1) 尝试采用多种途径收集用户的历史行为信息, 如要求用户根据自己的偏好对商品进行预评分[ 7], 通过多种途径获取用户的显式和隐式反馈信息并预估用户对商品的评分[ 8];

(2) 借助数据挖掘技术和人工智能算法尝试从用户行为数据中发现更多的潜在的用户偏好信息, 如利用聚类方法、SVD方法或人工智能算法对用户–项目评分矩阵进行降维预处理[ 9];

(3) 系统中引入其他系统共享的信息或外部知识, 例如借助领域本体中结点、边、深度和密度表达语义知识进行商品相似性的计算[ 10], 基于案例推理的思想, 借助商品特征信息与用户交互以确定符合用户特征需求的合适商品[ 11]

推荐系统所涉及到的隐私问题近年来也引起学者们的广泛关注。相关研究表明虽然大多数用户愿意为享受个性化服务而牺牲一些隐私, 但是消费者仍然会担心自己的隐私被企业滥用甚至非法使用[ 12], 这种担忧不仅会影响消费者向系统显性提交自己偏好信息的意愿, 还会降低消费者对推荐系统的使用意愿和对推荐系统的满意度[ 13]。因此, 如果可能, 推荐系统应该使用通用的信息而不是涉及用户隐私的细节信息来推测用户的兴趣, 减少系统需要保存的消费者的个人信息[ 14], 或者把消费者的信息保存在可以控制的客户端, 就能够在一定程度上降低消费者在使用推荐系统过程中对隐私问题的担忧[ 13]

虽然现有的研究成果能够明显提升推荐结果的准确性, 但还是存在一些值得探讨的问题。由于借助人工智能和外部知识的方法作用机理主要是提高信息的利用效率, 在完全缺乏用户行为信息的新系统或新用户的冷启动情况下, 上述方法很难发挥作用。用户预评分的方法由于需要付出额外的时间而可能遭到用户拒绝, 获取用户隐性反馈的方式更可能加剧用户对隐私保护的担忧。而目前对隐私问题的探讨多数集中在隐私保护影响用户使用推荐系统的程度方面, 提出的解决方案是以用户对系统的承诺或行为规范的信任为基础, 仍然难以消除用户尤其是冷启动系统中的新用户对隐私信息被侵犯的担忧。

与现有的研究不同, 本文从消费者需求满足的视角探讨推荐系统的冷启动问题和隐私保护问题。以规划行为理论和目标手段链模型为依据, 提出基于商品领域知识的交互式推荐系统的框架和流程, 消费者通过实时交互的方式向系统提交或确认自己对商品简要的用途需求或功能需求, 系统在专家商品知识库的支撑下智能地为消费者推荐可能满足其用途需求的商品。由于推荐过程不依赖也不需要保存消费者的行为信息, 因此可以在一定程度上避免传统推荐系统所面临的冷启动问题和隐私保护问题。

3 交互式推荐系统分析与设计
3.1 理论基础

规划行为理论和目标手段链模型是目前解释消费者行为的两种流行理论。规划行为理论认为人是理性的, 任何行为的发生取决于行为意图, 而个体对行为的态度、主观规范和行为控制的感知三者共同对行为意图产生决定性的影响[ 15]。目标手段链模型将消费者对商品定性的感知价值与定量的商品属性联系起来, 认为商品的属性决定了商品的功能, 商品的功能决定了商品的用途, 每个类型的商品都有多种不同的用途, 商品能够在多大程度上满足消费者的某种具体用途需求是由决定商品功能的商品属性决定的[ 16]。结合规划行为理论和目标手段链模型, 本文提出消费者选购商品过程中态度的形成和影响模型, 如 图1所示:

图1 商品选购态度的形成与影响模型

该模型是本文推荐系统分析和设计的理论基础, 认为消费者选购商品的过程是一个目标导向的决策过程, 消费者根据商品的不同配置属性, 对商品满足自己期望用途的可能性进行预测和评估, 进而形成对某个商品的购买态度, 推荐系统的目标就是帮助用户完成这样的决策过程。

3.2 工作流程

图2是基于商品领域知识的交互式推荐系统的工作流程:

图2 推荐系统的工作流程

当消费者登录系统并选择想要购买的某种商品后, 系统会向消费者展示该类商品的主要可能用途, 消费者选择自己购买该类商品的主要用途需求。系统依据商品领域知识确定满足消费者用途需求的商品应具备的功能特征并展示给消费者, 包括商品功能种类以及各功能对应的权重信息, 功能的权重值越大, 表明推荐系统认为该项功能相对较好的商品更能满足消费者的用途需求。对商品功能有一定了解的消费者如果觉得系统给出的功能特征不太符合自己的实际用途需求, 可以利用推荐系统的功能交互界面修改相应的功能特征权重值; 对商品不是很了解的消费者可以直接确认提交系统给出的商品功能特征。系统再根据消费者提交的功能特征需求和商品领域知识计算具备某种配置属性的商品推荐度, 并将推荐度超过指定阈值的商品信息展示给消费者, 消费者可以从中选择购买自己满意的商品。

3.3 系统架构

本文提出的推荐系统包括消费者子系统和专家子系统, 图3为系统的架构图。为了提供友好的用户交互界面, 提高系统的开发效率, 降低系统的发布成本和维护成本, 消费者子系统采用三层B/S运行模式, 在设计和开发过程中采用MVC开发框架, 专家子系统采用两层C/S运行模式, 两个子系统在数据层进行信息共享。

图3 推荐系统的系统架构

3.4 功能结构

推荐系统的功能结构如 图4所示:

图4 推荐系统的功能结构

系统主要功能模块包括:

(1) 商品知识管理: 支持专家对商品用途、商品功能、商品属性等定性的商品领域知识和反映商品用途、商品功能和商品属性间隶属关系的定量的商品领域知识的录入、删除和修改。定性和定量商品领域知识都需要随着科学技术的发展不定期地进行维护;

(2) 系统管理: 支持系统管理员对系统交互界面的风格、推荐过程中使用的策略和专家资料库进行设定、添加、删除、修改等维护工作。交互界面风格包括系统在每一个步骤呈现给用户的文字和图片信息, 以及页面的配色、布局、文字字体等内容。推荐使用策略包括确定对推荐度超过指定阈值或推荐度排名前N的商品信息进行推荐。专家知识库维护可以对专家信息进行录入与修改以及对专家进行系统授权和权重设定;

(3) 商品信息管理: 支持管理员对商品的非结构化文字描述信息和结构化的商品配置属性信息以及其他的结构化描述信息如商品的库存、价格等进行录入、删除和修改;

(4) 商品信息推荐: 为用户提供个性化的商品用途、功能等信息的展示和交互页面。用户可以通过用途或功能页面查看或设定商品用途和功能的权重, 通过商品信息页面查看商品信息并将商品加入购物车。

4 系统关键技术
4.1 商品领域知识库设计

推荐系统的知识库中保存有定性和定量的商品领域知识, 定性的商品领域知识主要包括商品的用途、性能、属性等类型, 定量的商品领域知识主要包括商品的用途与性能之间、性能与属性之间的隶属关系以及反映当前技术条件下商品的各项属性值优劣情况的分值。定性知识在术语选用上参考本体设计构建的思想[ 17], 表述上尽量符合规范, 定量知识中各数值的确定采用层次分析法[ 18]图5是实现商品领域知识库逻辑存储的ERD图:

图5 商品领域知识库ERD图

4.2 商品推荐度计算

系统采用层次分析法确定商品的推荐度, 首先根据商品的属性、功能、用途构建如 图6所示的商品领域知识层次结构关系。

图6 推荐系统中商品领域知识层次结构

在商品领域知识层次结构中, 上下层元素间的隶属关系表示实现上层元素时对下层元素的依赖权重, 由专家分别针对每个元素所支配的下层元素的重要性, 构造两两比较矩阵并采用根法求解。系统依次求得商品的各功能对商品用途k的隶属权重向量Uk, 商品属性对商品功能的隶属权重矩阵P和某件商品i的商品属性分值向量Mi, 则商品i对于用户的用途k的推荐度rki[ 18]:

rki=Mi×P×Uk°

商品的推荐度越高, 表示该商品能够满足用户用途需求的可能性越高。推荐系统最终选择推荐度超过指定阈值的商品, 或者将所有商品的推荐度按大小排序后选取前N个商品组成针对用户用途需求的商品推荐列表展示给用户。

5 实验验证
5.1 实验设计

实验以计算机作为被选购的商品。笔者与另外三位从事信息技术相关课程教学和研究的同事一起讨论并确定计算机的用途、功能和属性的分类, 同时确定计算机的各种功能对用途、属性对功能重要性的两两矩阵。其中计算机的用途分为普通家用、高级娱乐型家用、一般办公、综合性办公、系统设计和开发、图像处理和美工设计、数值计算和智能模拟7类, 计算机的功能分为运算速度、存储容量、图像显示性能、动画显示性能、音响效果、网络性能、外设扩展能力、操作方便性8类, 计算机配置属性涉及CPU、内存、输入输出设备等42类。从京东商城网站(①http://www.jd.com.)获取系统所需要的具体计算机描述信息, 采用层次分析的根法根据两两比较矩阵求得用途功能与属性间隶属权重。

笔者利用Visual Studio 2005开发原型系统, 开发语言为C#, 数据库为SQL Server 2005, Web服务器为IIS5.1, 并利用交互界面依次录入相应的计算机定性和定量知识。计算机用途与功能定性关系的输入界面如 图7所示, 计算机功能与属性定量关系的输入界面如 图8所示:

图7 计算机用途与功能定性知识专家交互界面

图8 计算机功能与属性定量知识专家交互界面

用户确定自己对计算机用途需求的交互界面,如 图9所示。原型系统在计算机商品知识库的支持下, 根据用户输入的计算机用途, 引导用户依此确定自己对计算机用途和配置的需求并最终为用户推荐符合其用途需求的计算机。

图9 计算机用途交互用户交互界面

同时参照京东商城的购物流程开发基于搜索的普通商品选购系统作为对比实验系统, 该系统采用B/S运行模式, 与提出的推荐系统使用同一个商品信息库。消费者可以在对比实验系统的搜索界面输入计算机的各种配置属性需要满足的条件, 系统根据这些条件筛选并向用户展示符合条件的计算机商品信息。

笔者参照相关文献[ 19]设计调查问卷以检验用户对系统的感知有用性、感知易用性和满意度, 问卷共包括9个调查题项, 每个因素包括三个题项, 所有题项都从已有的研究文献选取并结合本文的需要进行少量修改, 每个题项都采用李克特5级量表表示用户对相关陈述观点的认可程度。一般来说, 优秀的系统能够帮助用户节省购物的选购时间, 提高用户的决策效率, 笔者认为可以根据用户在选购期间查看和对比的商品数量进行推断, 因此也选择用户最终查看的计算机数量这一指标来测度系统实际推荐效果。

5.2 实验结果分析

笔者招募了203名武汉纺织大学本科一年级的学生作为实验者, 将其随机分为两组, 第一组使用基于商品领域知识的推荐系统, 第二组使用基于搜索的商品选购系统, 实验结束的条件是实验者确定已经找到自己满意的计算机或使用系统达到15分钟。所有实验者都被要求在实验结束后根据自己使用系统的实际感受填写调查问卷。第一组和第二组分别有96名和80名实验者完成实验并提交了合格的调查问卷, 在显著性水平α=0.05下接受平均随机分配实验者使用两个系统中的任意一个的假设(Z=1.75)。 表1是两组实验者填写的调查问卷和结束实验时平均查看的计算机数量的统计数据。

表1 两组用户问卷描述统计及t检验

表1中的描述统计数据可以看出, 使用推荐系统的用户对系统的感知有用性、感知易用性和满意度的平均值高于使用基于搜索的普通选购系统的平均值, 而第一组用户查看的计算机数量的平均值比第二组用户查看的数量低, 而且t检验表明这些差异在显著水平α=0.05下是有意义的, 表明用户对本文提出的基于商品知识交互式推荐系统有较好的感知有用性、感知易用性以及较高的满意度, 而查看计算机数量上的差别也佐证了推荐系统对于用户选购商品的感知有用性。借助专家商品领域知识和简单的交互过程, 本文提出的推荐系统由于不需要大量收集和保存用户的相关行为信息, 从而在一定程度上避免了传统推荐系统经常面临的冷启动和用户隐私保护问题, 同时实验结果表明, 消费者对系统仍有较好的使用意愿。

6 结语

本文以规划行为理论和目标手段链模型为理论基础, 提出基于商品领域知识的交互式推荐系统的作用机理、实现框架以及工作流程, 以专家的商品领域知识为支撑, 在与消费者进行简单交互的过程中引导消费者逐步明确自己对商品用途的定性需求, 并借助商品知识库中的商品领域知识将消费者定性的用途需求转变为消费者对商品属性的定量需求, 从而向消费者个性化地展示最可能满足其用途需求的商品的相关信息。与传统推荐系统不同, 基于商品领域知识的交互式推荐系统不需要大量收集和保存消费者的行为信息和相关个人数据, 因此既能够在一定程度上解决影响推荐系统推荐效果的冷启动问题, 又能够避免消费者因隐私信息被滥用而拒绝使用系统, 能够促使消费者对推荐系统和推荐结果产生正向的使用意愿。

基于商品领域知识的交互式推荐系统的推荐结果的有效性在很大程度上依赖于系统中商品领域知识的丰富性和准确性。本文借助层次分析法在一定程度上保证单个专家输入商品知识的相对客观性, 可以预见如果能够在推荐过程中合理利用多个专家的商品知识推荐结果应该更加具有针对性, 笔者下一步将探讨能否借鉴群决策理论在推荐系统中有效集成和利用多位商品领域专家的商品知识。随着科学技术的快速发展, 商品领域知识以及商品的各种属性信息的更新速度非常快, 商品领域知识的生命周期变得越来越短, 笔者也将探讨利用Web2.0时代大量的用户产生内容快速而低成本地自动获取和更新系统所需要的商品领域知识的有效方法。

参考文献
[1] Adomavicius G, Tuzhilin A. Towards the Next Generation of Recommender Systems: A Survey of the State-of-the-art and Possible Extensions[J]. IEEE Transactions on Knowledge and Data Engineering, 2005, 17(6): 734-749. [本文引用:1] [JCR: 1.892]
[2] Chang Y, Shen J, Chen T. A Data Mining-based Method for the Incremental Update of Supporting Personalized Information Filtering[J]. Journal of Information Science and Engineering, 2008, 24(1): 129-142. [本文引用:1] [JCR: 0.299]
[3] 刘建国, 周涛, 汪秉宏. 个性化推荐系统的研究进展[J]. 自然科学进展, 2009, 19(1): 1-15.
Liu Jianguo, Zhou Tao, Wang Binghong. Review on Research of Personalized Recommendation Systems[J]. Progress in Natural Science, 2009, 19(1): 1-15. [本文引用:1] [CJCR: 0.854]
[4] 刘平峰, 聂规划, 陈冬林. 基于知识的电子商务智能推荐系统平台设计[J]. 计算机工程与应用, 2007, 43(19): 199-201.
Liu Pingfeng, Nie Guihua, Chen Donglin. Design of Platform for Knowledge Based Intelligent Electronic Commerce Recommender Systems[J]. Computer Engineering and Applications, 2007, 43(19): 199-201. [本文引用:1] [CJCR: 0.457]
[5] Middleton S E, Shadbolt N, Roure D D. Ontological User Profiling in Recommender Systems[J]. ACM Transactions on Information Systems, 2004, 22(1): 54-88. [本文引用:1] [JCR: 1.07]
[6] 刘鲁, 任晓丽. 推荐系统研究进展及展望[J]. 信息系统学报, 2008, 2(1): 82-90.
Liu Lu, Ren Xiaoli. Review Perspective of the Recommender Systems[J]. China Journal of Information Systems, 2009, 2(1): 82-90. [本文引用:1]
[7] Swearingen K, Sinha R. Beyond Algorithms: An HCI Perspective on Recommender Systems [C]. In: Proceedings of the ACM SIGIR Workshop on Recommender Systems. 2001. [本文引用:1]
[8] 吴丽花, 刘鲁. 个性化推荐系统用户建模技术综述[J]. 情报学报, 2006, 25(1): 55-62.
Wu Lihua, Liu Lu. User Profiling for Personalized Recommending Systems-A Review[J]. Journal of the China Society for Scientific and Technical Information, 2006, 25(1): 55-62. [本文引用:1] [CJCR: 1.1348]
[9] Honda K, Sugiura N, Ichihashi H, et al. Collaborative Filtering Using Principal Component Analysis and Fuzzy Clustering [C]. In: Proceedings of the 1st Asia-Pacific Conference on Web Intelligence: Research and Development. 2001: 394-402. [本文引用:1]
[10] 李珊, 何建敏, 厉浩. 基于知识的协同过滤推荐系统研究[J]. 情报学报, 2008, 27(3): 357-362.
Li Shan, He Jianmin, Li Hao. Research of Knowledge Based Collaborative Filtering Recommendation Systems[J]. Journal of the China Society for Scientific and Technical Information, 2008, 27(3): 357-362. [本文引用:1] [CJCR: 1.1348]
[11] Felfernig A, Teppan E, Gula B. Knowledge-based Recom-mender Technologies for Marketing and Sales[J]. Inter-national Journal of Pattern Recognition and Artificial Inte-lligence, 2007, 21(2): 333-354. [本文引用:1]
[12] Kobsa A. Privacy-enhanced Personalization[J]. Communica-tions of the ACM, 2007, 50(8): 24-33. [本文引用:1]
[13] Sutanto J, Palme E, Tan C, et al. Addressing the Personalization–Privacy Paradox: An Empirical Assessment from a Field Experiment on Smartphone Users[J]. MIS Quarterly, 2013, 37(4): 1141-1164. [本文引用:2]
[14] Xu Y, Zhang B, Chen Z, et al. Privacy-enhancing Personalized Web Search [C]. In: Proceedings of the 16th Conference on World Wide Web. 2007: 591-600. [本文引用:1]
[15] Zhou L, Dai L, Zhang D. Online Shopping Acceptance Model–A Critical Survey of Consumer Factors in Online Shopping[J]. Journal of Electronic Commerce Research, 2007, 8(1): 41-62. [本文引用:1]
[16] 胡洁, 张进辅. 基于消费者价值观的手段目标链模型[J]. 心理科学进展, 2008, 16(3): 504-512.
Hu Jie, Zhang Jinfu. The Means-End Chain Model Focused on Consumer Values[J]. Advances in Psychological Science, 2008, 16(3): 504-512. [本文引用:1] [CJCR: 1.149]
[17] 颜端武, 刘明岩, 许应楠. 基于领域本体的细粒度用户兴趣建模研究[J]. 情报学报, 2010, 29(3): 433-442.
Yan Duanwu, Liu Mingyan, Xu Yingnan. Toward Fine-grained User Preference Modeling Based on Domain Ontology[J]. Journal of the China Society for Scientific and Technical Information, 2010, 29(3): 433-442. [本文引用:1] [CJCR: 1.1348]
[18] 孙东川, 杨立洪, 钟拥军. 管理的数量方法[M]. 北京: 清华大学出版社, 2005: 234-254.
Sun Dongchuan, Yang Lihong, Zhong Yongjun. Quantitative Methods of Manage-ment[M]. Beijing: Tsinghua University Press, 2005: 234-254. [本文引用:2]
[19] Celik H E, Yilmaz V. Extending the Technology Acceptance Model for Adoption of E-Shopping by Consumers in Turkey[J]. Journal of Electronic Commerce Research, 2011, 12(2): 152-164. [本文引用:1]