地域性差异视角下的网站分类用户心智模型空间性研究
强韶华1, 吴鹏2
1南京工业大学经济与管理学院 南京 211816
2南京理工大学经济管理学院 南京 210094
强韶华, ORCID: 0000-0001-7797-3554 , E-mail: Shaohua3900@163.com
摘要

目的 根据地域差异, 发现和验证网站分类目录的组织结构与用户主观认知的相似性特征, 支持网站个性化设置。方法 结合心智模型理论和日志挖掘方法, 利用网站日志数据获取用户认知, 利用多维尺度法分析不同地域用户期望的网站分类目录心智模型差异。结果 结合案例网站提供的数据进行实证研究, 验证结果显示不同地域用户的心智模型存在差异。【局限】试验数据较少, 需要更多同类数据的验证。结论 不同地域的用户对网站的分类目录具有不同的心智模型, 可以进行个性化的目录体系设置, 以更符合用户的使用习惯, 提高用户满意度。

关键词: 多维尺度; 心智模型; 网站分类目录; 日志挖掘
中图分类号:TP393 G35
The Research of Spatial Measure of Users’ Mental Model of Website Category from the View of Regional Differences
Qiang Shaohua1, Wu Peng2
1School of Economics and Management, Nanjing TECH University, Nanjing 211816, China
2School of Economics and Management, Nanjing University of Science & Technology, Nanjing 210094, China
Abstract

[Objective] This paper is to analyze the similarity between the organization structure of the website category and the user’s subjective cognition directly based on the view of regional differences, which can support the website personalization. [Methods] Combined with the mental model theory and Web log mining method, this paper uses the website log data to obtain the user’s cognition, and uses the multidimensional scaling to analyze the user’s mental models of expected website category hierarchy from different regions. [Results] It is verified that there are differences in the mental models of the user’s from different regions based on a Chinese e-commerce website case. [Limitations] In this paper, the test data is relatively small, and the new method needs to be verified by the more data. [Conclusions] The users’ mental models of expected website category hierarchy are different according different regions. We can set up a personalized category hierarchy for users of different regions, which can better meet their use habits and improve their customer satisfactions.

Keyword: Multidimensional; scaling; Mental; model; Website; category; hierarchy; Web; log; mining
1 引 言

网络覆盖范围的迅速增长, 网络信息种类的极其丰富, 在给用户带来更多选择机会的同时, 增加了用户搜索所需信息的难度, 提高了搜索成本。网站分类目录是一种以网络信息资源为对象, 应用分类的方法对巨大的网络信息资源进行组织和揭示的有效手段。目前大量相关研究都是从设计者的角度关注网站分类目录设计中可能存在的不足, 缺乏对于网站分类目录用户认知的研究, 导致现有网站分类目录比较粗糙、不够直观, 用户无法快速地找到所需要的信息[1]。为了使网站信息组织更加符合用户心智模型, 提高网站用户信息获取的效率, 网站信息组织需要从“ 以系统为中心” 向“ 以用户为中心” 转换, 从用户认知角度研究网站信息组织, 这是本文研究的出发点, 也是未来信息构建研究的发展趋势。

2 网站分类目录的用户认知研究

用户行为和用户认知逐渐成为近几年网站分类目录研究共同关注的新热点。Chen等[2] 提出了一个两阶段的模型, 根据用户以前的相似访问, 来预测用户的下一次访问。Schmutz等[3]研究了类别对于用户的认知负荷以及决策的影响。Geng等[1]提出了一种层次聚类方法自动生成基于用户的探索行为的查询分类。然而, 现有研究总体上仍缺乏对用户的内在动机和认知方面的研究, 这使得它很难预测用户的浏览行为[4]。根据Norman[5]提出的交互设计理论, 网站的分类目录与用户的心智模型越接近, 那么用户获取信息就将越方便。心智模型是影响用户与网站交互时内在的、可预测的认知模型, 是描述系统目标和形式、解释系统功能、预测系统未来状态的用户知识结构和信念体系。心智模型已经成为能够很好地表达用户认知的一个有效工具, 国内已有相关研究针对用户使用网站分类目录时的心智特征进行分析[6, 7, 8, 9]。本文在现有研究的基础上, 进一步深入探究网站用户的认知过程和认知结构, 利用网站日志数据, 提取用户的实际浏览路径, 借助多维尺度法分析其与网站分类目录间的关系, 进而为构建更符合用户心智模型的网站分类目录提供决策支持。

3 网站分类目录的用户心智模型空间性研究

在网站用户的心智模型研究中, 心理近似数据是由个体感知的概念之间关系的主观评估形成的, 其中“ 关联性” 、“ 空间性” 是主要测量角度。作为心智模型的一大重要特性: 概念空间性, 它可以揭示个体评价不同概念的潜在心理标准, 也就是不同的概念在被试心理空间中的相对位置。心智模型概念空间性研究起源于Smith等[10]的特征比较模型, 在随后的40多年中, 相关领域的研究者展开了大量关于概念空间性的研究。Gä rdenfors[11]认为概念的空间性描述是研究被试认知过程多维概念评价、归纳推理、概念分类的一座桥梁。在这样的大背景下, 许多学者提出了经典的模型和理论, 例如Nosofsky[12]的通用情境模型、Ashby等[13]的边界决策模型等。然而现有研究普遍存在一个问题, 即对于心智概念的空间性描述都是局限在一个特定对象单一心理空间维度中, 而不是所有被观测对象及其环境组成的多维心理空间。究其原因, 是缺乏一种对多维心理数据及其关联要素进行处理的有效工具。多维尺度法能够有效解决这一问题, 利用多维尺度法可以有效分析用户对于特定概念的心智模型, 将其与网站现有的分类目录进行比较, 可以为网站目录优化研究提供新思路。

笔者已就多维尺度法在用户心智模型空间性测量方面进行了深入研究[14], 发现多维尺度法可以对个体认知过程和认知结构做深度的勘察。多维尺度法(Multidimensional Scaling, MDS), 是一种多元统计方法, 其将评价者主观定性数据输入, 经过降维化简处理, 输出可视化分析结果, 在心智模型空间性测量中所使用的多维尺度法的算法设计具体包括三个步骤:

(1) 生成观测矩阵

个体的心理刺激可以由一组维度值描述, 在MDS分析结果中, 空间中的不同观测点之间距离代表变量之间的相似性程度。在观测变量的空间图中, 每个样本都占一个点, 点与点之间的距离越近, 表明事物在维度特征上越相似; 距离越远, 表明事物在维度特征上差异越大。MDS算法依赖度量观测点之间的空间关系用以描绘刺激, 空间中的距离由嵌入在空间中点的关系所定义。MDS提供了两种类型空间的陈述, 一个是欧几里得刺激空间(Euclidean Stimulus Space), 另一个是个别差异空间(Individual Difference Space)[15]。欧几里得刺激空间是几乎全部MDS算法的基础, 而个体差异空间则根据个人认知差异的不同进行聚类, 形成聚合欧几里得刺激空间。其中欧几里得刺激空间主要与展现数据结构有关, 主要基于闵可夫斯基距离函数(Minkowski Distance Function)[15]。假定在网站分类目录理解中, 被试对概念之间的差异(距离)作为基本输入数据, 如果有n个对象, 可得 个成对对象的距离Sij, 点i与j之间的距离表示为dij, 该模型的一般形式如下[15]:

其中有r维, Xia表示在a维上的坐标点i, Xja表示在a维上的坐标点j, 指数p就是闵可夫斯基距离指数。闵可夫斯基距离函数描述一个欧氏模型[15], 当p=2时:

(2) 同态映射

寻找一个化简降维的q维空间, 做同态映射处理, 使得q维空间内, dij(观测对象在p空间中的距离)与原距离Sij相匹配, 如果dij与Sij完全相匹配, 各成对对象间距离关系为di1> di2> …> dim

(3) 信度和效度检验

确定最优维度数, 具体是计算差异程度K, 称为克鲁斯克系数, 用于检验所获得的空间图是否具有有效代表性和Stress应力指数, 为拟合度量值, 定义为相似度评估数据代表的理论距离和计算的距离之间的偏差量。Stress采用的公式[15]为:

其中, dij是满足被试原始输入概念距离次序关系, 同时又使应力指数值最小的参考值。

4 实验研究

本次实证研究选取中国制造网(http://www.made-in-china.com)的分类体系作为研究对象。由于中国制造网面向的对象是全世界的买家, 各地区的买家对于网站分类目录的理解是不一致的, 为了能够更好地完善网站分类目录体系, 更有针对性地对不同地区的买家实现不一样的产品推送, 需要具体分析地域性差异对于用户心智模型的影响。另外, 通过对不同类目的聚类, 利用多维尺度法分析不同类目间可能存在的关联, 便于网站对用户进行相关产品的推送和更具有个性化的目录优化。

4.1 实验假设

为了验证影响被试(网站信息用户)搜寻时心智模型的影响因素, 本文在此提出如下假设: 网站用户的心智模型会受到地域的影响, 不同地域的用户对于网站分类目录的理解是不同的。

4.2 实验方法

网络日志客观反映了用户的心智模型, 通过合理的操作, 可以从网络日志中提炼出满足用户心智模型的分类体系, 据此设计分类体系使得搜索引擎得出的分类检索结果更符合用户需求。在实验中, 将着重通过对网站日志数据处理后的结果进行分析, 最终得出实验所需要的结果和数据。

由于获取到的日志数据对于用户具体信息是保密的, 为了保证实验的可信性和真实性, 本实验只针对不涉密的属性(例如通过IP地址分析出用户地域)进行相关的分析、聚类。另外还会对同一个用户(假设一个IP地址代表一个用户)浏览过的不同的商品进行聚类, 判断某几件商品之间是否存在一定的关联, 这样便于之后对用户推荐相关产品, 提高用户满意度。

4.3 实验设计

根据原始的网络日志数据进行预处理、用户识别、会话识别、会话路径补齐、事务路径识别等, 得出每一个IP相对应的补齐后的目录路径, 即每个用户所对应的使用分类目录的具体路径。

本实验选取中国制造网外贸站中的Lights & Lighting(即照明)大类为主要实验对象, 包括顶级目录“ Lights & Lighting” 在内总共14个概念, 这些概念形成三级分类目录体系。实验选取的概念如表1所示:

表1 实验目录概念表
4.4 数据分析

(1) 数据处理

本研究中设定每两个相邻概念节点之间的距离为1, 并将制造网的分类作为标准, 据此可以得到一个标准的路径图, 如图1所示。根据路径图, 又可以得到一个有关这14个概念节点的距离矩阵, 如表2所示:

图1 标准路径图

表2 网站路径节点概念标准距离矩阵

实验选取中国制造网在2013-05-18 23:50:00至2013-05-19 23:50:00一天的网络日志数据, 考虑到用户隐私, 网站屏蔽了用户标记、用户名等相关字段, 将得到的所有用户目录路径进行筛选, 选出其中属于Lights & Lighting大类的用户目录路径, 符合条件的总共有56个用户, 如图2所示。查询这部分用户的IP地址, 确定每个用户所属地域。另外将这些用户对应的目录序列分别用上述目录对应编号标出对应的目录路径, 用户没有访问的目录, 本次实验默认他的认知和网站是一致的。

图2 用户目录路径及地域统计图

(2) 维度分析

先对网站标准模型进行多维尺度分析, 将节点1 (Lights & Lighting)到节点14(Street Light)作为变量可以得到一个关于14个节点的空间配置的二维图, 如图3所示, 压力指数Stress=0.02306, RSQ=0.71003, 认为是完全可以接受的。

图3 标准路径二维图

图3可以看出, 节点3(Indoor LED Display)、节点4(Outdoor LED Display), 节点6(Bulb Light)、节点7 (LED Light)、节点8 (LED Tube), 节点10 (Ceiling Light)、节点11(Down Light), 节点13(Solar Light)、节点14(Street Light)是聚集在一起的, 这与网站模型中节点所在的层级是完全吻合的。

针对地域影响用户心智模型的假设, 以地域作为一个维度(根据每个用户的IP地址, 确定出每个用户所对应的地域)对被试的心智模型进行测量, 为了便于测量, 本实验将地域精确到洲。这里同样用节点1 (Lights & Lighting)到节点14(Street Light)作为变量, 地域作为维度进行多维尺度分析。

根据上文对于IP地址处理的方法, 可以得出本次参与实验的56名用户中有32名来自美洲, 占总人数的57.14%; 14名来自亚洲, 占总人数的25%; 5名来自非洲, 占总人数的8.93%; 5名来自欧洲, 占总人数的8.93%。

对美洲用户进行多维尺度分析, 得出相应的二维图, 如图4所示。压力指数Stress=0.02266, RSQ= 0.71149, 认为是完全可以接受的。

图4 美洲用户的路径二维图

对亚洲的用户进行相关多维尺度分析, 得出所对应的二维图, 如图5所示。压力指数Stress=0.02270, RSQ=0.71079, 认为是完全可以接受的。

图5 亚洲用户的路径二维图

对非洲用户进行分析, 得出相应的二维图, 如图6所示。压力指数Stress=0.02280, RSQ=0.71532, 认为是完全可以接受的。

图6 非洲用户的路径二维图

对欧洲用户进行分析, 得出相应的二维图, 如图7所示。压力指数Stress=0.02423, RSQ=0.68329, 认为是完全可以接受的。

图7 欧洲用户的路径二维图

图4图7可以看出, 4个地区的用户对于网站分类目录的理解, 差别主要集中在节点10(Ceiling Light)和节点11(Down Light)上。其中亚洲和欧洲的用户认为这两节点是相对离散的, 而美洲用户认为较集中, 非洲用户则认为这两点是完全聚合的。说明在做产品推介时, 对于美洲和非洲的用户, 可以将这两个节点对应的产品进行映射, 互相推介。另外差别还表现在节点6(Bulb Light)、节点7(LED Light)、节点8(LED Tube), 对于这几个节点的认知, 美洲、亚洲和欧洲用户是一致的, 认为节点6和节点8完全聚合, 但与节点7较为离散; 非洲用户则认为这几点是完全聚合的。由于差异性的存在, 所以不同地区的用户会形成不同的目录树, 根据图4图7的分析, 得到目录树结果如图8图11所示:

图8 美洲用户的目录树

图9 亚洲用户的目录树

不同地域的用户之间存在一定心智模型的差异, 可能是因为数据量的原因, 差异并不是很明显。但可以从一定的角度反映出用户所处地域对于用户的心智模型存在影响, 即本文的假设是成立的。

4.5 实验结论

本次实验选取中国制造网用户在“ Lights & Lighting” 目录的浏览路径进行分析实验。从实验过程及结果来看, 多维尺度法是一种可以测量用户心智模型与网站系统模型的方法, 它可以对比几个概念之间的差异。同时多维尺度法可以将多个事物之间的距离以图形的方式展现出来, 可以很容易地发现两个事物之间的联系, 距离越近, 它们的关联越紧密。

实验结果说明, 可以在之后的目录设置中针对不同地区的用户设置不同的目录体系, 以更符合他们的使用习惯, 提高用户满意度, 也提高用户的心智模型和网站自身心智模型的相似程度。

本次实验通过用户IP地址分析地域不同的心智模型差异性, 由于测试网站是一个典型的B2B电子商务网站, 即买家和卖家均为企业用户, 不同于C2C电子商务网站以个人客户为主, 因此被试数量较小; 同时由于保护网站客户数据的隐私性的需要, 只选择具有代表性的“ Lights & Lighting” 大类产品进行日志提取、数据分析, 导致来自非洲和欧洲的数据量较少, 对于同一区域中的用户未进行进一步的区分, 导致得出的不同地域用户的心智模型可能存在一定的误差。但是可以看出不同地域用户的心智模型存在一定的差异, 得出地域对于用户的心智模型是存在影响的, 例如分析结果可知非洲用户的心智模型与网站的最为相似, 说明网站的分类目录设置最匹配非洲用户的使用习惯。在后续研究中, 可以结合更大规模的网站数据, 对本研究的方法进行测试和验证。

5 结 语

本文基于心智模型理论, 结合日志挖掘方法和多维尺度方法, 提出了一种不同地域特点的电子商务网站产品分类目录用户个性化需求测量方法。该研究的理论创新在于基于心智模型, 提出了测量电子商务网站不同地域特点用户分类目录个性化需求的方法; 实践创新在于基于网站用户日志数据, 结合多维尺度法, 进行实时计算, 通过测量电子商务网站产品分类目录用户心智模型的空间性, 预测用户的个性化需求, 并结合中国知名电子商务网站的实时日志数据进行实证研究, 从而为本研究在电子商务网站产品分类目录的优化和个性化推荐系统设计的工业化应用提供可行性。

参考文献
[1] Geng X, Fan X, Bian J, et al. Optimizing User Exploring Experience in Emerging e-Commerce Products [C]. In: Proceedings of the 21st International Conference on World Wide Web. 2012: 23-32. [本文引用:2]
[2] Chen M, LaPaugh A S, Singh J P. Predicting Category Accesses for a User in a Structured Information Space[C]. In: Proceedings of the 25th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. ACM, 2002: 65-72. [本文引用:1]
[3] Schmutz P, Roth S P, Seckler M, et al. Designing Product Listing Pages—Effects on Sales and Users’ Cognitive Workload[J]. International Journal of Human-Computer Studies, 2010, 68(7): 423-431. [本文引用:1]
[4] Noseworthy T J, Goode M R. Contrasting Rule-based and Similarity-based Category Learning: The Effects of Mood and Prior Knowledge on Ambiguous Categorization[J]. Journal of Consumer Psychology, 2011, 21(3): 362-371. [本文引用:1]
[5] Norman D A. Some Observations on Mental Models [A]. //Mental Models[M]. Lawrence Erlbaum Associates Inc, 1983: 7-14. [本文引用:1]
[6] 尤少伟, 吴鹏, 汤丽娟, . 基于路径搜索法的政府网站分类目录用户心智模型研究——以南京市政府网站为例[J]. 图书情报工作, 2012, 56(9): 129-135.
(You Shaowei, Wu Peng, Tang Lijuan, et al. Users’ Mental Model about Government Website Classification Catalogue Based on Pathfinder Method — Taking Nanjing Government Website as an Example[J]. Library and Information Service, 2012, 56(9): 129-135. ) [本文引用:1]
[7] 李海涛, 宋琳琳. 用户使用网站的心智模型测量方法的选择及应用[J]. 情报理论与实践, 2015, 38(2): 11-16.
(Li Haitao, Song Linlin. The Choice and Application of the Measuring Method of the User’s Mental Model[J]. Information Studies: Theory & Application, 2015, 38(2): 11-16. ) [本文引用:1]
[8] 张丽军. 基于日志挖掘的网站分类目录用户心智模型研究[D]. 南京: 南京理工大学, 2014.
(Zhang Lijun. Research on Website Product Category Based on Mental Model by Data Mining [D]. Nanjing: Nanjing University of Science & Technolgoy, 2014. ) [本文引用:1]
[9] 钱敏. 面向网站商品分类目录的用户心智模型测量研究[D]. 南京: 南京理工大学, 2013.
(Qian Min. Research on the Measuring Method of the User’s Mental Model Based on the Web Product Catalog [D]. Nanjing: Nanjing University of Science & Technolgoy, 2013. ) [本文引用:1]
[10] Smith E E, Shoben E J, Rips L J. Structure and Process in Semantic Decisions: A Featural Model for Semantic Decisions[J]. Psychological Review, 1974, 81(3): 214-241. [本文引用:1]
[11] Gärdenfors P. Conceptual Spaces: The Geometry of Thought [M]. Cambridge, Mass: MIT Press, 2004. [本文引用:1]
[12] Nosofsky R M. Choice, Similarity, the Context Theory of Classification[J]. Journal of Experimental Psychology: Learning, Memory, & Cognition, 1984, 10(1): 104-114. [本文引用:1]
[13] Ashby F G, Gott R E. Decision Rules in the Perception and Categorization of Multidimensional Stimuli[J]. Journal of Experimental Psychology: Learning, Memory, & Cognition, 1988, 14(1): 33-53. [本文引用:1]
[14] 吴鹏, 强韶华, 严明. 基于多维尺度法的网站分类目录理解用户心智模型空间性测量研究: 以政府网站为例[J]. 情报学报, 2012, 31(4): 436-448.
(Wu Peng, Qiang Shaohua, Yan Ming. The Research on Spatial Measure of Users’ Mental Model for Understand ing Website Categories Based on Multidimensional Scaling: The Case of Government Websites[J]. Journal of the China Society for Scientific and Technical Information, 2012, 31(4): 436-448. ) [本文引用:1]
[15] Coury B G, Weiland M Z, Cuqlock-Knopp V G. Probing the Mental Models of System State Categories with Multidimensional Scaling[J]. International Journal of Man-Machine Studies, 1992, 36(5): 673-696. [本文引用:5]