用户在线评论数据挖掘的网商信用度分析*
毕达宇1,2, 夏晓旭2, 王婧2
1华中师范大学湖北省电子商务研究中心 武汉 430079
2华中师范大学信息管理学院 武汉 430079
通讯作者: 毕达宇 E-mail:realrainbdy@163.com

作者贡献声明:

毕达宇: 提出研究思路, 设计研究方案,统筹论文的起草与修订;

夏晓旭: 负责进行试验, 对数据进行采集、清洗及分析等工作;

王婧: 相关文献资料的搜集、负责论文起草。

摘要

【目的】对搭载第三方电子商务平台的网商信用度进行分析。【方法】通过德尔菲法确立网商信用度评价指标体系权值; 运用中文分词技术及情感词极性识别方法对用户评价进行量化; 运用灰色关联分析方法对获取的数据进行信用度得分计算。【结果】通过用户对网商信用度的评价, 得出网商信用度在非常好、较好、一般及较差4个等级的用户评价隶属度, 进而反映出网商的信用度。【结论】通过对用户的在线评价进行分析, 针对用户评论信息存在的小样本性、信息内容的不完整性, 选择灰色关联分析方法, 提出能够针对网商的信用度制定一个较为合理可行的评价方法。该评价方法能够在相对统一的标准下自动对用户评价内容进行量化, 并在计算结果中体现不同评价区间的用户群体分布。

关键词: 在线评论; 网商信用度; 评价指标体系; 灰色关联分析
中图分类号:G350
The Analysis of Credit Standing of E-businessman Based on the Data Mining of Users’ Online Evaluation
Bi Dayu1,2, Xia Xiaoxu2, Wang Jing2
1E-Commerce Research Center of Hubei Province, Central China Normal University, Wuhan 430079, China
2Information Management School, Central China Normal University, Wuhan 430079, China
Abstract

[Objective] This article discusses the credit of e-businessmen who used the third party e-business platform. [Methods] First, the weight of e-businessmen credit evaluation index system should be made clearly. Secondly, the reviews of customers are quantified by Chinese words segmentation technology and emotional word polarity identification method. Thirdly, the credit of e-businessmen is calculated with grey correlation analysis method. [Results] The degrees of membership of four levels, which include best, better, general and poor level are calculated. Then, it can be concluded the credit of e-businessman by using the result. [Conclusions] With the method of grey correlation analysis in the situation of incomplete information and small sample, the authors can formulate a reasonable method of evaluating the credit of e-businessman using the review of customers. This method can quantify the contents in a relatively unified standard, and acquire the distribution of different evaluation.

Keyword: Online evaluation; E-businessman credit standing; Evaluation index system; Grey correlation analysis
1 引 言

网商信用度可以理解为网商在产品生产、经营、交换和各种商业往来, 合作中履行承诺条件的兑现状况[ 1]。由于我国的电子商务法律法规尚不完善, 导致网上交易频繁失信, 极大损害了消费者的利益, 扰乱了网上交易市场。如何利用网上现有资源, 挖掘和评价网商信用度, 保证消费者利益, 促进市场平稳发展成为目前国内外学者不断研究的课题。本文将电子商务中用户的在线评论作为切入口, 通过构建网商信用度评价指标体系, 将用户的在线评论内容进行单元分割, 使之与评价指标一一对应并进行量化工作, 最后通过灰色关联分析方法得出网商信用度评分。

2 研究背景

国内外学者以用户或消费者感知为视角对网商可信度方面有着诸多研究。Corritore等通过构建用户与网站的信任模型认为感知的可信性、感知的易用性和信用风险是网上信任的主要影响因素[ 2]。Awad和Ragowsky认为不同性别间的用户评论对网商信任的影响存在不同[ 3]。李志宇从研究在线评论效用的影响入手, 采用模糊层次分析法和语义挖掘对评论内容的各项指标进行量化处理后对其进行有用性排序, 辅助其他消费者进行购物决策[ 4]。李霄等从评论、评论者和被评论的商品三个方面选择11个特征, 使用SVM对垃圾评论进行二分类, 识别出垃圾评论, 提取有价值的信息资源[ 5]。唐晓波等在构建评论挖掘模型时综合采用共词分析和基于句法分析的极性传递法, 对评论中的情感词进行分析, 得出了比较好的分析效果, 帮助商家了解产品的优缺点[ 6]。我国学者对于网商信用度的研究主要通过构建信用指标评价模型、运用回归分析等方法对网站的可信度、用户的满意度等方面进行分析预测。然而信用评价指标模型需要定期获取较多的调查数据并进行统计, 不具有较高的适用性; 而回归分析等方法在信用数据的获取等方面也存在一定难度。通过构建网商信用评价指标体系将用户的在线评论作为调查数据, 运用灰色关联分析方法对用户在线评论进行分析能够根据不断更新的用户评论重新计算已构建的评价体系中各项指标的灰色关联度, 从而实时反映网上信用度的变化过程。

3 网商信用度评价指标体系的建立

网商的电子商务信用度是指电子商务活动中网商所发布和承诺的信息与网商实际行为的一致程度。网商是否做到言行一致, 作为购买商品、享受网商服务的用户评论无疑具有较高的可信度。首先, 用户全程参与了电子商务活动, 能够通过实际感观表达出对电子商务活动各个环节的亲身体验, 通过其对商品本身、网商服务态度及物流等方面的满意度的评论印证网商的宣传、承诺与其行为的相符程度; 其次, 用户评论是电子商务活动全部结束后用户对网商总体信用情况的补充性说明, 用户的评价通常是在交易活动完成之后, 此时不存在任何的利益关系, 其信息内容不具有任何的利益目的。因此用户评论能够在一定程度上反映出网商的信用度。

3.1 网商信用度评价指标体系的构建原则

构建网商信用度评价指标体系的主要目的在于通过该指标体系能够将用户在线评论内容按照统一的标准实行单元分割, 为后续的用户评论量化工作做好铺垫。网商信用度评价指标体系中的指标数量应当适中, 指标数量过少会导致最终的计算结果误差较大, 难以有效辨别网商真实的可信度; 指标数量过多则会导致计算过程减缓, 信用度分析的效率降低。对网商信用度评价指标体系的构建应主要遵循全面性与针对性原则。

(1) 全面性原则。网商的信用度应当是其在电子商务活动各个方面所具备的信用的总和。网商的信用不仅体现在其销售的商品质量的好坏, 还应当包括在营销全过程的服务情况以及物流派送情况。

(2) 针对性原则。网商信用度评价指标应能够较为准确地反映商家的电子商务信用状况, 选择能够突出反映商家信用的指标进行考核。这样既能够避免指标繁琐带来的评价效率低下, 还能够较为准确地反映网商的真实信用。此外, 排除一些适用性较低的指标能够提升指标评价体系的通用性。

3.2 网商信用度评价指标解释

网商信用度评价指标体系如表1所示:

表1 网商信用度评价指标体系

(1) 商品可信度是指用户对于网商所销售商品的材质、价格、规格、图片与实物符合程度等方面的可信程度。材质可信度是指用户对于所购买的商品的材料质地、是否经久耐用的评价。价格可信度是指用户在看到商品实体后, 对商品在性价比方面的可信程度。规格可信度是指用户对于商品的型号、规格、尺寸等方面的可信程度。图片实物符合度是指用户对网商提供的商品图片与其商品实体间差异程度。

(2) 服务可信度是指用户对于网商的服务内容、服务方式、服务态度等方面的可信程度。网商所提供的服务可以分为售前服务和售后服务。用户可以针对售前卖家就商品的产品介绍、使用指导、防范须知等是否对用户提供了耐心详细的讲解, 售后是否对用户的个性需求进行了详细的咨询, 核对了发货地址, 发送了发货提醒, 并对于产品的买后使用保养维修都提供了一系列的追踪服务等方面的满意程度做出评论。同时对网商在服务内容及方式上是否承诺并且履行了尽可能多的服务项目以及在服务态度上卖家是否尽可能提供了热情、耐心、周到的服务进行可信程度的评价。

(3) 物流可信度是指在用户提出购买要求后, 卖家是否能够尽快发货, 或在承诺的时间内发货。同时, 针对特殊的商品, 卖家是否采取不同的包装方式, 保证商品的完好无缺。例如, 对于易碎的商品进行妥善包裹, 以避免在送货过程中出现磕碰后损坏商品; 对于礼品类商品提供精美的包装, 增强其视觉美感。

4 基于在线评论内容的评价指标赋值

通过已经建立的评价指标体系, 需要将用户在线评论内容中的各个观点与上述指标一一对应并将用户的观点以及情感强度量化为具体数值。用户在评论中所提及的质量、材质等属性词本身并不存在好坏之分, 例如某件商品的质量无法划分为5个等级, 而是通过用户对商品质量好坏的观点描述及情感倾向来判定其商品质量是否满足用户的需求, 进而反映网商的信用。因此用户评论所涉及到的评价指标的量化实际上是根据情感词的褒贬词性以及情感倾向度按照一定的标准进行量化后为其所描述的属性词进行赋值的过程。

4.1 构建属性词表及用户在线评论获取

(1) 通过对大量电子商务平台的观察与分析, 构建能够对应网商信用度评价指标的属性词表, 如表2所示:

表2 属性词表

(2) 利用哈尔滨工业大学社会计算与信息检索研究中心研发的语言技术平台LTP[ 7]对每条评论依次进行分词处理。LTP采用的是较为成熟的基于语法规则的机械分词原理。

(3) 根据构建的属性词表对每条评论中的属性词进行查找匹配, 保留匹配成功的属性词, 并检查匹配成功的属性词是否满足要求的覆盖范围, 符合要求则保留该条评论。然后统计属性词数量, 若属性词数量小于3, 则直接去除该条评论。

(4) 遍历完成所有评论后输出仍然保留的评论。

4.2 用户评论量化的基础

(1) 确定指标的量化公式

在用户的评论中, 既包含属性词, 同时还包含对属性词进行描述的动词和形容词以及描述情感强度的副词, 为了达到统一的评分标准, 在进行量化前笔者根据上述属性词表对评价指标的得分按照一定的得分规则进行赋值。通过语义分析可以看出, 电子商务环境下用户大多数评论内容中的词语组合较为浅显易懂, 搭配比较简单, 例如: “形容词+副词”的形式最为普遍, 因此可以定义指标得分公式为:

其中, 为指标最终得分, 为属性词的初始值, 默认为3分, 为副词的极性得分, 如果句子中没出现副词则默认为1分, 为动词或形容词极性得分。

(2) 构建情感词表

情感词的赋值需要将用户评论中的情感词与已有的情感词词典进行匹配, 在匹配成功的情况下对情感词进行赋值, 因此在进行量化之前首先需要构建情感词表。在构建情感词表的过程中, 需要尽量广泛搜集不同词性的词语, 同时还需要搜集具有情感倾向的固定短语, 例如“物美价廉”这种名词与形容词组合而成的情感词。若选择现有的情感词表, 可以选择知网的情感词分析用语词集[ 8]以及台湾大学的情感极性词典[ 9]。由于在情感倾向度的量化工作上需要将信用评价指标体系中的各项二级指标划分为5个等级, 而目前上述的两种情感词词典只是对情感词的情感强度进行了简单的正负性划分, 因此笔者通过人工搜集的方式对用户评论内容中涉及到的情感词进行了简单的尝试性搜集工作, 将用户评论内容中所提及较多的情感词进行了统计。所构建的情感词表如表3中1、2列所示。

表3 情感词赋值表

(3) 情感词表量化

各项二级指标的实际得分分布在1-5分这个区间, 本文对搜集到的情感词根据正面或负面词性及情感强度的不同进行赋值, 如表3所示。

经过量化之后, 根据指标计算公式就能够得出用户评论中的各项二级指标最终得分。

4.3 评论内容中的指标量化的流程

首先对通过LTP语义分析平台进行分词处理后的结果进行调用, 以标点符号为起止, 对每一个经过分词处理后的分句进行属性词与情感词的匹配, 并最终实现评论内容所涉及的指标的具体赋值工作。指标量化流程如图1所示:

图1 指标量化流程

通过指标量化算法可以得到用户评论后的网上信用度评价指标中各项二级指标的具体分数。例如在淘宝网上摘取的某条评论“东西摸起来手感还不错, 快递速度很快, 只是包装有点破损, 价格还可以, 大小也很标准, 总体不错下次还会光顾。”通过LTP语义分析平台[ 7]进行分词后得到的结果是:

“东西 摸 起来 手感 还 不错 , 快递 速度 很 快 , 只是 包装 有点 破损 , 价格 还 可以 , 大小 也 很 标准 , 总体 不错 下次 还 会 光顾 。”

通过上述公式所映射到信用评价指标体系中的各项得分如表4所示:

表4 例句中网商的信用评价指标得分
5 网商信用度的灰色关联分析

灰色系统理论以“部分信息已知, 部分信息未知”的“小样本”、“贫信息”不确定性系统为研究对象, 主要通过对部分已知信息的生成、开发, 提取有价值的信息, 实现对系统的结构性质、演化规律的正确描述与有效监控[ 10, 11]。灰色关联分析模型是通过研究系统因素间的序列所刻画的曲线之间几何位置的接近程度或曲线间的相似程度来体现系统因素之间关系的密切程度, 主要用于系统因素分析、优势分析和方案决策等, 近年来已成为灰色系统理论研究相对活跃的一个分支[ 12]

5.1 网商信用度灰色关联分析的主要流程

(1) 将影响电子商务信用度的三个一级指标组成一级指标集, 并通过德尔菲法确定一级指标的权重。

(2) 通过量化得到一级指标对应的二级指标的评价矩阵, 并采用最大化的规范方法对数据进行标准化处理。

(3) 根据灰色关联度的计算公式计算各项二级指标与期望值之间的灰色关联度。

(4) 计算群灰色关联度与指标权向量。群灰色关联度反映了评价指标对指标体系中其他指标的影响程度。若该指标对其他所有指标的影响程度越大, 则该指标在系统中所含的信息量越大, 相对权重应该越高; 反之, 则说明该指标在系统中所含的信息量越小, 相对权重应该相对越低[ 13]。经过计算得出一级指标对象的各个二级指标的相对权重。

(5) 将得出的网上信用度评价向量进行归一化处理, 得出网商在不同评语级别上的信用等级的隶属度。

5.2 网商信用度灰色关联分析的技术实现

在具体的实现上, 目前已经有较为成熟的应用软件, 由南京航空航天大学博士研究生曾波独立开发完成的“灰色系统理论建模软件”GTMS3.0[ 14]可以进行网商信用度的灰色关联度计算分析。通过该软件可以直接导入Excel形式的数据, 计算过程全部由计算机完成, 并且在可视化方面详细显示了灰色关联度计算中各个步骤的计算结果。

6 实证分析
6.1 数据来源及预处理

笔者对淘宝网七匹狼男装的官方授权店七匹狼立淘专卖店(http://septwolveslt.tmall.com/? spm=a1z10. 1.0.0.CpsXWs) 2013年9月17日至10月17日期间的用户评论信息进行采集, 通过爬虫软件采集商品评论信息3 983条, 设定在评论内容中至少包含3个属性词的条件下, 从中筛选出853条评论信息, 再通过人工的方式去除广告宣传以及重复评论等无用评论信息, 最终得到用于实证分析的用户评论信息837条。采集到的部分评论如表5所示。

表5 用户评论信息
6.2 评论内容的指标量化

通过已经构建的属性词表以及情感词极性算法, 笔者对采集到的用户评论信息经过分词处理后, 依据相关情感词的情感极性以及对属性词的描述映射, 统计出用户评论内容所涉及的各项指标得分, 部分评论指标得分如表6所示。

表6 部分用户评论涉及的指标得分
6.3 网商信用度灰色关联分析

通过德尔菲法对网商信用度评价指标体系中一级指标的权值进行确定, 得到一级指标权向量为[0.5, 0.3, 0.2]。

根据灰色关联度的计算公式计算得出一级指标商品满意度中各项二级指标的灰色关联度分别为{0.702 1, 0.836 9, 0.625 7, 0.601 3}; 一级指标服务满意度中各项二级指标的灰色关联度分别为{0.698 7, 0.607 6}; 一级指标物流满意度中各项二级指标的灰色关联度分别为{0.641 8, 0.583 9}。

通过群灰关联度的计算公式可以得出一级指标商品满意度中各项二级指标的群灰关联度为{0.689 6, 0.667 4, 0.711 2, 0.705 5}, 得到商品满意度指标下各项二级指标权向量为[0.25, 0.23, 0.26, 0.26]; 一级指标服务满意度中各项二级指标的群灰关联度为{0.636 0, 0.699 4}, 得到服务满意度中各项二级指标权向量为[0.48, 0.52]; 一级指标物流满意度中各项二级指标的群灰关联度为{0.582 1, 0.632 8}, 得到物流满意度中各项二级指标权向量为[0.48, 0.52]。由于中间过程计算量较大, 这里仅给出最后结果, 最后得出的可信度评价向量:

经过归一化处理后得出网上信用度的最终结果: (24.4%, 24.4%, 34.1%, 7.3%, 9.8%)。即24.4%的用户认为该商家信用非常好, 24.4%的用户认为该商家信用较好, 34.1%的用户认为该商家的信用度一般, 而分别有7.3%和9.8%的用户认为该商家的信用较差甚至很差。

7 结 语

本文通过对用户在线评论的提取与筛选, 运用灰色系统理论的原理及方法, 对电子商务活动中网商信用度评估的方法进行初步的尝试性研究。从指标体系的建立、数据的预处理到网商信用度的灰色关联分析, 基本构建了一套理论上较为可行、实践上较为简便的网商信用度分析方法。然而它是建立在一般情况中, 在实际中必须根据具体情况去应用, 本文在此提出需要注意的以下三点:

(1) 网商信用度评价指标覆盖了电子商务活动中网商与用户的各个环节, 较好地反映用户实际体验, 客观地反映了网商信用度。但是在实际应用中, 还应该考虑到不同领域、不同商品、不同规模网商存在的差异。因此通过一套通用的网商信用度评价指标体系所得出的结果在准确程度上存在局限性。根据实际情况, 对已有的网商信用度评价指标体系中的各项指标进行添加、删除或者修改, 从而构建针对性较强的评价指标体系。

(2) 随着Web语义分析技术日趋完善, 能够将评论内容进行更加合理、更加智能的分词处理, 基于用户在线评论数据挖掘的研究将更加趋于完善, 本文的研究为该方法提供了可行性依据。但是针对日益丰富的网络用语, 许多的新名词、流行词汇不断出现在用户在线评论中, 为了能够更准确地对用户评论进行量化, 在构建属性词表及情感词表时应当不断补充和更新词表。在能力允许的情况下, 甚至可以按照电子商务活动所涉及的行业构建专业化的词表。

(3) 灰色关联分析方法不仅可以为用户提供最终的信用隶属度结果, 同时还可以反应各项指标权值的动态变化。本文构建了定性分析与定量计算相结合的灰色关联模型用于灰色关联分析, 但值得注意的是, 灰色关联度分辨系数恰当与否是应用灰色关联分析的关键所在。实际中, 必须根据实际情况选择运用。

参考文献
[1] 王学东, 安楠, 崔志恒, . 网商信用指数测度研究——基于改进的AHP法[J]. 现代情报, 2013, 33(9): 4-9.
(Wang Xuedong, An Nan, Cui Zhiheng, et al. Credit Index Measurement of E-traders——Improved AHP Method[J]. Journal of Modern Information, 2013, 33(9): 4-9. ) [本文引用:1]
[2] Corritore C L, Kracher B, Wiedenbeck S. On-line Trust: Concepts, Evolving Themes, a Model[J]. International Journal of Human-Computer Studies, 2003, 58(6): 737-758. [本文引用:1] [JCR: 1.415]
[3] Awad N F, Ragowsky A. Establishing Trust in Electronic Commerce Through Online Word of Mouth: An Examination Across Genders[J]. Journal of Management Information Systems, 2008, 24(2): 101-121. [本文引用:1] [JCR: 1.262]
[4] 李志宇. 在线商品评论效用排序模型研究[J]. 现代图书情报技术, 2013(4): 62-68.
(Li Zhiyu. Study on the Reviews Effectiveness Sequencing Model of Online Products[J]. New Technology of Library and Information Service, 2013(4): 62-68. ) [本文引用:1] [CJCR: 1.073]
[5] 李霄, 丁晟春. 垃圾商品评论信息的识别研究[J]. 现代图书情报技术, 2013(1): 63-68.
(Li Xiao, Ding Shengchun. Research on Reviews Spam Recognition[J]. New Technology of Library and Information Service, 2013(1): 63-68. ) [本文引用:1] [CJCR: 1.073]
[6] 唐晓波, 肖璐. 基于情感分析的评论挖掘模型研究[J]. 情报理论与实践, 2013, 36(7): 100-105.
(Tang Xiaobo, Xiao Lu. Research on the Review Mining Model Based on SentimentAnalysis[J]. Information Studies: Theory & Application, 2013, 36(7): 100-105. ) [本文引用:1] [CJCR: 1.5]
[7] 语言技术平台[EB/OL]. [2013-10-16]. http: //ir. hit. edu. cn/demo/ltp/.
( Language Technology Platform[EB/OL]. [2013 - 10-16]. http://ir.hit.edu.cn/demo/ltp/ [本文引用:2]
[8] 《知网》情感分析词语集[EB/OL]. [2013-10-16]. http: //www. keenage. com/html/c_index. html.
( HowNet [EB/OL]. [2013-10-16]. http://www.keenage.com/html/c_index.html [本文引用:1]
[9] 台湾大学NTUSD-简体中文极性情感词典[EB/OL]. [2013- 10-16]. http: //www. datatang. com/data/11837.
( NTUSD [EB/OL]. [2013-10-16]. http://www.datatang.com/data/11837 [本文引用:1]
[10] 邓聚龙. 灰理论基础[M]. 武汉: 华中科技大学出版社, 2002.
(Deng Julong. The Grey Theory[M]. Wuhan: Huazhong University of Science & Technology Press, 2002. ) [本文引用:1]
[11] 邓聚龙. 灰理论的基本方法[M]. 武汉: 华中科技大学出版社, 2004.
(Deng Julong. The Method of Grey Theory[M]. Wuhan: Huazhong University of Science & Technology Press, 2004. ) [本文引用:1]
[12] 崔杰. 灰色不确定系统建模的理论与方法研究[D]. 南京: 南京航空航天大学, 2010.
(Cui Jie. Study on the Theories and Methods of Modeling for Grey Uncertain Systems [D]. Nanjing: Nanjing University of Aeronautics and Astronautics, 2010. ) [本文引用:1] [CJCR: 0.564]
[13] 潘勇, 孔栋. 电子商务网站可信度评价模型[J]. 情报杂志, 2007, 26(7): 81-87.
(Pan Yong, Kong Dong. A Research on Estimation of Credible Degree of Electric Commerce Web- site[J]. Journal of Intelligence, 2007, 26(7): 81-87. ) [本文引用:1] [CJCR: 0.951]
[14] 刘思峰. 灰色系统理论及应用[M]. 北京: 科学出版社, 2010.
(Liu Sifeng. The Theory and Application of Grey System[M]. Beijing: Science Press, 2010. ) [本文引用:1]