Please wait a minute...
Advanced Search
数据分析与知识发现  2017, Vol. 1 Issue (8): 59-67     https://doi.org/10.11925/infotech.2096-3467.2017.08.07
  首届"数据分析与知识发现"学术研讨会专辑(II) 本期目录 | 过刊浏览 | 高级检索 |
基于电子商务评论的商家信誉维度构建*
王宇(), 李秀秀
大连理工大学管理与经济学部 大连 116024
Evaluating Business Reputation with E-Commerce Comments
Wang Yu(), Li Xiuxiu
Faculty of Management and Economics, Dalian University of Technology, Dalian 116024, China
全文: PDF (1390 KB)   HTML ( 2
输出: BibTeX | EndNote (RIS)      
摘要 

目的】通过对电子商务评论文本的分析和处理, 获取有效的商家信誉信息, 从客观角度建立商家信誉维度体系。【方法】基于HNC理论的同行优先原理和文本挖掘方法提出改进的评论文本主题词抽取方法和主题词聚类算法, 并进行类簇标签抽取及各类簇权重计算。【结果】生成商家信誉维度体系及各维度权重, 以京东平台手机评论文本为实例, 构建商家信誉维度体系, 并对其进行评价, 证明方法的可行性与有效性。【局限】受HNC词库不全的影响需手工生成一部分字词符号, 在应用到更大规模的评论文本处理时可能会存在限制。【结论】利用本文提出的方法建立的商家信誉维度体系能够客观地反映出用户真正关心的商品指标。

服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
王宇
李秀秀
关键词 评论文本主题词聚类信誉维度电子商务    
Abstract

[Objective] This paper proposes a new method to evaluate business reputation based on e-commerce comments. [Methods] First, we modified the key word extraction and clustering algorithm based on the HNC theory and text mining methods. Then, we extracted the cluster labels and calculated the weight of each cluster of the collected comments. [Results] We established a business reputation dimension system, with cellphone users’ reviews posted on the Jingdong Online Shopping Platform. [Limitations] Some of the word symbols were generated manually due to the incomplete HNC thesaurus, which posed negative effects to larger-scale comments analysis. [Conclusions] The business reputation evaluation system can identify the commodity features that users really care about.

Key wordsComment Texts    Topic Words Clustering    Reputation Dimension    E-Commerce
收稿日期: 2017-05-27      出版日期: 2017-09-28
ZTFLH:  TP391  
基金资助:*本文系国家自然科学基金重点项目“社会化商务中参与者的信誉与信任机理及交易决策研究”(项目编号: 71431002)的研究成果之一
引用本文:   
王宇, 李秀秀. 基于电子商务评论的商家信誉维度构建*[J]. 数据分析与知识发现, 2017, 1(8): 59-67.
Wang Yu,Li Xiuxiu. Evaluating Business Reputation with E-Commerce Comments. Data Analysis and Knowledge Discovery, 2017, 1(8): 59-67.
链接本文:  
http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.2096-3467.2017.08.07      或      http://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2017/V1/I8/59
  例句句法分析
  三种主题词抽取方法的准确率对比
  三种主题词抽取方法召回率对比
  三种聚类方法准确率对比
  三种聚类方法召回率对比
  手机评论数据(部分)
序号 维度名称 簇标签 主题词数量
(累计词频)
权重
1 性能质量 屏幕-性能-系统-电池 1 743 0.36
2 客服服务 服务-客服-态度 1 300 0.27
3 物流速度 快递-物流 578 0.12
4 诚实守信 正品-正版-原装 482 0.10
5 外形设计 外形-外观 424 0.09
6 产品价格 价-价格 289 0.06
  聚类结果
  商家信誉维度体系
  文献[6]构建的手机商家信誉维度
[1] 艾瑞咨询. 2016年第三季度电子商务核心数据发布[EB/ OL]. [2017-04-12]. .
[1] (IResearch. The 3rd Quarter of 2016 E-commerce Core Data Release [EB/OL]. [2017-04-12].
[2] 中文互联网数据资讯中心. 2016年全球互联网、社交媒体、移动设备普及情况报告[EB/OL]. [2017-04-12]. .
[2] (Chinese Internet Data Center. 2016 Global Internet, Social Media, Mobile Device Popularity Report [EB/OL]. [2017-04-12].
[3] 鲁文. 社会化电子商务在线信誉的模型构建及实证研究[D]. 沈阳: 沈阳工业大学, 2015.
[3] (Lu Wen.Model Construction and Empirical Study on Online Reputation of Social Commerce [D]. Shenyang: Shenyang University of Technology, 2015.)
[4] 茹永梅. 基于模糊理论的O2O模式商家信誉评估模型[J]. 西安邮电大学学报, 2016, 21(3): 120-126.
[4] (Ru Yongmei.Reputation Evaluation Model for O2O Mode Businesses Based on Fuzzy Theory[J]. Journal of Xi’an University of Posts and Telecommunications, 2016, 21(3): 120-126.)
[5] 吴维芳, 高宝俊, 杨海霞, 等. 评论文本对酒店满意度的影响: 基于情感分析的方法[J]. 数据分析与知识发现, 2017, 1(3): 62-71.
[5] (Wu Weifang, Gao Baojun, Yang Haixia, et al.The Impacts of Reviews on Hotel Satisfaction: A Sentiment Analysis Method[J]. Data Analysis and Knowledge Discovery, 2017, 1(3): 62-71.)
[6] 赵学锋, 陈传红, 陈获帆, 等. 基于文本聚类的电子零售商信誉维度发现研究[J]. 情报学报, 2011, 30(1): 63-75.
doi: 10.3772/j.issn.1000-0135.2011.01.010
[6] (Zhao Xuefeng, Chen Chuanhong, Chen Huofan, et al.Study on the Discovery of Reputation Dimension of Online Merchants Based on Text-clustering[J]. Journal of the China Society for Scientific and Technical Information, 2011, 30(1): 63-75.)
doi: 10.3772/j.issn.1000-0135.2011.01.010
[7] 赵学锋, 汤庆, 张睿, 等. 基于客户评论和语料库的在线酒店信誉维度挖掘[J]. 图书情报工作, 2012, 56(12): 124-129.
[7] (Zhao Xuefeng, Tang Qing, Zhang Rui, et al.Exploration of Dimensions of the Online Hotel Reputation Based on Customers’ Text Comments and Corpus[J]. Library and Information Service, 2012, 56(12): 124-129.)
[8] 黄曾阳. HNC(概念层次网络)理论—计算机理解语言研究的新思路[M]. 北京: 清华大学出版社, 1998.
[8] (Huang Zengyang.HNC(Hierarchical Network of Concepts) —A New Approach to Computer Understanding Language Research [M]. Beijing: Tsinghua University Press, 1998.)
[9] Jiang M, Yan W, Wang X, et al.Wikipedia Based Approach for Clustering Keyword of Reviews[J]. Journal of Software, 2014, 9(9): 2246-2250.
doi: 10.4304/jsw.9.9.2246-2250
[10] 耿焕同, 蔡庆生, 于琨, 等. 一种基于词共现图的文档主题词自动抽取方法[J]. 南京大学学报, 2006, 42(2): 156-162.
doi: 10.3321/j.issn:0469-5097.2006.02.006
[10] (Geng Huantong, Cai Qingsheng, Yu Kun, et al.A Kind of Automatic Text Keyphrase Extraction Method Based on Word Co-occurrence[J]. Journal of Nanjing University, 2006, 42(2): 156-162.)
doi: 10.3321/j.issn:0469-5097.2006.02.006
[11] 陈炯, 张永奎. 一种基于词聚类的中文文本主题抽取方法[J]. 计算机应用, 2005, 25(4): 754-756.
doi: 10.3724/SP.J.1087.2005.0754
[11] (Chen Jiong, Zhang Yongkui.Novel Chinese Text Subject Extraction Method Based on Word Clustering[J]. Computer Applications, 2005, 25(4): 754-756.)
doi: 10.3724/SP.J.1087.2005.0754
[12] 晋耀红. HNC(概念层次网络)语言理解技术及其应用[M]. 北京: 科学出版社, 2006.
[12] (Jin Yaohong.HNC (Hierarchical Network of Concepts) Language Understanding Technology and Its Applications[M]. Beijing: Science Press, 2006.)
[13] 苗传江. HNC(概念层次网络)理论导论[M]. 北京: 清华大学出版社, 2005.
[13] (Miao Chuanjiang.HNC (Hierarchical Network of Concepts) Introduction to the Theory [M]. Beijing: Tsinghua University Press, 2005.)
[14] 吴佐衍, 王宇. 基于HNC理论的词语相似度计算[J]. 中文信息学报, 2014, 28(2): 37-43.
doi: 10.3969/j.issn.1003-0077.2014.02.005
[14] (Wu Zuoyan, Wang Yu.A New Measure of Semantic Similarity Based on Hierarchical Network of Concepts[J]. Journal of Chinese Information Processing, 2014, 28(2): 37-43.)
doi: 10.3969/j.issn.1003-0077.2014.02.005
[15] 魏桂英, 郑玄轩. 层次聚类方法的CURE算法研究[J]. 科技和产业, 2005, 5(11): 24-26.
[15] (Wei Guiying, Zheng Xuanxuan.Research on CURE Algorithm of Hierarchical Clustering Method[J]. Science Technology and Industry, 2005, 5(11): 24-26.)
[16] 邵洪雨. 短文本聚类及聚类结果描述方法研究[D]. 大连: 大连理工大学, 2014.
[16] (Shao Hongyu.Research on Short Text Clustering and Cluster Description Method [D]. Dalian: Dalian University of Technology, 2014.)
[17] 夏天. 词向量聚类加权TextRank的关键词抽取[J]. 数据分析与知识发现, 2017, 1(2): 28-34.
[17] (Xia Tian.Extracting Keywords with Modified TextRank Model[J]. Data Analysis and Knowledge Discovery, 2017, 1(2): 28-34.)
[18] 陈毅恒. 文本检索结果聚类及类别标签抽取技术研究[D]. 哈尔滨: 哈尔滨工业大学, 2010.
[18] (Chen Yiheng.Research on Text Retrieval Results Clustering and Label Extraction[D]. Harbin: Harbin Institute of Technology, 2010.)
[1] 吴佳芬,马费成. 产品虚假评论文本识别方法研究述评 *[J]. 数据分析与知识发现, 2019, 3(9): 1-15.
[2] 李晓峰,马静,李驰,朱恒民. 基于XGBoost模型的电商商品品名识别算法研究 *[J]. 数据分析与知识发现, 2019, 3(7): 34-41.
[3] 高歌,罗珺玫,王宇. 基于HNC理论的文本情感倾向性分析*[J]. 数据分析与知识发现, 2017, 1(8): 85-91.
[4] 薛福亮, 刘君玲. 基于用户间信任关系改进的协同过滤推荐方法*[J]. 数据分析与知识发现, 2017, 1(7): 90-99.
[5] 吴维芳, 高宝俊, 杨海霞, 孙含琳. 评论文本对酒店满意度的影响: 基于情感分析的方法[J]. 数据分析与知识发现, 2017, 1(3): 62-71.
[6] 朱鹏, 赵笑笑, 伍薇. 移动电子商务消费者决策偏好影响因素实证研究*[J]. 数据分析与知识发现, 2017, 1(3): 1-9.
[7] 李慧, 柴亚青. 基于属性特征的评论文本情感极性量化分析*[J]. 数据分析与知识发现, 2017, 1(10): 1-11.
[8] 张文君, 王军, 徐山川. 电商用户需求状态的聚类分析——以淘宝网女装为例[J]. 现代图书情报技术, 2015, 31(3): 67-74.
[9] 高劲松, 梁艳琪, 李珂, 肖涟, 周习曼. 面向关联数据的电子商务信用信息服务模型研究[J]. 现代图书情报技术, 2014, 30(6): 8-16.
[10] 孙霄凌, 赵宇翔, 朱庆华. 在线商品评论系统功能需求的Kano模型分析——以我国主要购物网站为例[J]. 现代图书情报技术, 2013, (6): 76-84.
[11] 沈洪洲, 宗乾进, 袁勤俭. 应用Google云消息框架C2DM实现商务信息推送服务[J]. 现代图书情报技术, 2012, 28(6): 78-83.
[12] 李慧, 刘东苏. 消除用户主观评价差异的电子商务信誉模型[J]. 现代图书情报技术, 2012, 28(2): 48-52.
[13] 李聪. 电子商务协同过滤可扩展性研究综述[J]. 现代图书情报技术, 2010, 26(11): 37-41.
[14] 李聪. ECRec: 基于协同过滤的电子商务个性化推荐管理*[J]. 现代图书情报技术, 2009, (10): 34-39.
[15] 李纲,安璐. 基于SOM的手机电子商务交易聚类分析*[J]. 现代图书情报技术, 2008, 24(9): 70-77.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn