Please wait a minute...
Advanced Search
现代图书情报技术  2011, Vol. 27 Issue (5): 49-54     https://doi.org/10.11925/infotech.1003-3513.2011.05.08
  知识组织与知识管理 本期目录 | 过刊浏览 | 高级检索 |
结合商品标题和描述的在线评论特征词选择方法研究
梁昌勇, 王倩倩, 陆文星, 丁勇
合肥工业大学管理学院 合肥 230009
The Online Comments Signature Words Selection with the Title and Description of Goods
Liang Changyong, Wang Qianqian, Lu Wenxing, Ding Yong
School of Management, Hefei University of Technology, Hefei 230009, China
全文: PDF (1091 KB)   HTML  
输出: BibTeX | EndNote (RIS)      
摘要 目前,国内外对在线评论特征词的研究很少考虑到卖家发布的商品标题和描述信息,这使得数据挖掘过程盲目,挖掘结果准确率不高。采用聚类分析方法,把商品标题和描述考虑进来,搭建三层挖掘模型对在线评论进行研究和分析,提出定位L-K-中心点算法。实验结果证明,该方法能提高挖掘的准确率,减少挖掘时间。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
梁昌勇
王倩倩
陆文星
丁勇
关键词 聚类特征词定位K-中心点算法    
Abstract:At present, title and description of goods are rarely considered in the research of online reviews at home and abroad, this makes the mining process blindly and mining results are not high accurate. In this article, the authors use the cluster analysis method, consider the title and description, set up a three-level mining model to analyze the online comments, at the same time, a location-clustering-algorithm is proposed. Experimental results show that the method improves the accuracy of mining and reduces the mining time.
Key wordsCluster analysis    Signature words    Location    K-center-algorithm
收稿日期: 2011-03-16      出版日期: 2011-07-11
: 

TP391

 
基金资助:

本文系国家社会科学基金项目“基于OCB视角的互联网知识创造与传播问题研究”(项目编号: 09CTQ023)的研究成果之一。

引用本文:   
梁昌勇, 王倩倩, 陆文星, 丁勇. 结合商品标题和描述的在线评论特征词选择方法研究[J]. 现代图书情报技术, 2011, 27(5): 49-54.
Liang Changyong, Wang Qianqian, Lu Wenxing, Ding Yong. The Online Comments Signature Words Selection with the Title and Description of Goods. New Technology of Library and Information Service, 2011, 27(5): 49-54.
链接本文:  
https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/10.11925/infotech.1003-3513.2011.05.08      或      https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/Y2011/V27/I5/49
[1] Nicholls C, Song F. Comparison of Feature Selection Methods for Sentiment Analysis . In:Proceedings of the Canadian Conference on Artificial Intelligence,Advances in Artificial Intelligence Lecture Notes in Computer Science. 2010: 286-289.

[2] Li Z, Zhang M,Ma S,et al. Automatic Extraction for Product Feature Words from Comments on the Web . In: Proceedings of the 5th Asia Information Retrieval Symposium on Information Retrieval Technology.2009:112-123.

[3] Yang Y,Wu Y,Li J.Text Similarity Calculation Based on Potential Feature Words[J]. Computer Engineering and Design, 2011,14(2):240-245.

[4] 余传明.从用户评论中挖掘产品属性——基于SOM的实现[J]. 现代图书情报技术, 2009(5):3-6.

[5] 钟敏娟,万常选,焦贤沛.基于聚类和词组抽取的XML查询扩展[J]. 情报学报, 2010,29(4):11-13.

[6] Kobayashi N, Inui K, Matsumoto Y,et al. Collecting Evaluative Expressions for Opinion Extraction . In:Proceedings of the 1st Conference of International Joint Conference on Natural Language Processing.2004: 596-605.

[7] 姚天昉,程希文,徐飞玉,等.文本意见挖掘综述[J]. 中文信息学报, 2008,22(3):71-80.

[8] Han J,Kamber M.Date Mining: Concepts and Techniques[M].北京:机械工业出版,2001:234-235.
[1] 王若琳, 牛振东, 蔺奇卡, 朱一凡, 邱萍, 陆浩, 刘东磊. 基于异质信息嵌入与RNN聚类参数预测的作者姓名消歧方法*[J]. 数据分析与知识发现, 2021, 5(8): 13-24.
[2] 王晰巍,贾若男,韦雅楠,张柳. 多维度社交网络舆情用户群体聚类分析方法研究*[J]. 数据分析与知识发现, 2021, 5(6): 25-35.
[3] 卢利农,祝忠明,张旺强,王小春. 基于Lingo3G聚类算法的机构知识库跨库知识整合与知识指纹服务实现[J]. 数据分析与知识发现, 2021, 5(5): 127-132.
[4] 张梦瑶, 朱广丽, 张顺香, 张标. 基于情感分析的微博热点话题用户群体划分模型 *[J]. 数据分析与知识发现, 2021, 5(2): 43-49.
[5] 丁浩, 艾文华, 胡广伟, 李树青, 索炜. 融合用户兴趣波动时序的个性化推荐模型*[J]. 数据分析与知识发现, 2021, 5(11): 45-58.
[6] 杨辰, 陈晓虹, 王楚涵, 刘婷婷. 基于用户细粒度属性偏好聚类的推荐策略*[J]. 数据分析与知识发现, 2021, 5(10): 94-102.
[7] 于丰畅,程齐凯,陆伟. 基于几何对象聚类的学术文献图表定位研究[J]. 数据分析与知识发现, 2021, 5(1): 140-149.
[8] 温萍梅,叶志炜,丁文健,刘颖,徐健. 命名实体消歧研究进展综述*[J]. 数据分析与知识发现, 2020, 4(9): 15-25.
[9] 邬金鸣,侯跃芳,崔雷. 基于医学主题词标引规则的词共现聚类分析结果自动判读和表达的研究[J]. 数据分析与知识发现, 2020, 4(9): 133-144.
[10] 席运江, 杜蝶蝶, 廖晓, 仉学红. 基于超网络的企业微博用户聚类研究及特征分析*[J]. 数据分析与知识发现, 2020, 4(8): 107-118.
[11] 杨旭,钱晓东. 基于改进的Vicsek模型的社会网络同步聚类算法*[J]. 数据分析与知识发现, 2020, 4(4): 119-128.
[12] 熊回香,李晓敏,李跃艳. 基于图书评论属性挖掘的群组推荐研究*[J]. 数据分析与知识发现, 2020, 4(2/3): 214-222.
[13] 魏家泽,董诚,何彦青,刘志辉,彭柯芸. 基于均衡段落和分话题向量的新闻热点话题检测研究*[J]. 数据分析与知识发现, 2020, 4(10): 70-79.
[14] 赵华茗,余丽,周强. 基于均值漂移算法的文本聚类数目优化研究 *[J]. 数据分析与知识发现, 2019, 3(9): 27-35.
[15] 李珊,姚叶慧,厉浩,刘洁,嘎玛白姆. 基于ISA联合聚类的组推荐算法研究 *[J]. 数据分析与知识发现, 2019, 3(8): 77-87.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn