Please wait a minute...
Advanced Search
数据分析与知识发现  2018, Vol. 2 Issue (3): 1-8     https://doi.org/10.11925/infotech.2096-3467.2017.0849
  研究论文 本期目录 | 过刊浏览 | 高级检索 |
基于用户生成内容的潜在客户识别方法*
蒋翠清(), 宋凯伦, 丁勇, 刘尧
合肥工业大学管理学院 合肥 230009
Identifying Potential Customers Based on User-Generated Contents
Jiang Cuiqing(), Song Kailun, Ding Yong, Liu Yao
School of Management, Hefei University of Technology, Hefei 230009, China
全文: PDF (601 KB)   HTML ( 9
输出: BibTeX | EndNote (RIS)      
摘要 

目的】从产品论坛中识别潜在客户, 对产品论坛中的用户生成内容特征进行分析, 识别有购买意愿的产品潜在客户。【方法】将不均衡数据集转换为n个均衡数据集, 结合Stacking分类算法识别潜在客户, 分别使用基分类器算法和本文提出的针对不均衡数据集的Stacking分类算法对样本数据进行测试, 并通过对比F值验证本文算法的有效性。【结果】本文提出的算法的F值较贝叶斯网络、逻辑回归、C4.5决策树、SMO和朴素贝叶斯5种基分类器算法分别提高17.4%、26.5%、24.1%、29.3%、40.9%, 较Stacking、Bagging和Boosting三种集成学习算法分别提高10.1%、5.9%、13.1%。【局限】研究语料来源于汽车行业, 具有一定的领域局限性。【结论】该方法能有效识别潜在客户。

服务
把本文推荐给朋友