Please wait a minute...
Advanced Search
  • 数据分析与知识发现
      2018年, 第2卷, 第11期 刊出日期:2018-11-25   
    选择: 合并摘要
    专题
    “电子商务与大数据”专题序
    赵杨, 张李义
    数据分析与知识发现. 2018, 2 (11): 1-1.  
    摘要   HTML ( 4 PDF(229KB) ( 278 )  
    References | Related Articles | Metrics
    基于机器学习混合算法的APP广告转化率预测研究*
    赵杨, 袁析妮, 陈亚文, 武立强
    数据分析与知识发现. 2018, 2 (11): 2-9.   DOI: 10.11925/infotech.2096-3467.2018.0834
    摘要   HTML ( 12 PDF(741KB) ( 270 )  

    【目的】利用机器学习算法对APP广告转化率进行有效预测, 提高广告投放效果, 更好地开展营销活动。【方法】针对APP广告特性, 综合应用梯度提升决策树、随机森林、LightGBM、XGBoost、场感知因子分解机模型、Vowpal Wabbit等机器学习算法构建APP广告转化率预测模型——RF+LXFV, 使用腾讯APP广告数据对模型的有效性与精确性进行检验。【结果】通过对比预测结果, 在Log-Loss(0.105)和AUC(0.786)两个指标上的表现, 发现基于RF+LXFV模型的APP广告转化率预测结果比基于单一机器学习算法的预测结果精确度更高。【局限】未充分考虑广告转化延迟对转化率预测的影响。【结论】RF+LXFV模型是预测APP广告转化率的一种有效方法。

    图表 | 参考文献 | 相关文章 | 多维度评价
    新消费者重复购买意向预测研究*
    张李义, 李一然, 文璇
    数据分析与知识发现. 2018, 2 (11): 10-18.   DOI: 10.11925/infotech.2096-3467.2018.0823
    摘要   HTML ( 7 PDF(944KB) ( 942 )  

    【目的】比较不同算法的预测准确率和效率, 以准确预测有重复购买意向的新消费者, 为客户分类提供理论依据。【方法】基于淘宝网某店铺2015年5月-2018年5月的后台数据, 结合订单与消费者信息, 采用不同的机器学习算法分别进行训练。【结果】融合SMOTE算法与随机森林算法的预测准确率最高, 达到96%。【局限】数据量较小, 属性类别不够全面。【结论】基于SMOTE和随机森林的融合算法对重复购买意向的预测有较高的准确率和效率, 可以为预测新消费者的重复购买意向提供参考。

    图表 | 参考文献 | 相关文章 | 多维度评价
    基于在线评论情感分析的海淘APP用户满意度研究*
    赵杨, 李齐齐, 陈雨涵, 曹文航
    数据分析与知识发现. 2018, 2 (11): 19-27.   DOI: 10.11925/infotech.2096-3467.2018.0835
    摘要   HTML ( 16 PDF(1546KB) ( 617 )  

    【目的】对用户在线评论文本进行情感分析, 评价用户满意度, 为海淘APP运营商提供对策建议。【方法】基于APP Store上的海淘APP用户在线评论数据, 采用Canopy+K-means方法对海淘APP属性特征进行聚类, 确定用户满意度评价维度, 进而应用CNN-SVM情感分析模型得到各维度的用户满意度评分。【结果】研究结果表明: 影响海淘APP用户满意度最重要的因素是商品, 其次分别是价格、交互、服务、物流; 垂直类海淘APP的用户满意度整体高于境外买手类和综合类海淘APP; 海淘APP在物流和服务方面的用户满意度整体较低。 【局限】样本选择较为有限。【结论】采用情感分析方法对海淘APP用户在线评论进行文本分析, 为APP用户满意度评价提供有效方法。

    图表 | 参考文献 | 相关文章 | 多维度评价
    基于TF-IDF的情境后过滤推荐算法研究*——以餐饮业O2O为例
    殷聪, 张李义
    数据分析与知识发现. 2018, 2 (11): 28-36.   DOI: 10.11925/infotech.2096-3467.2018.0832
    摘要   HTML ( 3 PDF(821KB) ( 378 )  

    【目的】深入研究融合情境信息的个性化推荐, 缓解信息过载问题。【方法】本文提出基于TF-IDF的情境后过滤推荐算法, 在改进现有算法的基础上, 结合情境关联概率和情境普遍重要性构建情境偏好预测模型, 对结合项目类别偏好的传统推荐初始评分进行调整生成最终推荐。【结果】以餐饮业为例的实证分析表明: 相比改进前的算法, 本文算法推荐效果更佳。【局限】情境关联获取的准确性有待提高。【结论】情境信息在用户行为与决策中尤为重要, 未来需结合情境建模推荐范式对融合情境的个性化推荐算法进行更加深入的研究。

    图表 | 参考文献 | 相关文章 | 多维度评价
    大数据背景下基于LMBP算法的供应链绩效评价与优化*
    孟虎, 梁晓蓓, 杨以雄, 李敏
    数据分析与知识发现. 2018, 2 (11): 37-45.   DOI: 10.11925/infotech.2096-3467.2018.0833
    摘要   HTML ( 3 PDF(625KB) ( 279 )  

    【目的】利用反馈神经网络LMBP算法进行供应链绩效评价和优化, 为企业提供决策参考。【方法】构建供应链评价模型, 利用模型原理和算例J企业的数据, 对21项评价指标进行梳理, 利用MATLAB编程, 验证该算法的有效性并提出相应优化方向。【结果】在供应链管理中应用本文方法能帮助企业及时获取绩效分析结果, 提高采购、库存、销售等环节的管理效率, 降低企业经营成本, 提高各项决策准确性。【局限】优化方案的适用性和普及性有待考证。【结论】本文方法能提高供应链绩效评价的准确性, 并快速指明供应链绩效优化方向。

    图表 | 参考文献 | 相关文章 | 多维度评价
    共享短租平台商家属性对消费者网络口碑的影响研究*
    梁晓蓓, 徐真, 李晶晶
    数据分析与知识发现. 2018, 2 (11): 46-53.   DOI: 10.11925/infotech.2096-3467.2018.0836
    摘要   HTML ( 5 PDF(517KB) ( 287 )  

    【目的】深入探讨共享短租平台的线上商家属性对网络口碑(eWOM)的影响机制。【方法】以信号理论为基础, 基于共享短租平台Airbnb的Python爬虫数据信息, 建立泊松回归模型, 研究与电子服务质量相关的线上商家属性对消费者eWOM行为的影响。【结果】研究结果表明, 商家的特色介绍、售后互动、即时预订、日历更新、回复时间、优质商家、身份认证显著正向影响房源的eWOM。【局限】仅选取北京地区的Airbnb样本, 结果欠缺普适性。【结论】本研究结果对于提升共享短租在线商家的网络口碑具有借鉴意义。

    图表 | 参考文献 | 相关文章 | 多维度评价
    研究论文
    基于成员合作共现的微信群内部关系研究*
    李纲, 王晓, 郭洋
    数据分析与知识发现. 2018, 2 (11): 54-63.   DOI: 10.11925/infotech.2096-3467.2018.0320
    摘要   HTML ( 4 PDF(1546KB) ( 445 )  

    【目的】分析与测算微信群成员之间的隐性关系及其强度, 并与显性关系相结合得到全关系以完善微信群 内部社会网络刻画。【方法】以微信趣缘群为例, 研究群成员之间基于话题的合作共现并将其作为隐性关系的测 量指标, 借鉴Salton指数计算关系强度。分析成员的话题讨论参与情况和隐性关系分布, 对比显性关系网络和全 关系网络。【结果】话题讨论情况可以清晰反映群成员的亲疏关系; 与成立目的有关的话题讨论有助于经营和维护成员关系。【局限】对群成员的讨论参与度和话题贡献度有进一步详细测量的优化空间。【结论】综合显性关系与隐性关系的全关系网络对微信群内部关系网络结构的刻画相较于显性关系更加全面, 且能够揭示出更丰富的信息。

    图表 | 参考文献 | 相关文章 | 多维度评价
    基于CSToT模型的科技文献主题发现与演化研究*
    何伟林, 奉国和, 谢红玲
    数据分析与知识发现. 2018, 2 (11): 64-72.   DOI: 10.11925/infotech.2096-3467.2018.0292
    摘要   HTML ( 1 PDF(1106KB) ( 247 )  

    【目的】分析某研究领域科技文献在一段时间内的主题结构并追踪其变化。【方法】基于改进的主题模型CSToT(Content Similarity-Topics over Time), 以国内情报学领域9种期刊作为数据来源, 分析国内情报学领域2012年-2016年的研究主题结构以及其演化过程。【结果】CSToT模型能清晰揭示科技文献主题结构, 并获得主题演化关系。对案例数据分析后发现, 国内情报学领域研究范围广泛, 涉及信息服务、网络舆情、数据挖掘等方面; 演化趋势分为上升型、下降型、稳定型和波动型4种; 关于信息服务的研究路线演化尤为凸显。【局限】训练数据规模不够大。【结论】CSToT模型能有效识别科技文献主题结构并获取其演化关系, 为相关学科领域的研究与发展提供参考和依据。

    图表 | 参考文献 | 相关文章 | 多维度评价
    新能源领域专利转让加权网络中主体间技术交易机会预测*
    武玉英, 孙平, 何喜军, 蒋国瑞
    数据分析与知识发现. 2018, 2 (11): 73-79.   DOI: 10.11925/infotech.2096-3467.2018.0254
    摘要   HTML ( 2 PDF(540KB) ( 284 )  

    【目的】通过挖掘专利转让加权网络主体信息及结构特征对交易机会进行预测, 促进技术供需有效对接。【方法】采集新能源领域2012年-2016年数据构建专利转让加权网络, 通过熵权法融合网络结构与内容指标, 结合网络真实权重与结构权重, 利用BP神经网络预测技术交易机会及其权重。【结果】融合结构指标RA与内容指标Cosine的预测精度达到94.28%, 在所有指标组合中最高; 结合网络真实权重与结构权重预测链接权重, 预测误差有所降低。【局限】模型未充分考虑节点属性及网络演化机制。【结论】链路预测方法具有较高预测精度, 能更全面挖掘专利技术交易网络中潜在供需主体对及其权重, 对实践具有一定指导意义。

    图表 | 参考文献 | 相关文章 | 多维度评价
    基于社会网络分析的网络问答社区知识传播研究
    王忠义, 张鹤铭, 黄京, 李春雅
    数据分析与知识发现. 2018, 2 (11): 80-94.   DOI: 10.11925/infotech.2096-3467.2018.0293
    摘要   HTML ( 8 PDF(3421KB) ( 606 )  

    【目的】通过分析网络问答社区的社会网络结构和知识传播机制, 研究节点在网络问答社区的知识传播与学习的效用, 从而指导用户在网络问答社区中更高效地学习。【方法】结合社会网络分析方法和熵权法描绘意见领袖的知识能力和传播影响力, 而后针对网络问答社区社会网络的小世界特征, 在借鉴Cowan模型的基础上建立一个知识传播模型, 并通过系统模拟仿真对该网络内部的知识学习效果进行实验。【结果】知识存量越少的节点在网络中的学习效率越高, 该现象类似于森林的“海绵效应”; 一些节点的知识存量增长较快, 其知识存量的增长倍数远远大于那些当初知识存量较高的节点; 随着时间的增长, 网络的知识传播速率一直处于下降的趋势; 知识增量与知识能力指数和传播能力指数都有很强的关系。【局限】在关于传播动力学模型的假设上, 本文未考虑到网络的动态随机重连。【结论】本文较为客观地评价了网络问答社区的知识传播与学习效用的情况, 并提出相应建议以提升用户在网络问答社区中的学习效果。

    图表 | 参考文献 | 相关文章 | 多维度评价
    基于辅助集的专利主题分析领域停用词 选取*
    俞琰, 赵乃瑄
    数据分析与知识发现. 2018, 2 (11): 95-103.   DOI: 10.11925/infotech.2096-3467.2018.0240
    摘要   HTML ( 3 PDF(591KB) ( 265 )  

    【目的】提出一种领域停用词自动选取方法, 以提高专利主题分析的区分度和质量。【方法】针对要进行专利主题分析的目标集, 引入专利辅助集, 提出基于辅助集文档频率和类别熵两个指标, 衡量词语在辅助集中分布情况, 自动识别领域停用词。【结果】实验结果表明, 基于辅助集的领域停用词选取方法能够提高专利主题分析的区分度和质量。【局限】辅助集的选取类型和数量有待进一步研究。【结论】基于辅助集的领域停用词选取方法能够有效地衡量词的分布特征, 从而更准确地选取专利主题分析中的领域停用词。

    图表 | 参考文献 | 相关文章 | 多维度评价
版权所有 © 2015 《数据分析与知识发现》编辑部
地址:北京市海淀区中关村北四环西路33号 邮编:100190
电话/传真:(010)82626611-6626,82624938
E-mail:jishu@mail.las.ac.cn