%A 王婷婷, 王宇, 秦琳杰 %T 基于动态主题模型的时间窗口划分研究* %0 Journal Article %D 2018 %J 数据分析与知识发现 %R 10.11925/infotech.2096-3467.2018.0196 %P 54-64 %V 2 %N 10 %U {https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/abstract/article_4565.shtml} %8 2018-10-25 %X

【目的】为解决动态主题模型时间窗口的自主划分问题, 提出基于动态自适应时间窗口划分的DIM模型。【方法】通过传统的LDA主题模型和词向量模型对文本语料进行量化; 构建反映时间窗口间差异性和时间窗口内相似性的综合指标; 基于该指标构建自适应时间窗口划分的DIM模型, 并针对“一带一路”国际合作高峰论 坛的新闻语料进行实证研究。【结果】基于动态自适应时间窗口划分的DIM模型能够迅速、有效地划分时间窗口, 不但保证了不同窗口下主题间的可比性, 还能够对文档的影响因素进行评价。【局限】时间窗相似度综合指标基于传统LDA模型构造, 也可采用LDA族类的其他模型进行改进。【结论】新模型具有自适应划分时序文本的能力, 是对传 统动态主题模型的一种有效改进。