一种基于LDA主题模型的政策文本聚类方法研究*
张涛, 马海群

Clustering Policy Texts Based on LDA Topic Model
Zhang Tao,Ma Haiqun
表1 主题挖掘结果
主题1 主题2 主题3 主题4
旅游0.0213613 信息安全 0.0204932 传统 0.0323346 体育 0.0316222
城市0.0099187 数据 0.0168339 工艺 0.0225906 发展 0.0255651
发展0.0087745 信息 0.0133837 计划 0.0172757 工作 0.0160342
休闲0.0082023 技术 0.0126518 文物 0.0168327 建设 0.0097989
注意0.0076302 大数据 0.0116063 专业 0.0148396 体育产业 0.0096209
消费0.0066767 网络 0.0116063 传承人 0.0135109 社会 0.0075722
过程0.0061045 数据安全 0.0101426 技艺 0.0124036 国家 0.0071268
适应0.0059138 企业 0.0086788 青瓷 0.0115178 学校 0.0070377
环境0.0057231 系统 0.0085743 艺术 0.0104105 开展活动 0.0063251