LDA模型的优化及其主题数量选择研究*——以科技文献为例
王婷婷, 韩满, 王宇

Optimizing LDA Model with Various Topic Numbers: Case Study of Scientific Literature
Wang Tingting,Han Man,Wang Yu
表4 K-wrLDA模型下的主题识别结果
主题0 主题1 主题2 主题3 主题4 主题5 主题6 主题7 主题8 主题9
评论 专利 问句检索 查询 医疗论坛 随机变量 新闻 视图 教育资源 文本分割
短文本分类 发明人 运动 分布式 舆论 超文本 推荐算法 低质量回帖 视觉单词 任务模型
点击率 投诉 广告投放 word2vec 脑血管病 情感分类 人群 关键词抽取 提案 语义信息
句子 汽车缺陷 实体 矩阵分解 话题检测 文档 用户兴趣 博客 主题模型可视化 数字资源
相似性度量 遥感 关联主题 词聚类 查询 信息熵 用户评论 安全隐患 观点 特征项
词向量 作弊 单机 共享内存 咨询 网络舆情 粒计算 交通 视频 词向量
观点摘要 mixtureLDA 词项 文本建模 语义指纹 主题情感混合模型 online 关键词集 帐号 投放
朴素贝叶斯 词义 投放 消息传递算法 标记 自动应答系统 个性化推荐 隐患 句群 主题特征
引文上下文 用户 相似度算法 线程 文章 标签抽取 新浪微博 查询 语义标注 偏斜
共享主题 兴趣 热点话题 数字 相似矩阵 马尔科夫 调控 句法分析 标注单词 阅读概率