LDA模型的优化及其主题数量选择研究*——以科技文献为例
王婷婷, 韩满, 王宇

Optimizing LDA Model with Various Topic Numbers: Case Study of Scientific Literature
Wang Tingting,Han Man,Wang Yu
表3 传统LDA模型下的主题识别结果
主题0 主题1 主题2 主题3 主题4 主题5 主题6 主题7 主题8 主题9
情绪 情感 微博 评论 观点 专利 兴趣 词向量 学科 人物简介
新闻推荐 情感分类 推荐 投诉 评论 主题演化 专家 方剂 知识流 电子书
新闻 评论 用户 子话题 情感分析 在线 评分 点击率 克隆代码 子话题
句子 运动 短文本 信息增益 标注 期刊 评论 评分 文献 农业
interest 特征提取 微博用户 产品 观点挖掘 文本流 项目 遥感 分级 电影
读者 评论文本 推荐算法 翻译 软件 中医药 用户 提案 线程 输入
医疗论坛 实体 词汇 正文 合作 文本分割 偏好 主题模型可视化 问句检索 作者
消息传递算法 聚类 个性化推荐 分派 症状 年度 用户兴趣 伪相关反馈 聚类中心 情感
词语 监督 作文 主题分割 借阅 句子 信息检索 帐号 情感摘要 查询推荐
Web服务 句子 协同过滤 情绪 临床 文献 模式 社会化推荐 主题抽取 日志