LDA模型的优化及其主题数量选择研究*——以科技文献为例
|
王婷婷, 韩满, 王宇
|
Optimizing LDA Model with Various Topic Numbers: Case Study of Scientific Literature
|
Wang Tingting,Han Man,Wang Yu
|
|
表4 K-wrLDA模型下的主题识别结果 |
|
|
主题0 | 主题1 | 主题2 | 主题3 | 主题4 | 主题5 | 主题6 | 主题7 | 主题8 | 主题9 | 评论 | 专利 | 问句检索 | 查询 | 医疗论坛 | 随机变量 | 新闻 | 视图 | 教育资源 | 文本分割 | 短文本分类 | 发明人 | 运动 | 分布式 | 舆论 | 超文本 | 推荐算法 | 低质量回帖 | 视觉单词 | 任务模型 | 点击率 | 投诉 | 广告投放 | word2vec | 脑血管病 | 情感分类 | 人群 | 关键词抽取 | 提案 | 语义信息 | 句子 | 汽车缺陷 | 实体 | 矩阵分解 | 话题检测 | 文档 | 用户兴趣 | 博客 | 主题模型可视化 | 数字资源 | 相似性度量 | 遥感 | 关联主题 | 词聚类 | 查询 | 信息熵 | 用户评论 | 安全隐患 | 观点 | 特征项 | 词向量 | 作弊 | 单机 | 共享内存 | 咨询 | 网络舆情 | 粒计算 | 交通 | 视频 | 词向量 | 观点摘要 | mixtureLDA | 词项 | 文本建模 | 语义指纹 | 主题情感混合模型 | online | 关键词集 | 帐号 | 投放 | 朴素贝叶斯 | 词义 | 投放 | 消息传递算法 | 标记 | 自动应答系统 | 个性化推荐 | 隐患 | 句群 | 主题特征 | 引文上下文 | 用户 | 相似度算法 | 线程 | 文章 | 标签抽取 | 新浪微博 | 查询 | 语义标注 | 偏斜 | 共享主题 | 兴趣 | 热点话题 | 数字 | 相似矩阵 | 马尔科夫 | 调控 | 句法分析 | 标注单词 | 阅读概率 |
|
|
|