%A 岳丽欣,刘自强,胡正银 %T 面向趋势预测的热点主题演化分析方法研究* %0 Journal Article %D 2020 %J 数据分析与知识发现 %R 10.11925/infotech.2096-3467.2019.1155 %P 22-34 %V 4 %N 6 %U {https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/abstract/article_4857.shtml} %8 2020-06-25 %X

【目的】 从外部数量特征和内部文本特征两个层面,构建科学的数理模型和内容预测模型,进而对热点研究主题演化趋势进行预测分析。【方法】 基于LDA模型进行主题识别并构建主题时间序列,结合均值与线性回归拟合确定热点主题;利用ARIMA模型和Word2Vec模型从主题强度和主题内容两个层面预测分析热点主题趋势。【结果】 对美国干细胞领域进行实证研究,筛选出造血干细胞移植技术、癌症干细胞和干细胞抑制作用、干细胞诱导分化、衍生配子技术、造血干细胞5个热点主题并预测其发展趋势。【局限】 基于Word2Vec模型对主题内容趋势进行分析主要以单个词汇为基础,解读过程中可能存在歧义。【结论】 与人工解读为主的主题趋势预测分析方法相比,本研究所提方法能在一定程度上提高预测分析的效率与科学性。