%A 余本功,朱晓洁,张子薇 %T 基于多层次特征提取的胶囊网络文本分类研究* %0 Journal Article %D 2021 %J 数据分析与知识发现 %R 10.11925/infotech.2096-3467.2020.1273 %P 93-102 %V 5 %N 6 %U {https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/abstract/article_5102.shtml} %8 2021-06-25 %X

【目的】 提高现有浅层文本分类模型特征抽取能力,自底向上分层级地提取文本信息,从而提高文本分类效果。【方法】 本文提出一种基于全局特征和高层次特征获取的文本分类模型(MFE-CapsNet),该模型利用双向门控循环单元提取上下文信息,并引入权值注意力编码前后隐层向量,从而提高序列模型特征表示质量。结合胶囊网络利用动态路由获得高层次聚合后的局部信息,构建MFE-CapsNet模型,进行文本分类的对比实验。【结果】 MFE-CapsNet模型在三个不同领域的中文数据集上F1值分别达到96.21%、94.17%、94.19%,对比其他分类方法最少分别提升1.28、1.49、0.46个百分点。【局限】 实验仅在三种语料上进行验证。【结论】 MFE-CapsNet模型利用改进的胶囊网络能够更加全面、深层次地挖掘文本语义特征,提高文本分类性能。