%A 江雅仁, 乐小虬 %T 一对多实体关系少样本持续学习方法研究 %0 Journal Article %D 2021 %J 数据分析与知识发现 %R 10.11925/infotech.2096-3467.2020.1302 %P 45-53 %V 5 %N 8 %U {https://manu44.magtech.com.cn/Jwk_infotech_wk3/CN/abstract/article_5141.shtml} %8 2021-08-25 %X

【目的】 在少量样本情况下识别句中一对多实体关系(如包含关系、并列关系等)实例,在新增类别后保持识别效果,实现持续学习。【方法】 以LaserTagger模型为基础,利用文本生成的方法识别句子中包含、并列关系实体,并通过位置特征编码、加权Loss计算的方式增强模型在少样本情况下的特征学习能力,通过模型的压缩、扩展实现多个类别的持续学习。【结果】 在少量训练样本的情况下,本文方法在5个类别上的SARI值均比基线模型提高1%以上;多类别依次学习的情况下,通过模型的压缩、扩展能够较好地保留模型已学习到的知识,SARI值最高能提升16.92%。【局限】 仅选取包含关系、并列关系中的5种句式类别进行实验,数据类别较少,句式结构比较简单,暂未考虑模型在更多类别、更复杂句式情况下的性能。【结论】 所提方法在一定程度上能满足少样本、多类别依次学习的应用场景,具有一定优越性。