基于多头协同注意力机制的客户投诉文本分类模型*
王金政,杨颖,余本功

Classifying Customer Complaints Based on Multi-head Co-attention Mechanism
Wang jinzheng,Yang Ying,Yu Bengong
表2 可调参数设置
Table 2 Parameter Setting
参数名称 参数值
词向量维度 768
句子最大长度 500
Epochs 50
优化器 SGD
损失函数 CrossEntropy
BiLSTM隐层大小 256
Text-CNN卷积核大小 3、5、7
Text-CNN卷积核通道数 256、256、256
最大池化尺寸 490
学习率 0.001
漏失率 0.5
注意力层头数 8