基于多头协同注意力机制的客户投诉文本分类模型*
王金政,杨颖,余本功
Classifying Customer Complaints Based on Multi-head Co-attention Mechanism
Wang jinzheng,Yang Ying,Yu Bengong
表2
可调参数设置
Table 2
Parameter Setting
参数名称
参数值
词向量维度
768
句子最大长度
500
Epochs
50
优化器
SGD
损失函数
CrossEntropy
BiLSTM隐层大小
256
Text-CNN卷积核大小
3、5、7
Text-CNN卷积核通道数
256、256、256
最大池化尺寸
490
学习率
0.001
漏失率
0.5
注意力层头数
8