基于文本数据的过滤式与嵌入式样本选择算法*
|
刘书瑞,田继东,陈普春,赖立,宋国杰
|
New Sample Selection Algorithm with Textual Data
|
Shurui Liu,Jidong Tian,Puchun Chen,Li Lai,Guojie Song
|
|
表4 不同样本选择算法的评价指标对比
|
Table 4 Evaluation Indexes of Different Sample Selection Algorithms
|
|
算法 | 数据集 | Accuracy | Recall | F1 | 不使用任何算法 | 随机数 1 | 0.802 | 0.750 | 0.653 | 随机数 2 | 0.815 | 0.745 | 0.644 | 随机数 3 | 0.819 | 0.755 | 0.660 | 随机扰动 | 随机数 1 | 0.786 | 0.731 | 0.623 | 随机数 2 | 0.805 | 0.714 | 0.597 | 随机数 3 | 0.804 | 0.711 | 0.587 | TF-IDF | 随机数 1 | 0.795 | 0.740 | 0.628 | 随机数 2 | 0.804 | 0.707 | 0.585 | 随机数 3 | 0.805 | 0.706 | 0.585 | 遗忘算法 | 随机数 1 | 0.797 | 0.740 | 0.637 | 随机数 2 | 0.805 | 0.714 | 0.579 | 随机数 3 | 0.800 | 0.736 | 0.631 | 小批量协方差估计 | 随机数 1 | 0.793 | 0.743 | 0.638 | 随机数 2 | 0.794 | 0.729 | 0.623 | 随机数 3 | 0.798 | 0.737 | 0.623 |
|
|
|