基于文本数据的过滤式与嵌入式样本选择算法*
刘书瑞,田继东,陈普春,赖立,宋国杰

New Sample Selection Algorithm with Textual Data
Shurui Liu,Jidong Tian,Puchun Chen,Li Lai,Guojie Song
表4 不同样本选择算法的评价指标对比
Table 4 Evaluation Indexes of Different Sample Selection Algorithms
算法 数据集 Accuracy Recall F1
不使用任何算法 随机数 1 0.802 0.750 0.653
随机数 2 0.815 0.745 0.644
随机数 3 0.819 0.755 0.660
随机扰动 随机数 1 0.786 0.731 0.623
随机数 2 0.805 0.714 0.597
随机数 3 0.804 0.711 0.587
TF-IDF 随机数 1 0.795 0.740 0.628
随机数 2 0.804 0.707 0.585
随机数 3 0.805 0.706 0.585
遗忘算法 随机数 1 0.797 0.740 0.637
随机数 2 0.805 0.714 0.579
随机数 3 0.800 0.736 0.631
小批量协方差估计 随机数 1 0.793 0.743 0.638
随机数 2 0.794 0.729 0.623
随机数 3 0.798 0.737 0.623