基于文档主题结构和词图迭代的关键词抽取方法研究 *
|
孙明珠,马静,钱玲飞
|
Extracting Keywords Based on Topic Structure and Word Diagram Iteration
|
Mingzhu Sun,Jing Ma,Lingfei Qian
|
|
表2 不同算法准确率、召回率和F值结果
|
|
|
TopN | TF-IDF | | TextRank | LDA | 文献[13]方法 | 文献[14]方法 | 本文算法 | P | R | F1 | P | R | F1 | P | R | F1 | P | R | F1 | P | R | F1 | P | R | F1 | 3 | 0.213 | 0.182 | 0.196 | 0.231 | 0.194 | 0.211 | 0.243 | 0.203 | 0.221 | 0.245 | 0.206 | 0.224 | 0.248 | 0.211 | 0.228 | 0.278 | 0.239 | 0.257 | 5 | 0.163 | 0.23 | 0.191 | 0.175 | 0.244 | 0.204 | 0.191 | 0.256 | 0.219 | 0.203 | 0.256 | 0.226 | 0.213 | 0.282 | 0.243 | 0.216 | 0.289 | 0.247 | 7 | 0.135 | 0.264 | 0.179 | 0.141 | 0.274 | 0.186 | 0.162 | 0.289 | 0.208 | 0.169 | 0.293 | 0.214 | 0.183 | 0.325 | 0.234 | 0.181 | 0.323 | 0.232 | 9 | 0.116 | 0.291 | 0.166 | 0.12 | 0.299 | 0.171 | 0.135 | 0.318 | 0.190 | 0.145 | 0.324 | 0.200 | 0.162 | 0.357 | 0.223 | 0.159 | 0.351 | 0.219 | 15 | 0.083 | 0.343 | 0.134 | 0.083 | 0.344 | 0.134 | 0.102 | 0.362 | 0.159 | 0.106 | 0.375 | 0.165 | 0.124 | 0.411 | 0.191 | 0.119 | 0.399 | 0.183 |
|
|
|