基于Bi-LSTM+CRF的科学文献中生态治理技术相关命名实体抽取研究*
马建霞,袁慧,蒋翔

Extracting Name Entities from Ecological Restoration Literature with Bi-LSTM+CRF
Ma Jianxia,Yuan Hui,Jiang Xiang
表10 训练语料与增加训练语料中的实体数量
Table 10 Entity Number of Different Training Corpus
语料 实体数量 时间实体数量 地名实体数量 生态治理技术名称数量
训练集 39 739 7 965 17 599 14 175
验证/开发集 14 037 2 481 6 757 4 799
增加的训练语料 35 843 6 965 16 240 12 638
增加实体词典 7 703 547 6 693 463