基于Bi-LSTM+CRF的科学文献中生态治理技术相关命名实体抽取研究*
|
马建霞,袁慧,蒋翔
|
Extracting Name Entities from Ecological Restoration Literature with Bi-LSTM+CRF
|
Ma Jianxia,Yuan Hui,Jiang Xiang
|
|
表4 生态治理技术抽取规则样例
|
Table 4 Rules for Named Entity Extraction of Ecological Governance Technology
|
|
技术名称类型 | 技术名称子类型及表达模式 | 样例 | 辅助技术名称识别相关词表 | 左边界词(LeftWord) | 实施、开展、采用… | 右边界词(RightWord) | 技术、措施、工程… | 土壤类型(Agrotype) | 沙地、草甸土… | 生态系统/生态区(ECO) | 黄土高原、高寒草甸… | 生态退化类型(EcoDegType) | 荒漠化、石漠化…… | 简单技术名称 | 触发词(TriggerWords) | 沙障、防护林、固沙剂… | 技术类别(TCategory) | 生物措施、工程措施… | 包含其他实体的技术名称 | 包含地名(Place)和土壤类型(Agrotype) 表达模式:( LeftWord ) + Place + ( Agrotype )+ TriggerWords + ( RightWord ) | 柴达木沙地杨树深栽造林 | 包含生态系统类型/生态区(ECO) 表达模式:ECO + TriggerWords + (RightWord) | 绿洲农林间作 黄土高原梯田技术 | 包含生态退化类型 表达模式:(EcoDegType);EcoDegType + (TriggerWords) + RightWord | 荒漠化综合治理技术 冻融荒漠化防治 | 技术名称短语 | LeftWord + TriggerWords + ( RightWord ) TriggerWords + RightWord TCategory + RightWord | 设置生物围栏;采用乔灌混交技术 草方格沙障技术;林草复合法 植物/农业/工程措施 |
|
|
|