肝癌患者在线提问的命名实体识别研究:一种基于迁移学习的方法 *

doi:10.11925/infotech.2096-3467.2019.0684

[1]

中国互联网络信息中心.

第43次《中国互联网络发展状况统计报告》

[R/OL]. ( 2019- 02- 28). http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201902/P020190318523029756345.pdf.

URL [本文引用: 1]

( CNNIC.

The 43rd China Statistical Report on Internet Development in China

[R/OL]. ( 2019- 02- 28). http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201902/P020190318523029756345.pdf

URL [本文引用: 1]

[2]

Goh J

M

, Gao

G

, Agarwal

R

.

The Creation of Social Value: Can an Online Health Community Reduce Rural-urban Health Disparities?

[J]. MIS Quarterly, 2016,40(1):247-263.

[本文引用: 1]

[3]

Moorhead S

A

, Hazlett D

E

, Harrison

L

, et al.

A New Dimension of Health Care: Systematic Review of the Uses, Benefits, and Limitations of Social Media for Health Communication

[J]. Journal of Medical Internet Research, 2013,15(4):e85.

[本文引用: 1]

[4]

孙安, 于英香, 罗永刚 , 等.

序列标注模型中的字粒度特征提取方案研究——以CCKS2017:Task2临床病历命名实体识别任务为例

[J]. 图书情报工作, 2018,62(11):103-111.

[本文引用: 1]

( Sun

An

, Yu

Yingxiang

, Luo

Yonggang

, et al.

Research on Feature Extraction Scheme of Chinese-character Granularity in Sequence Labeling Model: A Case Study About Clinical Named Entity Recognition of CCKS2017: Task2

[J]. Library and Information Service, 2018,62(11):103-111.)

[本文引用: 1]

[5]

何林娜, 杨志豪, 林鸿飞 , 等.

基于特征耦合泛化的药名实体识别

[J]. 中文信息学报, 2014,28(2):72-77.

[本文引用: 1]

( He

Linna

, Yang

Zhihao

, Lin

Hongfei

, et al.

Drug Name Entity Recognition Based on Feature Coupling Generalization

[J]. Journal of Chinese Information Processing, 2014,28(2):72-77.)

[本文引用: 1]

[6]

Grishman

R

, Sundheim

B

.

Message Understanding Conference-6: A Brief History

[C]//Proceedings of the 16th International Conference on Computational Linguistics. 1996.

[本文引用: 1]

[7]

Lafferty

J

, McCallum

A

, Pereira F C

N

.

Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data

[C]//Proceedings of the 18th International Conference on Machine Learning (ICML 2001). 2001: 282-289.

[本文引用: 1]

[8]

Bikel D

M

, Miller

S

, Schwartz

R

, et al.

Nymble: A High-performance Learning Name-finder

[C]// Proceedings of the 5th Conference on Applied Natural Language Processing. Stroudsburg: Association for Computational Linguistics, 1997: 194-201.

[本文引用: 1]

[9]

Bender

O

, Och F

J

, Ney

H

.

Maximum Entropy Models for Named Entity Recognition

[C]//Proceedings of the 7th Conference on Natural Language Learning at HLT-NAACL 2003-Volume 4. Association for Computational Linguistics, 2003: 148-151.

[本文引用: 1]

[10]

Goller

C

, Kuchler

A

.

Learning Task-dependent Distributed Representations by Backpropagation Through Structure

[C] //Proceedings of International Conference on Neural Networks (ICNN'96). IEEE, 1996,1:347-352.

[本文引用: 1]

[11]

Hochreiter

S

, Schmidhuber

J

.

Long Short-Term Memory

[J]. Neural Computation, 1997,9(8):1735-1780.

[本文引用: 1]

[12]

Graves

A

, Schmidhuber

J

.

Framewise Phoneme Classification with Bidirectional LSTM and Other Neural Network Architectures

[J]. Neural Networks, 2005,18(5-6):602-610.

[本文引用: 1]

[13]

Sun

P

, Yang

X

, Zhao

X

, et al.

An Overview of Named Entity Recognition

[C]// Proceedings of the 2018 International Conference on Asian Language Processing (IALP). IEEE, 2018: 273-278.

[本文引用: 1]

[14]

Blitzer

J

, McDonald

R

, Pereira

F

.

Domain Adaptation with Structural Correspondence Learning

[C]//Proceedings of the 2006 Conference on Empirical Methods in Natural Language Processing. Association for Computational Linguistics, 2006: 120-128.

[本文引用: 1]

[15]

Jiang

J

, Zhai C

X

.

Instance Weighting for Domain Adaptation in NLP

[C]//Proceedings of the 45th Annual Meeting of the Association of Computational Linguistics. 2007: 264-271.

[本文引用: 1]

[16]

Yang

Z

, Salakhutdinov

R

, Cohen W

W

.

Transfer Learning for Sequence Tagging with Hierarchical Recurrent Networks

[OL]. arXiv Preprint, arXiv: 1703.06345.

[本文引用: 1]

[17]

Dai

W

, Yang

Q

, Xue G

R

, et al.

Boosting for Transfer Learning

[C]//Proceedings of the 24th International Conference on Machine Learning. ACM, 2007: 193-200.

[本文引用: 2]

[18]

Dai

W

, Xue G

R

, Yang

Q

, et al.

Transferring Naive Bayes Classifiers for Text Classification

[C]// Proceedings of the 22nd AAAI Conference on Artificial Intelligence. 2007: 540-545.

[本文引用: 1]

[19]

Dai

W

, Xue G

R

, Yang

Q

, et al.

Co-clustering Based Classification for Out-of-domain Documents

[C]//Proceedings of the 13th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, 2007: 210-219.

[本文引用: 1]

[20]

Xue G

R

, Dai

W

, Yang

Q

, et al.

Topic-bridged PLSA for Cross-domain Text Classification

[C]//Proceedings of the 31st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. ACM, 2008: 627-634.

[本文引用: 1]

[21]

Pan S

J

, Tsang I

W

, Kwok J

T

, et al.

Domain Adaptation via Transfer Component Analysis

[J]. IEEE Transactions on Neural Networks, 2010,22(2):199-210.

[本文引用: 1]

[22]

Zhong

E

, Fan

W

, Peng

J

, et al.

Cross Domain Distribution Adaptation via Kernel Mapping

[C]//Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, 2009: 1027-1036.

[本文引用: 1]

[23]

张博, 史忠植, 赵晓非 , 等.

一种基于跨领域典型相关性分析的迁移学习方法

[J]. 计算机学报, 2015,38(7):1326-1336.

[本文引用: 1]

( Zhang

Bo

, Shi

Zhongzhi

, Zhao

Xiaofei

, et al.

A Transfer Learning Based on Canonical Correlation Analysis Across Different Domains

[J]. Chinese Journal of Computers, 2015,38(7):1326-1336.)

[本文引用: 1]

[24]

Al-Stouhi

S

, Reddy C

K

.

Transfer Learning for Class Imbalance Problems with Inadequate Data

[J]. Knowledge and Information Systems, 2016,48(1):201-228.

[本文引用: 1]

[25]

Ryu

D

, Jang J

I

, Baik

J

.

A Transfer Cost-sensitive Boosting Approach for Cross-project Defect Prediction

[J]. Software Quality Journal, 2017,25(1):235-272.

[本文引用: 1]

[26]

Pan S

J

, Ni

X

, Sun J

T

, et al.

Cross-domain Sentiment Classification via Spectral Feature Alignment

[C] //Proceedings of the 19th International Conference on World Wide Web. ACM, 2010: 751-760.

[本文引用: 1]

[27]

He

Y

, Lin

C

, Alani

H

.

Automatically Extracting Polarity-bearing Topics for Cross-domain Sentiment Classification

[C]//Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies-Volume 1. Association for Computational Linguistics, 2011: 123-131.

[本文引用: 1]

[28]

Tan

B

, Song

Y

, Zhong

E

, et al.

Transitive Transfer Learning

[C]//Proceedings of the 21st ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, 2015: 1155-1164.

[本文引用: 1]

[29]

周清清, 章成志 .

基于迁移学习微博情绪分类研究——以H7N9微博为例

[J]. 情报学报, 2016,35(4):339-348.

[本文引用: 1]

( Zhou

Qingqing

, Zhang

Chengzhi

.

Microblog Emotion Classification Based on Transfer Learning:A Case Study of Microblogs about H7N9

[J]. Journal of the China Society for Scientific and Technical Information, 2016,35(4):339-348.)

[本文引用: 1]

[30]

Huang

X

, Rao

Y

, Xie

H

, et al.

Cross-domain Sentiment Classification via Topic-related TrAdaBoost

[C]//Proceedings of the 31st AAAI Conference on Artificial Intelligence. AAAI, 2017: 4939-4940.

[本文引用: 1]

[31]

余传明

.

基于深度循环神经网络的跨领域文本情感分析

[J]. 图书情报工作, 2018,62(11):23-34.

[本文引用: 1]

( Yu

Chuanming

.

A Cross-domain Text Sentiment Analysis Based on Deep Recurrent Neural Network

[J]. Library and Information Service, 2018,62(11):23-34.)

[本文引用: 1]

[32]

Giorgi J

M

, Bader G

D

.

Transfer Learning for Biomedical Named Entity Recognition with Neural Networks

[J]. Bioinformatics, 2018,34(23):4087-4094.

[本文引用: 3]

[33]

Corbett

P

, Boyle

J

.

Chemlistem: Chemical Named Entity Recognition Using Recurrent Neural Networks

[J]. Journal of Cheminformatics, 2018,10(1):61-68.

[本文引用: 2]

[34]

Gama

J

, Žliobaitė

I

, Bifet

A

, et al.

A Survey on Concept Drift Adaptation

[J]. ACM Computing Surveys (CSUR), 2014,46(4):1-44.

[本文引用: 1]

[35]

Pan S

J

, Yang

Q

.

A Survey on Transfer Learning

[J]. IEEE Transactions on Knowledge and Data Engineering, 2009,22(10):1345-1359.

[本文引用: 2]

[36]

高冰涛, 张阳, 刘斌 .

BioTrHMM:基于迁移学习的生物医学命名实体识别算法

[J]. 计算机应用研究, 2019,36(1):45-48.

[本文引用: 1]

( Gao

Bingtao

, Zhang

Yang

, Liu

Bin

.

BioTrHMM: Named Entity Recognition Algorithm Based on Transfer Learning in Biomedical Texts

[J]. Application Research of Computers, 2019,36(1):45-48.)

[本文引用: 1]

[37]

王红斌, 沈强, 线岩团 .

融合迁移学习的中文命名实体识别

[J]. 小型微型计算机系统, 2017,38(2):346-351.

[本文引用: 1]

( Wang

Hongbin

, Shen

Qiang

, Xian

Yantuan

.

Research on Chinese Named Entity Recognition Fusing Transfer Learning

[J]. Journal of Chinese Computer Systems, 2017,38(2):346-351.)

[本文引用: 1]

[38]

Pan S

J

, Toh

Z

, Su

J

.

Transfer Joint Embedding for Cross-Domain Named Entity Recognition

[J]. ACM Transactions on Information Systems (TOIS), 2013,31(2):1-27.

[本文引用: 1]

[39]

Pennington

J

, Socher

R

, Manning

C

.

GloVe: Global Vectors for Word Representation

[C]//Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP). 2014: 1532-1543.

[本文引用: 1]

[40]

Devlin

J

, Chang M

W

, Lee

K

, et al.

Bert: Pre-training of Deep Bidirectional Transformers for Language Understanding

[OL]. arXiv Preprint, arXiv: 1810.04805.

[本文引用: 1]

[41]

Peters M

E

, Neumann

M

, Iyyer

M

, et al.

Deep Contextualized Word Representations

[OL]. arXiv Preprint, arXiv: 1802.05365.

[本文引用: 1]

[42]

Radford

A

, Narasimhan

K

, Salimans

T

, et al.

Improving Language Understanding by Generative Pre-training

[OL]. [2019-04-05]. https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/language-unsupervised/language_understanding_paper.pdf.

URL [本文引用: 1]

[43]

Si

Y

, Wang

J

, Xu

H

, et al.

Enhancing Clinical Concept Extraction with Contextual Embedding

[OL]. arXiv Preprint, arXiv: 1902.08691.

[本文引用: 1]

[44]

Lee

J

, Yoon

W

, Kim

S

, et al.

Biobert: Pre-trained Biomedical Language Representation Model for Biomedical Text Mining

[OL]. arXiv Preprint, arXiv: 1901.08746.

[本文引用: 1]

[45]

Le

Q

, Mikolov

T

.

Distributed Representations of Sentences and Documents

[C] //Proceedings of the International Conference on Machine Learning. 2014: 1188-1196.

[本文引用: 1]

[46]

Cover T

M

, Hart

P

.

Nearest Neighbor Pattern Classification

[J]. IEEE Transactions on Information Theory, 1967,13(1):21-27.

[本文引用: 1]

[47]

赵冬

.

健康领域中文自动问答的问题解析研究——以肺癌为例

[D]. 武汉: 华中科技大学, 2019.

[本文引用: 1]

( Zhao

Dong

.

Question Analysis of Chinese Automatic Question Answering in Health Field: A Case of Lung Cancer

[D]. Wuhan:Huazhong University of Science and Technology, 2019.)

[本文引用: 1]

[48]

Kilicoglu

H

, Abacha A

B

, Mrabet

Y

, et al.

Semantic Annotation of Consumer Health Questions

[J]. BMC Bioinformatics, 2018,19(1):34.

[本文引用: 1]

[49]

Hripcsak

G

, Rothschild A

S

.

Agreement, the F-measure, and Reliability in Information Retrieval

[J]. Journal of the American Medical Informatics Association, 2005,12(3):296-298.

[本文引用: 1]

[50]

Sang T

K

, De Meulder

F

.

Introduction to the CoNLL-2003 Shared Task: Language-Independent Named Entity Recognition

[C]//Proceedings of CoNLL-2003, 2003: 142-147.

[本文引用: 1]

[51]

朱艳辉, 李飞, 冀相冰 , 等.

反馈式K近邻语义迁移学习的领域命名实体识别

[J]. 智能系统学报, 2019(4):820-830.

[本文引用: 1]

( Zhu

Yanhui

, Li

Fei

, Ji

Xiangbing

, et al.

Domain Named Entity Recognition Based on Feedback K-Nearest Semantic Transfer Learning

[J]. CAAI Transactions on Intelligent Systems, 2019(4):820-830.)

[本文引用: 1]

第43次《中国互联网络发展状况统计报告》

1

2019

... 2019年2月28日, 中国互联网络中心(CNNIC)发布的第43次中国互联网发展状况统计报告显示, 截至2018年12月, 我国网民规模达8.29亿, 较2017年底增加3.8%^[1].在大数据时代, 越来越多的人们倾向借助互联网进行信息的检索和交换, 尤其在医疗领域, 在线预约挂号、在线问诊、远程医疗等应用大大提高了就医效率, 在一定程度上缓解了医疗资源分配不均衡、不充分的问题^[2].与传统的以医生为中心的医疗信息服务不同, 如今的互联网健康社区具有高度的社交互动性和参与度, 提供了医生与患者和患者之间的信息交流途径^[3].为了更好地聆听患者的声音, 提供以患者为中心的服务, 面对爆炸式增长的互联网患者提问数据, 如何进行信息提取和有效利用成为重要的研究方向. ...

第43次《中国互联网络发展状况统计报告》

1

2019

... 2019年2月28日, 中国互联网络中心(CNNIC)发布的第43次中国互联网发展状况统计报告显示, 截至2018年12月, 我国网民规模达8.29亿, 较2017年底增加3.8%^[1].在大数据时代, 越来越多的人们倾向借助互联网进行信息的检索和交换, 尤其在医疗领域, 在线预约挂号、在线问诊、远程医疗等应用大大提高了就医效率, 在一定程度上缓解了医疗资源分配不均衡、不充分的问题^[2].与传统的以医生为中心的医疗信息服务不同, 如今的互联网健康社区具有高度的社交互动性和参与度, 提供了医生与患者和患者之间的信息交流途径^[3].为了更好地聆听患者的声音, 提供以患者为中心的服务, 面对爆炸式增长的互联网患者提问数据, 如何进行信息提取和有效利用成为重要的研究方向. ...

The Creation of Social Value: Can an Online Health Community Reduce Rural-urban Health Disparities?

1

2016

... 2019年2月28日, 中国互联网络中心(CNNIC)发布的第43次中国互联网发展状况统计报告显示, 截至2018年12月, 我国网民规模达8.29亿, 较2017年底增加3.8%^[1].在大数据时代, 越来越多的人们倾向借助互联网进行信息的检索和交换, 尤其在医疗领域, 在线预约挂号、在线问诊、远程医疗等应用大大提高了就医效率, 在一定程度上缓解了医疗资源分配不均衡、不充分的问题^[2].与传统的以医生为中心的医疗信息服务不同, 如今的互联网健康社区具有高度的社交互动性和参与度, 提供了医生与患者和患者之间的信息交流途径^[3].为了更好地聆听患者的声音, 提供以患者为中心的服务, 面对爆炸式增长的互联网患者提问数据, 如何进行信息提取和有效利用成为重要的研究方向. ...

A New Dimension of Health Care: Systematic Review of the Uses, Benefits, and Limitations of Social Media for Health Communication

1

2013

... 2019年2月28日, 中国互联网络中心(CNNIC)发布的第43次中国互联网发展状况统计报告显示, 截至2018年12月, 我国网民规模达8.29亿, 较2017年底增加3.8%^[1].在大数据时代, 越来越多的人们倾向借助互联网进行信息的检索和交换, 尤其在医疗领域, 在线预约挂号、在线问诊、远程医疗等应用大大提高了就医效率, 在一定程度上缓解了医疗资源分配不均衡、不充分的问题^[2].与传统的以医生为中心的医疗信息服务不同, 如今的互联网健康社区具有高度的社交互动性和参与度, 提供了医生与患者和患者之间的信息交流途径^[3].为了更好地聆听患者的声音, 提供以患者为中心的服务, 面对爆炸式增长的互联网患者提问数据, 如何进行信息提取和有效利用成为重要的研究方向. ...

序列标注模型中的字粒度特征提取方案研究——以CCKS2017:Task2临床病历命名实体识别任务为例

1

2018

... 作为信息抽取的子任务, 命名实体识别(Named Entity Recognition, NER)方法可从非结构化文本中, 抽取蛋白质、疾病名、药物名等实体^[4,5].而互联网患者提问文本具有噪声大、用词不规范等特点, 为实体识别工作带来了一定挑战.另外, 现有命名实体识别研究大多基于传统的统计机器学习方法, 需要训练数据与测试数据具有相同分布, 且对数据量有一定要求, 尤其当研究数据具有较强时效性时, 需要大量人工标注的传统机器学习方法往往不再适用. ...

序列标注模型中的字粒度特征提取方案研究——以CCKS2017:Task2临床病历命名实体识别任务为例

1

2018

... 作为信息抽取的子任务, 命名实体识别(Named Entity Recognition, NER)方法可从非结构化文本中, 抽取蛋白质、疾病名、药物名等实体^[4,5].而互联网患者提问文本具有噪声大、用词不规范等特点, 为实体识别工作带来了一定挑战.另外, 现有命名实体识别研究大多基于传统的统计机器学习方法, 需要训练数据与测试数据具有相同分布, 且对数据量有一定要求, 尤其当研究数据具有较强时效性时, 需要大量人工标注的传统机器学习方法往往不再适用. ...

基于特征耦合泛化的药名实体识别

1

2014

... 作为信息抽取的子任务, 命名实体识别(Named Entity Recognition, NER)方法可从非结构化文本中, 抽取蛋白质、疾病名、药物名等实体^[4,5].而互联网患者提问文本具有噪声大、用词不规范等特点, 为实体识别工作带来了一定挑战.另外, 现有命名实体识别研究大多基于传统的统计机器学习方法, 需要训练数据与测试数据具有相同分布, 且对数据量有一定要求, 尤其当研究数据具有较强时效性时, 需要大量人工标注的传统机器学习方法往往不再适用. ...

基于特征耦合泛化的药名实体识别

1

2014

... 作为信息抽取的子任务, 命名实体识别(Named Entity Recognition, NER)方法可从非结构化文本中, 抽取蛋白质、疾病名、药物名等实体^[4,5].而互联网患者提问文本具有噪声大、用词不规范等特点, 为实体识别工作带来了一定挑战.另外, 现有命名实体识别研究大多基于传统的统计机器学习方法, 需要训练数据与测试数据具有相同分布, 且对数据量有一定要求, 尤其当研究数据具有较强时效性时, 需要大量人工标注的传统机器学习方法往往不再适用. ...

Message Understanding Conference-6: A Brief History

1

1996

... 命名实体识别任务是指在给定文本中确定实体边界, 并将其划分至特定类别, 如人名、地名、机构名的识别.作为自然语言处理领域的基础任务, 命名实体识别可应用于如信息提取、关系提取、问答系统等下游任务.自1996年第6届消息理解会议^[6]首次提出命名实体识别任务至今, 相关技术得到了广泛的研究和发展.从早期基于统计和手工编写规则的方法, 到基于特征工程和机器学习的方法, 包括条件随机场(Conditional Random Field, CRF)^[7]、隐马尔可夫模型(Hidden Markov Model, HMM)^[8]、最大熵模型(Maximum Entropy, ME)^[9]等, 命名实体识别的性能得到了较大提升.近年来, 随着神经网络的发展, 由于循环神经网络(Recurrent Neural Network, RNN)^[10]能够有效捕捉句子的上下文信息, 尤其擅长序列标记任务, 而且基于循环神经网络改进的长短时记忆模型(Long-Short Term Memory, LSTM)^[11]可以有效克服长距离依赖问题, 因此大量研究选择基于双向长短时记忆模型(Bi-directional LSTM, Bi-LSTM)^[12], 根据上下文信息进行文本特征提取, 并结合条件随机场方法进行命名实体识别^[13]. ...

Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data

1

2001

... 命名实体识别任务是指在给定文本中确定实体边界, 并将其划分至特定类别, 如人名、地名、机构名的识别.作为自然语言处理领域的基础任务, 命名实体识别可应用于如信息提取、关系提取、问答系统等下游任务.自1996年第6届消息理解会议^[6]首次提出命名实体识别任务至今, 相关技术得到了广泛的研究和发展.从早期基于统计和手工编写规则的方法, 到基于特征工程和机器学习的方法, 包括条件随机场(Conditional Random Field, CRF)^[7]、隐马尔可夫模型(Hidden Markov Model, HMM)^[8]、最大熵模型(Maximum Entropy, ME)^[9]等, 命名实体识别的性能得到了较大提升.近年来, 随着神经网络的发展, 由于循环神经网络(Recurrent Neural Network, RNN)^[10]能够有效捕捉句子的上下文信息, 尤其擅长序列标记任务, 而且基于循环神经网络改进的长短时记忆模型(Long-Short Term Memory, LSTM)^[11]可以有效克服长距离依赖问题, 因此大量研究选择基于双向长短时记忆模型(Bi-directional LSTM, Bi-LSTM)^[12], 根据上下文信息进行文本特征提取, 并结合条件随机场方法进行命名实体识别^[13]. ...

Nymble: A High-performance Learning Name-finder

1

1997

... 命名实体识别任务是指在给定文本中确定实体边界, 并将其划分至特定类别, 如人名、地名、机构名的识别.作为自然语言处理领域的基础任务, 命名实体识别可应用于如信息提取、关系提取、问答系统等下游任务.自1996年第6届消息理解会议^[6]首次提出命名实体识别任务至今, 相关技术得到了广泛的研究和发展.从早期基于统计和手工编写规则的方法, 到基于特征工程和机器学习的方法, 包括条件随机场(Conditional Random Field, CRF)^[7]、隐马尔可夫模型(Hidden Markov Model, HMM)^[8]、最大熵模型(Maximum Entropy, ME)^[9]等, 命名实体识别的性能得到了较大提升.近年来, 随着神经网络的发展, 由于循环神经网络(Recurrent Neural Network, RNN)^[10]能够有效捕捉句子的上下文信息, 尤其擅长序列标记任务, 而且基于循环神经网络改进的长短时记忆模型(Long-Short Term Memory, LSTM)^[11]可以有效克服长距离依赖问题, 因此大量研究选择基于双向长短时记忆模型(Bi-directional LSTM, Bi-LSTM)^[12], 根据上下文信息进行文本特征提取, 并结合条件随机场方法进行命名实体识别^[13]. ...

Maximum Entropy Models for Named Entity Recognition

1

2003

... 命名实体识别任务是指在给定文本中确定实体边界, 并将其划分至特定类别, 如人名、地名、机构名的识别.作为自然语言处理领域的基础任务, 命名实体识别可应用于如信息提取、关系提取、问答系统等下游任务.自1996年第6届消息理解会议^[6]首次提出命名实体识别任务至今, 相关技术得到了广泛的研究和发展.从早期基于统计和手工编写规则的方法, 到基于特征工程和机器学习的方法, 包括条件随机场(Conditional Random Field, CRF)^[7]、隐马尔可夫模型(Hidden Markov Model, HMM)^[8]、最大熵模型(Maximum Entropy, ME)^[9]等, 命名实体识别的性能得到了较大提升.近年来, 随着神经网络的发展, 由于循环神经网络(Recurrent Neural Network, RNN)^[10]能够有效捕捉句子的上下文信息, 尤其擅长序列标记任务, 而且基于循环神经网络改进的长短时记忆模型(Long-Short Term Memory, LSTM)^[11]可以有效克服长距离依赖问题, 因此大量研究选择基于双向长短时记忆模型(Bi-directional LSTM, Bi-LSTM)^[12], 根据上下文信息进行文本特征提取, 并结合条件随机场方法进行命名实体识别^[13]. ...

Learning Task-dependent Distributed Representations by Backpropagation Through Structure

1

1996

... 命名实体识别任务是指在给定文本中确定实体边界, 并将其划分至特定类别, 如人名、地名、机构名的识别.作为自然语言处理领域的基础任务, 命名实体识别可应用于如信息提取、关系提取、问答系统等下游任务.自1996年第6届消息理解会议^[6]首次提出命名实体识别任务至今, 相关技术得到了广泛的研究和发展.从早期基于统计和手工编写规则的方法, 到基于特征工程和机器学习的方法, 包括条件随机场(Conditional Random Field, CRF)^[7]、隐马尔可夫模型(Hidden Markov Model, HMM)^[8]、最大熵模型(Maximum Entropy, ME)^[9]等, 命名实体识别的性能得到了较大提升.近年来, 随着神经网络的发展, 由于循环神经网络(Recurrent Neural Network, RNN)^[10]能够有效捕捉句子的上下文信息, 尤其擅长序列标记任务, 而且基于循环神经网络改进的长短时记忆模型(Long-Short Term Memory, LSTM)^[11]可以有效克服长距离依赖问题, 因此大量研究选择基于双向长短时记忆模型(Bi-directional LSTM, Bi-LSTM)^[12], 根据上下文信息进行文本特征提取, 并结合条件随机场方法进行命名实体识别^[13]. ...

Long Short-Term Memory

1

1997

... 命名实体识别任务是指在给定文本中确定实体边界, 并将其划分至特定类别, 如人名、地名、机构名的识别.作为自然语言处理领域的基础任务, 命名实体识别可应用于如信息提取、关系提取、问答系统等下游任务.自1996年第6届消息理解会议^[6]首次提出命名实体识别任务至今, 相关技术得到了广泛的研究和发展.从早期基于统计和手工编写规则的方法, 到基于特征工程和机器学习的方法, 包括条件随机场(Conditional Random Field, CRF)^[7]、隐马尔可夫模型(Hidden Markov Model, HMM)^[8]、最大熵模型(Maximum Entropy, ME)^[9]等, 命名实体识别的性能得到了较大提升.近年来, 随着神经网络的发展, 由于循环神经网络(Recurrent Neural Network, RNN)^[10]能够有效捕捉句子的上下文信息, 尤其擅长序列标记任务, 而且基于循环神经网络改进的长短时记忆模型(Long-Short Term Memory, LSTM)^[11]可以有效克服长距离依赖问题, 因此大量研究选择基于双向长短时记忆模型(Bi-directional LSTM, Bi-LSTM)^[12], 根据上下文信息进行文本特征提取, 并结合条件随机场方法进行命名实体识别^[13]. ...

Framewise Phoneme Classification with Bidirectional LSTM and Other Neural Network Architectures

1

2005

... 命名实体识别任务是指在给定文本中确定实体边界, 并将其划分至特定类别, 如人名、地名、机构名的识别.作为自然语言处理领域的基础任务, 命名实体识别可应用于如信息提取、关系提取、问答系统等下游任务.自1996年第6届消息理解会议^[6]首次提出命名实体识别任务至今, 相关技术得到了广泛的研究和发展.从早期基于统计和手工编写规则的方法, 到基于特征工程和机器学习的方法, 包括条件随机场(Conditional Random Field, CRF)^[7]、隐马尔可夫模型(Hidden Markov Model, HMM)^[8]、最大熵模型(Maximum Entropy, ME)^[9]等, 命名实体识别的性能得到了较大提升.近年来, 随着神经网络的发展, 由于循环神经网络(Recurrent Neural Network, RNN)^[10]能够有效捕捉句子的上下文信息, 尤其擅长序列标记任务, 而且基于循环神经网络改进的长短时记忆模型(Long-Short Term Memory, LSTM)^[11]可以有效克服长距离依赖问题, 因此大量研究选择基于双向长短时记忆模型(Bi-directional LSTM, Bi-LSTM)^[12], 根据上下文信息进行文本特征提取, 并结合条件随机场方法进行命名实体识别^[13]. ...

An Overview of Named Entity Recognition

1

2018

... 命名实体识别任务是指在给定文本中确定实体边界, 并将其划分至特定类别, 如人名、地名、机构名的识别.作为自然语言处理领域的基础任务, 命名实体识别可应用于如信息提取、关系提取、问答系统等下游任务.自1996年第6届消息理解会议^[6]首次提出命名实体识别任务至今, 相关技术得到了广泛的研究和发展.从早期基于统计和手工编写规则的方法, 到基于特征工程和机器学习的方法, 包括条件随机场(Conditional Random Field, CRF)^[7]、隐马尔可夫模型(Hidden Markov Model, HMM)^[8]、最大熵模型(Maximum Entropy, ME)^[9]等, 命名实体识别的性能得到了较大提升.近年来, 随着神经网络的发展, 由于循环神经网络(Recurrent Neural Network, RNN)^[10]能够有效捕捉句子的上下文信息, 尤其擅长序列标记任务, 而且基于循环神经网络改进的长短时记忆模型(Long-Short Term Memory, LSTM)^[11]可以有效克服长距离依赖问题, 因此大量研究选择基于双向长短时记忆模型(Bi-directional LSTM, Bi-LSTM)^[12], 根据上下文信息进行文本特征提取, 并结合条件随机场方法进行命名实体识别^[13]. ...

Domain Adaptation with Structural Correspondence Learning

1

2006