首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于部首嵌入和注意力机制的病虫害命名实体识别
引用本文:郭旭超,唐詹,刁磊,周晗,李林.基于部首嵌入和注意力机制的病虫害命名实体识别[J].农业机械学报,2020,51(S2):335-343.
作者姓名:郭旭超  唐詹  刁磊  周晗  李林
作者单位:中国农业大学
基金项目:国家重点研发计划项目(2016YFD0300710)
摘    要:为了解决农业病虫害命名实体识别过程中存在的内在语义信息缺失、局部上下文特征易被忽略和捕获长距离依赖能力不足等问题,以农业病虫害文本为研究对象,提出一种基于部首嵌入和注意力机制的农业病虫害命名实体识别模型(Chinese agricultural diseases and pests named entity recognition with joint radical embedding and self attention, RS-ADP)。首先,该模型将部首嵌入集成到字符嵌入中作为输入,用以丰富语义信息。其中,针对部首嵌入设计了3种特征提取策略,即卷积神经网络(Convolutional neural network, CNN)、双向长短时记忆网络(Bidirectional long short term memory network, BiLSTM) 和CNN-BiLSTM;其次,采用多层不同窗口尺寸的CNNs层提取不同尺度的局部上下文信息;然后,在BiLSTM提取全局序列特征的基础上,采用自注意力机制进一步增强模型提取更长距离依赖的能力;最后,采用条件随机场(Conditional random field, CRF)联合识别实体边界和划分实体类别。在包含11个类别和24715条标注样本的农业病虫害自制语料上进行了实验。结果表明,本文模型RS-ADP在该数据集上精确率、召回率和F1值分别为94.16%、94.47%和94.32%;在具体实体类别上,RS-ADP在作物、病害、虫害等易识别实体上F1值高达95.81%、97.76%和97.23%。同时,RS-ADP在草害、病原等难以识别实体上F1值仍保持86%以上。实验结果表明,本文所提模型能够有效识别农业病虫害命名实体,其识别精度优于其他模型,且具有一定的泛化性。

关 键 词:农业病虫害    命名实体识别    部首嵌入    自注意力机制    双向长短时记忆网络    卷积神经网络
收稿时间:2020/8/1 0:00:00

Recognition of Chinese Agricultural Diseases and Pests Named Entity with Joint Radical embedding and Self-attention Mechanism
GUO Xuchao,TANG Zhan,DIAO Lei,ZHOU Han,LI Lin.Recognition of Chinese Agricultural Diseases and Pests Named Entity with Joint Radical embedding and Self-attention Mechanism[J].Transactions of the Chinese Society of Agricultural Machinery,2020,51(S2):335-343.
Authors:GUO Xuchao  TANG Zhan  DIAO Lei  ZHOU Han  LI Lin
Institution:China Agricultural University
Abstract:
Keywords:agricultural diseases and pests  named entity recognition  radical embedding  self attention mechanism  bidirectional long short term memory network  convolutional neural network
点击此处可从《农业机械学报》浏览原始摘要信息
点击此处可从《农业机械学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号