首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 78 毫秒
1.
基于注意力机制的农业文本命名实体识别   总被引:4,自引:0,他引:4  
针对农业智能问答系统构建过程中传统的农业命名实体识别方法依赖人工特征模板、特征信息提取不充分、实体名称多样导致标注不一致等问题,提出一种基于注意力机制的农业文本命名实体识别方法.采用连续词袋模型(Continuous bag of words,CBOW)对输入字向量进行预训练,丰富字向量特征信息,缓解分词准确度对性能的...  相似文献   

2.
为了提高数控机床热误差模型的精度与泛化性,提出了基于注意力机制的长短时记忆卷积神经网络(Long short term memory convolutional neural network based on attention mechanism, AM-CNN-LSTM)热误差模型。利用卷积神经网络提取高维数据空间状态特征的能力和长短时记忆网络提取长时间序列状态特征的能力,构建具有2个支路的热误差模型,分别提取特征后输入到注意力机制中进行特征重要性重构,建立原始数据与热误差的特征映射,最后通过全连接层进行热误差预测。采用G460L型数控机床进行实验数据采集,将不同季节采集到的温度数据和热误差作为模型输入,采用循环学习率与正则化优化方法对模型进行训练。与LSTM、ConvLSTM和CNN-LSTM热误差模型对比,结果表明,AM-CNN-LSTM模型对特征还原能力最强,残差波动范围最小,其残差范围较最大值下降62.09%,模型预测精度在2.4μm以内。  相似文献   

3.
为提高啤酒花产业的品质和产量,针对于传统人工识别鉴定难度大,效率低和客观性不够,以及啤酒花病虫害识别无大型公开数据集等问题.本文提出一种基于软注意力机制的小样本啤酒花病虫害识别方法,对传统深度残差网络ResNet模型进行改进,并使用图像增强技术-直方图均衡化处理图片得到新的数据集.实验结果表明,在小样本情况下,相比于传...  相似文献   

4.
随着农作物病虫害研究文献的快速增长,对农作物病虫害领域文献进行文本挖掘变得越来越重要。开发有效、准确的农作物病虫害命名实体识别系统有助于在农作物病虫害相关研究报告中提取研究成果,为农作物病虫害的治理提供有效建议。本文针对中文农作物病虫害数据集缺失问题,提出了基于半远程监督的停等算法,利用该算法构建中文农作物病虫害领域语料库,大幅度减少标注过程的人工成本和时间成本;同时,提出了中文农作物病虫害命名实体识别模型(Agricultural information extraction, Agr-IE),该模型基于BERT-BILSTM-CRF,辅以多源信息融合(多源分词信息和全局词汇嵌入信息)丰富字符向量,使其充分结合字符级与词汇级的信息,以提高模型捕捉上下文信息的能力。实验表明,该模型可以有效地识别病害、虫害、药剂、作物等实体,F1值分别为96.56%、95.12%、94.48%、95.54%,并对识别难度较大的病原实体具有较好的识别效果,F1值为81.48%,高于BERT-BILSTM-CRF、BERT等模型的相应值。本文所提模型在MSRA和Weibo等其他领域数据集上与CAN-NER、Lattice-LSTM-CRF等模型进行了对比实验,并取得最佳的识别效果,F1值分别为95.80%、94.57%,表明该算法具有一定的泛化能力。  相似文献   

5.
针对兽药致病知识图谱构建过程中,关于兽药命名实体识别使用传统方法依赖人工设计特征耗时耗力以及兽药致病语料数据量较少的问题,提出一种引入注意力机制(Attention)与辅助层分类(Auxiliary layer)相结合兽药文本命名实体识别模型(Att-Aux-BERT-BiLSTM-CRF).通过BERT预处理模型进行...  相似文献   

6.
基于条件随机场的农作物病虫害及农药命名实体识别   总被引:3,自引:0,他引:3  
互联网农技问答平台现仅依靠人工提供答题服务,响应速度慢,回答质量难以保证。实现智能农技问题解答,构建农技知识库,需要从现有问答数据提取“农作物-病虫害-农药”命名实体三元组。现有对农业中文命名实体识别的研究较少,且准确率较低。根据农作物、病虫害及农药命名实体的特点,针对农技问答数据,提出基于条件随机场的农作物、病虫害及农药命名实体的识别方法。对数据集进行格式整理及自动分词,并对分词后的语料,针对是否包含特定界定词、是否含特定偏旁部首、是否是数量词、是否是特定左右指界词及词性等特征进行自动标注。利用标注后的数据训练CRF模型,可以对语料进行分类,包括判断语料是否属于农作物、病虫害、农药3类命名实体并识别该语料在复合命名实体中的位置,从而实现了对3类命名实体的识别,由此可自动构建关联三元组。通过试验选择特征组合和调整上下文窗口大小,提高了本方法的识别准确度,降低了模型训练时间,对农作物、病虫害、农药命名实体识别的准确度分别达97.72%、87.63%、98.05%,比现有方法有显著提高。  相似文献   

7.
[目的/意义]针对实体嵌套、实体类型混淆等问题导致的农业病害命名实体识别(Named Entities Recognition,NER)准确率不高的情况,以PointerNet为基准模型,提出一种基于RoFormer预训练模型的指针网络农业病害NER方法RoFormer-PointerNet。[方法]采用RoFormer预训练模型对输入的文本进行向量化,利用其独特的旋转位置嵌入方法来捕捉位置信息,丰富字词特征信息,从而解决一词多义导致的类型易混淆的问题。使用指针网络进行解码,利用指针网络的首尾指针标注方式抽取句子中的所有实体,首尾指针标注方式可以解决实体抽取中存在的嵌套问题。[结果和讨论]自建农业病害数据集,数据集中包含2 867条标注语料,共10 282个实体。为验证RoFormer预训练模型在实体抽取上的优越性,采用Word2Vec、BERT、RoBERTa等多种向量化模型进行对比试验,RoFormer-PointerNet与其他模型相比,模型精确率、召回率、F1值均为最优,分别为87.49%,85.76%和86.62%。为验证RoFormer-Pointer...  相似文献   

8.
目前基于预训练语言模型(Pre-trained Language Model,PLM)的命名实体识别的研究在面对农业领域存在的实体命名方式繁杂、实体边界模糊等问题时,仅使用PLM最后一层表示输出,且均从外部引入知识或操作对实体表示进行增强,忽视内部各层本身蕴含语言不同层次的丰富信息。为解决上述问题,提出一种基于递进式卷积网络的命名实体识别方法。该方法首先存储自然句子,通过PLM后得到的每层输出表示;其次以递进式卷积作为全层信息的特征提取手段,对储存的模型中间层输出表示依次卷积。模型将注重全层信息,包括被忽略的浅层输出,而有研究表明靠近输入的模型层输出的句子嵌入包含更多的诸如短语、词组等粗粒度信息,对于边界模糊的农业命名实体识别,更关键的词组界定信息或许就隐含在这些被忽略的浅层嵌入中,可为农业领域存在的命名实体识别问题提供帮助。无需外部信息的引入,充分利用已使用的计算力得到的结果就能增强句子的表示嵌入;最终通过条件随机场(Conditional Random Field,CRF)模型生成全局最优序列。在构建的包含农作物品种、病害、虫害和农药4类农业实体的农业数据集上,所提方法的综合性指标...  相似文献   

9.
针对猕猴桃种植领域命名实体识别任务中实体词复杂度较高,识别精确率较低的问题,提出一种融合字词语义信息的猕猴桃种植实体识别方法。以BiGRU-CRF为基本模型,融合词级别和字符级别的信息。在词级别上,通过引入词集信息,并使用多头自注意力(Multiple self-attention mechanisms,MHA)调整词集中不同词的权重;同时使用注意力机制忽略不可靠的词集,将注意力集中在重要的词集上,从而提高实体识别效果;在字符级别上,引入无监督的基于转换器的双向编码表征(Bidirectional encoder representations form transformers,BERT)预训练模型增强字的语义表示。在包含12477条标注样本和7个类别实体的猕猴桃种植领域自制语料上进行了实验,结果表明,本文模型与SoftLexicon模型相比,F1值提高1.58个百分点。此外,本文模型在公开数据集ResumeNER上与Lattice-LSTM、WC-LSTM等模型进行实验对比取得了最佳效果,F1值达到96.17%,表明本文模型具有一定的泛化能力。  相似文献   

10.
基于注意力机制和多尺度残差网络的农作物病害识别   总被引:3,自引:0,他引:3  
针对传统农作物病害识别方法依靠人工提取特征,步骤复杂且低效,难以实现在田间环境下识别的问题,提出一种多尺度卷积结构与注意力机制结合的农作物病害识别模型。该研究在残差网络(ResNet18)的基础上进行改进,引入Inception模块,利用其多尺度卷积核结构对不同尺度的病害特征进行提取,提高了特征的丰富度。在残差结构的基础上加入注意力机制SE-Net(Squeeze-and-excitation networks),增强了有用特征的权重,减弱了噪声等无用特征的影响,进一步提高特征提取能力并且增强了模型的鲁棒性。实验结果表明,改进后的多尺度注意力残差网络模型(Multi-Scale-SE-ResNet18)在复杂田间环境收集的8种农作物病害数据集上的平均识别准确率达到95.62%,相较于原ResNet18模型准确率提高10.92个百分点,模型占用内存容量仅为44.2MB。改进后的Multi-Scale-SE-ResNet18具有更好的特征提取能力,可以提取到更多的病害特征信息,并且较好地平衡了模型的识别精度与模型复杂度,可为田间环境下农作物病害识别提供参考。  相似文献   

11.
为提高苹果生产领域实体识别的准确性,提出一种新的Transformer优化模型。首先,为解决苹果生产数据集的缺失,基于苹果栽培领域园艺专家的知识经验,创建以苹果病虫害为主的产业数据集。通过字向量与词向量的拼接,提高文本语义表征的准确性;随后,为防止位置信息缺失,引入具有方向和距离感知的注意力机制,平均集成BiLSTM的上下文长距离依赖特征;最后,结合条件随机场(Conditional random fields, CRF)约束上下文标注结果,最终得到Transformer优化模型。实验结果表明,所提方法在苹果病虫命名实体识别中的F1值可达92.66%,可为农业命名实体的准确智能识别提供技术手段。  相似文献   

12.
针对农业病害领域命名实体识别过程中存在的预训练语言模型利用不充分、外部知识注入利用率低、嵌套命名实体识别率低的问题,本文提出基于连续提示注入和指针网络的命名实体识别模型CP-MRC(Continuous prompts for machine reading comprehension)。该模型引入BERT(Bidirectional encoder representation from transformers)预训练模型,通过冻结BERT模型原有参数,保留其在预训练阶段获取到的文本表征能力;为了增强模型对领域数据的适用性,在每层Transformer中插入连续可训练提示向量;为提高嵌套命名实体识别的准确性,采用指针网络抽取实体序列。在自建农业病害数据集上开展了对比实验,该数据集包含2933条文本语料,8个实体类型,共10414个实体。实验结果显示,CP-MRC模型的精确率、召回率、F1值达到83.55%、81.4%、82.4%,优于其他模型;在病原、作物两类嵌套实体的识别率较其他模型F1值提升3个百分点和13个百分点,嵌套实体识别率明显提升。本文提出的模型仅采用少量可训练参数仍然具备良好识别性能,为较大规模预训练模型在信息抽取任务上的应用提供了思路。  相似文献   

13.
农业病虫害领域的意图识别和槽位填充研究仍处于起步阶段,除语料严重匮乏外,还面临任务相互独立、忽略彼此相关性和未充分利用意图嵌入信息等问题。为此,提出了一种基于意图嵌入信息和槽位门控机制的意图识别与槽-位填充联合模型(AgIG-IDSF)。首先,该模型在共享编码模块引入了注意力机制用于丰富上下文语义特征;其次,提出了一种融合意图嵌入表示和槽位门控机制的意图-槽位交互方法用以增强意图信息指导槽位填充任务的能力,进而提高模型的整体识别性能。在包含22个意图类别、10个槽位类别和11 976条标注样本的自构建语料上进行了实验。结果表明,在该语料上AgIG-IDSF模型的意图识别准确率为94.41%,槽位填充F1值为94.01%,整体识别准确率高达88.07%,显著优于包含双向关联模型在内的多种基准模型,表明了该模型在识别农业病虫害意图与槽位方面的有效性。此外,在公共数据集上的实验结果还表明了该模型具有一定的泛化能力。  相似文献   

14.
本文针对农作物病虫害图像识别需求,探索了基于数据增广技术的深度卷积神经网络迁移学习方法及识别模型,将原始样本量扩增至50倍,并通过抑制模型过拟合,从而提升模型的泛化能力和农作物病虫害识别的准确率.同时基于边缘计算理论方法与技术,将识别模型部署到边缘端,设计了基于计算机视觉与边缘计算的智能识别装置,通过该装置实时采集农作...  相似文献   

15.
基于多层EESP深度学习模型的农作物病虫害识别方法   总被引:3,自引:0,他引:3  
为了提取图像高层语义特征、解决各种植物病虫害图像尺寸不相同的问题,提出了多层次增强高效空间金字塔(Extremely efficient spatial pyramid,EESP)卷积深度学习模型。首先,对图像进行预处理;其次,构建多层融合EESP网络模型,该模型通过对每层设置不同的空洞率进行空洞卷积,选择性地提取不同层次的特征信息,通过融合各层信息获得各种农作物病虫害图像的不同特征;最后,通过Softmax分类方法实现农作物病虫害识别。数据集包括10种农作物的61种病虫害类别,迭代训练300次,得到本文方法 Top1分类准确率最高达到了88.4%,且采用三阶EESP模型达到了最佳效果。  相似文献   

16.
植物病害是造成农作物减产的主要原因之一。针对传统的人工诊断方法存在成本高、效率低等问题,构建了一个自然复杂环境下的葡萄病害数据集,该数据集中的图像由农民在实际农业生产中拍摄,同时提出了一个新的网络模型MANet,该模型可以准确地识别复杂环境下的葡萄病害。在MANet中嵌入倒残差模块来构建网络,这极大降低了模型参数量和计算成本。同时,将注意力机制SENet模块添加到MANet中,提高了模型对病害特征的表示能力,使模型更加注意关键特征,抑制不必要的特征,从而减少图像中复杂背景的影响。此外,设计了一个多尺度特征融合模块(Multi-scale convolution)用来提取和融合病害图像的多尺度特征,这进一步提高了模型对不同病害的识别精度。实验结果表明,与其他先进模型相比,本文模型表现出了优越的性能,该模型在自建复杂背景病害数据集上的平均识别准确率为87.93%,优于其他模型,模型参数量为2.20×106。同时,为了进一步验证该模型的鲁棒性,还在公开农作物病害数据集上进行了测试,该模型依然表现出较好的识别效果,平均识别准确率为99.65%,高于其他模型。因此,本文模型...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号