首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
针对棉花病虫害文本语料数据匮乏且缺少中文命名实体识别语料库,棉花病虫害实体内容复杂、类型多样且分布不均等问题,构建了包含11种类别的棉花病虫害中文实体识别语料库CDIPNER,提出了一种基于RoBERTa多特征融合的命名实体识别模型。该模型采用掩码学习能力更强的RoBERTa预训练模型进行字符级嵌入向量转换,通过BiLSTM和IDCNN模型联合抽取特征向量,分别捕捉文本的时序和空间特征,使用多头自注意力机制将抽取的特征向量进行融合,最后利用CRF算法生成预测序列。结果表明,该模型对于棉花病虫害文本中命名实体的识别精确率为96.60%,召回率为95.76%,F1值为96.18%;在ResumeNER等公开数据集上也有较好的效果。表明该模型能有效地识别棉花病虫害命名实体且具有一定的泛化能力。  相似文献   

2.
融合注意力机制和BiLSTM+CRF的渔业标准命名实体识别   总被引:2,自引:0,他引:2  
为了解决渔业标准文本中专有命名实体具有上下文敏感性、长序列存在语义稀释等问题,提出了基于E-BIO标注法和融合注意力机制的BiLSTM+CRF (BiLSTM+Attention+CRF)命名实体识别模型,E-BIO标注法引入渔业标准文本中的结构化信息,可以使模型有效学习上下文结构特征,而注意力机制输出不断变化的语义向量,可有效解决长序列语义稀释问题。为验证所提出方法的有效性,在采用E-BIO方法标注的语料上进行对比试验,结果显示,BiLSTM+Attention+CRF模型对不同类别的渔业标准命名实体识别的准确率均能达到90%以上,召回率均能达到85%以上。研究表明,本研究中提出的BiLSTM+Attention+CRF命名实体识别模型可以有效利用上下文结构特征,避免了语义稀释问题,对于渔业标准命名实体识别具有较好的识别性能。  相似文献   

3.
为解决因外来海洋生物领域实体复杂且实体间存在嵌套导致命名实体识别效果较差等问题, 提出基于融合注意力机制的卷积神经网络 (CNN) -双向门控循环单元网络 (BiGRU) -条件随机场 ( CRF) 网络模型进行外来海洋生物命名实体识别, 并构造词向量、词性特征向量等特征作为网络模型的联合输入, 以提升网络模型识别效果.结果表明: 使用融合多特征向量的CNN-BiGRU-CRF网络模型对外来海洋生物名称实体、时间实体、地名实体3类实体上的命名实体识别结果平均准确率达到了90. 62%, 平均召回率达到了89. 50%, 平均F1值达到了90. 05%, 较传统命名实体识别方法均有较大提高.研究表明, 本研究中提出的网络模型可以充分提取文本特征, 解决了文本的长距离依赖问题, 对外来海洋生物领域的命名实体识别具有较好的识别效果.  相似文献   

4.
命名实体识别是构建知识图谱的关键,在农业病虫害领域存在病虫害数据匮乏、实体结构复杂、实体类型识别困难等问题。针对于病虫害数据匮乏,本文采用网络爬虫技术以及扫描文本数据的方法,构建了玉米、小麦、水稻病虫害实体语料库。传统的命名实体识别方法无法解决农业病害实体结构复杂、实体类型识别困难等问题。本文提出一种基于GPT规则修正的LEBERT-BilSTM-CRF模型,LEBERT模型构建了字典树和Lexicon-Adapter结构,将原始字符进行扩充增加数据的丰富性,将经过BiLSTM-CRF的输出和GPT结果进行实体标签修正以此来提高准确率。在公开数据集训练得到合适的参数后,在自建文本语料库进行训练,通过条件随机场和GPT修正生成全局最优序列取得很好的识别效果,准确率为94.23%,召回率为92.34%,F1值为93.28%。  相似文献   

5.
基于深度学习的渔业领域命名实体识别   总被引:2,自引:0,他引:2  
为了解决基于分词的渔业领域命名实体识别效果受分词准确度影响这一问题,采用一种基于深度学习的渔业领域命名实体识别方法。该方法使用神经网络训练得到字向量作为模型输入,避免了分词不准确对渔业领域命名实体识别效果造成的影响;针对渔业领域命名实体长度较长这一特点,使用LSTM单元保持较长时间记忆信息,并将标记信息融入到CRF模型中构建Character+LSTM+CRF实体识别模型。为验证方法的有效性,在渔业领域语料集上进行多组实验,结果表明,本研究中提出的Character+LSTM+CRF方法具有较好的效果,与LSTM模型相比较,在准确率、召回率、F值上分别提升了3.39%、2.99%、3.19%,对于渔业领域实体识别具有较好的效果。  相似文献   

6.
针对油气领域知识图谱构建过程中命名实体识别使用传统方法存在实体特征信息提取不准确、识别效率低的问题,提出了一种基于BERT-BiLSTM-CRF模型的命名实体识别研究方法。该方法首先利用BERT(bidirectional encoder representations from transformers)预训练模型得到输入序列语义的词向量;然后将训练后的词向量输入双向长短期记忆网络(bi-directional long short-term memory, BiLSTM)模型进一步获取上下文特征;最后根据条件随机场(conditional random fields, CRF)的标注规则和序列解码能力输出最大概率序列标注结果,构建油气领域命名实体识别模型框架。将BERT-BiLSTM-CRF模型与其他2种命名实体识别模型(BiLSTM-CRF、BiLSTM-Attention-CRF)在包括3万多条文本语料数据、4类实体的自建数据集上进行了对比实验。实验结果表明,BERT-BiLSTM-CRF模型的准确率(P)、召回率(R)和F1值分别达到91.3%、94.5...  相似文献   

7.
针对当前玉米病害发生量大、病情复杂、难以防治,严重影响玉米产量和质量的问题,提出了一种基于卷积神经网络和迁移学习的玉米叶片病害检测与识别方法。首先收集了3 827张玉米健康叶片图像和3种不同的玉米病害叶片图像样本,为了使模型拥有更好的泛化能力,使用生成对抗网络对样本进行处理,得到分辨率更高的样本,再对样本进行平移旋转,使样本数量达到5 153张。然后构建ResNet模型,分别对ResNet34、ResNet50及对其添加CBAM注意力机制和FPN特征金字塔网络,并通过迁移学习方法将预训练权重迁移到训练模型中。试验结果表明,ResNet50结合CBAM注意力机制模型的准确率达到了97.5%,相比ResNet50模型准确率提升了4.2百分点,相比ResNet34模型准确率提升了4.9百分点。本研究表明,提出的ResNet50结合CBAM注意力机制模型能够较精准地检测识别玉米枯萎叶、锈病叶、灰斑病叶和健康叶。并可将模型安装在无人机等移动设备上,实现对玉米叶片病害智能化防治,而且后期还会扩充更多的植物病害数据,实现对多类植物病害的检测,为智慧农业添砖加瓦,促进农业防治现代化。  相似文献   

8.
姚青  姚波  吕军  唐健  冯晋  朱旭华 《中国农业科学》2021,54(21):4562-4572
【目的】智能虫情测报灯诱捕到的农业害虫因种类繁多、虫体姿态多样、鳞片脱落等原因造成有些害虫图像存在种间相似和种内差异的现象。为了提高农业灯诱害虫识别率,针对YOLOv4检测模型检测到且容易混淆的19种灯诱害虫,本文提出了基于双线性注意力网络的农业灯诱害虫细粒度图像识别模型。【方法】首先,根据灯诱害虫外观图像的相似性和检测误检的情况,将19种害虫分为6类;将所有害虫图像通过补边操作使得长宽相等,并缩放至统一尺寸224×224像素。为了提高模型的鲁棒性和泛化能力,对害虫图像进行镜像翻转、旋转180度、高斯噪声和均值滤波的数据增强,训练集、验证集和测试集样本量按照8:1:1比例划分。然后,针对6类19种农业灯诱害虫细粒度图像,建立了基于双线性注意力网络的农业灯诱害虫识别模型(bilinear-attention pest net,BAPest-net),模型包括双线性特征提取、注意力机制和分类识别3个模块;通过修改特征提取模块的下采样方式提高特征提取能力;添加注意力机制模块让整个模型更关注于局部细节的特征,将双线性结构中的上下两个注意力机制的输出进行外积运算增加细粒度特征的权重,提高识别的准确性和学习效率;模型优化器使用随机梯度下降法SGD,分类模块中使用全局平均池化,旨在对整个网络从结构上做正则化防止过拟合。最后,在同一个训练集训练VGG19、Densenet、ResNet50、BCNN和BAPest-net 5个模型,对6类相似的19种农业灯诱害虫进行识别,以精准率、Precision-Recall(PR)曲线和平均识别率作为模型的评价指标。【结果】BAPest-net对6类相似的19种农业灯诱害虫平均识别率最高,达到94.9%;BCNN次之,为90.2%;VGG19模型最低,为82.1%。BAPest-net识别的6类害虫中4类鳞翅目害虫的平均识别率均大于95%,表明该模型能较好地识别出鳞翅目害虫。测试结果中仍存在少数相似度较高的害虫误判,特别当害虫腹部朝上或侧身,种类特征不够明显的时候容易引起相似害虫的误判。对于区分度较低的相似害虫需要更多的训练样本以获取更多的特征,提高模型的识别率和泛化能力。【结论】基于双线性注意力网络的农业灯诱害虫细粒度图像识别模型可以自动识别6类相似的19种农业灯诱害虫,提高了农业灯诱害虫自动识别的准确率。  相似文献   

9.
苹果叶片病害的高效准确识别有助于合理使用杀虫剂、肥料等农业资源,进而保证苹果的产量与质量。为提高苹果叶片病害识别的准确率,提出一种残差网络与注意力机制结合的苹果叶片病害识别模型:P-D-ECA-ResNet101。首先构建苹果叶片病害数据集,然后使用常见的4种网络模型在构建的数据集上进行训练,选取训练效果最好的ResNet101为骨干网络模型,通过推迟下采样(delayed downsampling)、拆解大卷积层以及引入高效通道(efficient channel attention module, ECA)注意力模块对ResNet101网络模型进行优化,最后通过特征图可视化展示改进后网络模型的识别机制。试验结果表明,推迟下采样可以增强模型特征提取能力,拆解大卷积层可以有效减少模型的复杂度,引入ECA注意力模块可以削弱无效特征信息对模型的干扰。改进后的P-D-ECA-ResNet101模型在构建的苹果叶片病害测试集上的平均识别准确率达到96.20%,相较于原模型ResNet101提升了2.20百分点。特征图可视化分析表明改进后的P-D-ECA-ResNet101模型可以更好地聚焦于病...  相似文献   

10.
为解决渔业标准命名实体识别任务中部分实体语料分布稀疏导致的效果不佳问题,提出了基于多元组合数据增广(data augmentation method based on multiple combination,MCA)的渔业标准命名实体识别方法,该方法融合了基于领域词典的联合替换算法(joint replacement algorithm based on domain dictionary,DDR)、基于槽点保护的随机删除算法(random deletion algorithm based on slot protection,SPD)和基于槽点保护的随机插入算法(random insertion algorithm based on slot protection,SPI)进行语料库的数据增广,首先构建"水产品名称"同类词词典和领域同义词词典,通过两个词典分别对"水产品名称"类实体和随机词进行同类词替换和同义词替换,生成新的句子,以增加目标实体数量和句子的多样性,然后在基于槽点保护的情况下对原句子分别进行随机删除和随机插入操作,在保留实体及上下文特征的情况下进一步丰富语料的多样性,提高模型的泛化能力.结果表明,采用基于融合注意力机制的BERT+BiLSTM+CRF网络模型和多元组合数据增广方法进行渔业标准命名实体识别,准确率、召回率、F1值分别达到了91.73%、88.64%、90.16%,具有较好的效果.研究表明,基于多元组合数据增广的渔业标准命名实体识别方法有效解决了部分实体样本稀疏问题,提升了渔业标准命名实体识别的整体效果.  相似文献   

11.
[目的]断奶仔猪腹泻严重影响养猪业的经济效益,本试验基于机器视觉技术提出一种排泄姿态与异常粪便结合的断奶仔猪腹泻检测方法以实现断奶仔猪腹泻的快速、准确检测。[方法]以深层卷积神经网络(convolutional neural networks,CNN)为基础构建腹泻检测分类模型,实现仔猪身份、姿态与异常粪便的一体化识别,对比不同迭代次数对模型效果的影响,选取最优模型;提出时空信息融合判定法,从时间序列先后和空间距离远近两方面,关联最优模型识别出的目标姿态与病便,实现断奶仔猪腹泻的视频检测。[结果]在训练迭代25 000次时接近模型最优值,对姿态、病便等目标识别的平均精度均值和召回率分别为95.75%和89.13%;基于时空信息融合方法的断奶仔猪腹泻视频检测识别准确率和召回率分别为97.92%和95.92%。[结论]深层卷积神经网络分类模型结合时空信息融合判定法为断奶仔猪腹泻自动识别提供了有力的技术支撑。  相似文献   

12.
针对鸭蛋裂纹人工检测受主观性影响造成精度波动大等问题,利用ResNet34网络模型,提出1种基于梅尔谱图的鸭蛋裂纹识别算法。首先利用敲蛋装置收集敲蛋声音数据,再将音频转化成梅尔谱图,构建梅尔谱图数据集,然后搭建ResNet34模型,引入迁移学习机制训练模型,再通过Adam优化算法更新梯度,增加注意力机制模块并将卷积结构替换为深度可分离卷积以对网络模型进行改进,并调整参数进行优化,最后利用模型对鸭蛋裂纹进行识别。结果显示:改进的ResNet34DP_CA网络模型检测的平均准确率为92.4%,对比原始ResNet34网络模型,平均准确率提高5.5个百分点,参数量减少32%;对比其他网络模型VGG16、MobileNetv2和EfficientNet,平均准确率分别提高10.9、13.7、16.3个百分点,识别时间为21.5 ms。结果表明,所提出的基于梅尔谱图和改进ResNet34模型的鸭蛋裂纹识别算法,能够有效地对鸭蛋裂纹进行检测识别。  相似文献   

13.
针对人工诊断棉叶螨害分级准确率低、耗时长、成本高的问题,提出一种基于迁移学习和改进残差网络的棉花叶螨为害等级识别方法。以3种受害等级的棉花叶片与健康叶片图像作为对象,分别于单一背景和自然环境下采集图像,构建图像数据集。首先,利用PlantVillage数据集预训练模型,使用数据增强技术对数据集进行数据增强,扩充训练样本;然后,在ResNet50网络模型的基础上,引入焦点损失函数,在不同网络层嵌入注意力机制模块,并加入Dropout正则化构建改进的ResNet50模型;最后,对比不同模型的识别效果。结果表明:同时在深层和浅层引入注意力机制模块,设定动量为0.9、学习率为0.001时,改进的ResNet50模型具有最好的分类效果,优于ResNet50、VGG16、MobileNet、AlexNet和SENet模型,对棉叶螨危害等级的平均识别准确率达到97.8%。  相似文献   

14.
方莹 《广东农业科学》2011,38(6):197-199
提出了一种基于层叠条件随机场模型(C-CRF)的农业领域命名实体识别方法。该方法在底层以字作为切分粒度,充分利用农作物特征词典,识别简单命名实体。识别结果作为高层条件随机场的输入,在高层以词作为切分粒度,结合复杂特征,识别嵌套命名实体。实证分析表明该方法获得了较好的结果。  相似文献   

15.
病虫害影响水稻质量和产量,快速、准确地检测出水稻病虫害有利于及时防治。针对传统图像识别方法存在特征提取繁琐、识别率低以及对田间环境下的作物病虫害识别困难等问题,本文提出一种以DenseNet121为基础网络,结合迁移学习与坐标注意力机制的水稻病虫害识别模型。该模型引入坐标注意力学习图像特征的通道间关系和空间位置的重要性以增强模型的特征提取能力,采用迁移学习策略训练模型以缓解模型在小数据集上的过拟合现象、减小计算资源以及提升模型的识别性能。利用从田间复杂环境收集的水稻病虫害数据集,对该模型与ResNet50、Xception、InceptionV3、InceptionResNetV2及原DenseNet121等卷积神经网络模型的识别效果进行比较,结果表明,该模型能有效识别出水稻常见8种病虫害和健康植株,识别准确率达到98.95%,模型参数量仅为7.23 M,识别效果优于其他模型。这可为田间环境下的其他作物病虫害识别提供参考。  相似文献   

16.
  目的  红外触发相机采集的雪豹监测图像质量参差不齐,且数量有限,为了提升小样本下雪豹的识别准确率,本研究提出一种雪豹监测图像自动识别方法。  方法  该方法基于具备注意力机制的ResNeSt50模型,使用祁连山国家公园的雪豹监测图像作为原始数据集,红外触发相机拍摄的非雪豹陆生野生动物图像作为扩充负样本,网络雪豹图像作为扩充正样本,生成3种数据集并依次进行对比实验,选择合适的扩充方式引导模型逐步关注到雪豹个体关键特征,使用梯度类激活热力图可视化进一步验证数据扩充后的有效性。  结果  使用原始数据集+扩充负样本+扩充正样本训练的模型识别效果最好,热力图可视化显示模型正确关注到雪豹个体花纹与斑点特征,对比基于Vgg16和ResNet50的识别模型,ResNeSt50的识别效果最好,测试集识别准确率达到97.70%,精确率97.26%,召回率97.59%。  结论  采用本研究提出的原始数据集+扩充负样本+扩充正样本数据扩充方法训练的模型,可以区分背景与前景,且对雪豹本身特征具有较强的判别能力,泛化能力最好。   相似文献   

17.
在当今互联网信息资源中,农业学者的信息组织仍处于相对无序和混乱的状态,成果信息与农业学者信息也难以实现一体化关联应用。为了实现农业学者信息的有效组织,提出针对农业学者的本体构建方法,为建立农业学者信息检索系统和知识服务平台等知识图谱应用奠定了模式层基础。首先,根据现有本体资源以及学者数据的特殊性,确定本体类的结构和属性,完成本体框架的构建;其次,使用本体描述语言进行形式化表示,并与现有知识组织资源进行关联以实现本体的共享与互操作;再次,应用深度学习算法实现长三角地区农业学者信息的命名实体识别,并利用Neo4j图数据库存储和展示农业学者实例数据;最后,以长三角地区农业学者为例进行本体验证与评估。结果表明,BiLSTM-CRF模型相较于其他模型在学者命名实体识别任务中具有更高的准确率、召回率和F1值,对于农业学者领域的实体抽取具有良好的适用性。进而为建立全面的农业学者知识图谱和智能化农业知识服务平台奠定语义基础,并提供建设思路。  相似文献   

18.
[目的]针对育肥猪采食行为识别误差大、检测速度慢等问题,提出一种具有轻量化结构的育肥猪采食行为检测模型,实现对育肥猪采食行为的快速检测与采食时长统计。[方法]以YOLO v5L目标检测算法为基础,构建侧视视角下的猪只采食行为检测模型。对比更换不同轻量化主干网络后对模型检测效果的影响,选取性能最优的模型;改进ShuffleNet V2网络结构基本单元,采用Mish激活函数提高模型泛化能力与推理速度,引入SE注意力机制给予目标特征更高的权重以提高目标识别精度;对比分析模型增加非营养性访问行为检测前、后的采食行为识别准确率。[结果]优化后的育肥猪采食行为检测模型大小为38.2 MB,计算量为37.8 GFLOPs,视频检测平均帧耗时7.6 ms。与非营养性访问行为进行区分识别后,猪只采食行为检测识别准确率为96.4%,召回率为92.5%。模型检测采食时长与人工统计采食时长相对误差为6.1%。[结论]改进的YOLO v5L-ShuffleNet网络模型检测速度和模型大小均能满足实际生产需求,可在复杂养殖环境中全天候识别育肥猪采食行为。  相似文献   

19.
为解决渔业健康养殖标准文本关系抽取领域特定性强、语意复杂导致关系抽取准确率不高等问题,提出了基于改进BiRTE的渔业健康养殖标准复杂关系抽取方法,针对实体和语义关联建模,将RoBERTa作为编码器,采用全词掩码和动态掩码的方式增强词向量特征表示,并在此基础上融合了自注意力机制(Self-Attention, SelfATT)将实体特征与关系特征结合聚焦,加强实体抽取与关系预测的联系,从而提升渔业标准文本抽取的准确性。结果表明:本文提出的基于改进BiRTE的渔业健康养殖标准复杂关系抽取模型(RoBERTa-BiRTE-SelfATT)对渔业标准复杂关系抽取的准确率、召回率和F1值分别为95.9%、95.4%、95.7%,较BiRTE模型分别提升了4.2%、3.1%、3.8%。研究表明,本文提出的渔业健康养殖标准复杂关系抽取模型RoBERTa-BiRTE-SelfATT可以有效解决渔业标准文本关系抽取中专有名词识别不准确、语意复杂导致实体关系难以抽取的问题,是一种有效的渔业标准复杂关系抽取方法。  相似文献   

20.
针对自然环境中,人工目视解译苹果叶部病害耗时耗力、人为主观因素强的问题。本研究提出了一种融合自注意力机制和Transformer模块的目标检测算法——BCE-YOLOv5,实现对自然环境下对苹果叶片病虫害的自动识别与检测。该算法首先使用BotNet、ConvNeXt模块分别替换Backbone网络和Neck网络的CSP结构,增加自注意力机制对目标的特征提取能力。通过将改进的CBAM引入YOLOv5的特征融合网络之后,使注意力机制对特征融合信息更加地关注。最后,用α-IoU损失函数替换IoU损失函数,使得网络在模型训练过程中收敛的更加稳定。BCE-YOLOv5算法在传统算法YOLOv5基础上平均精准率均值提升了2.9百分点,并且改进后的算法的模型大小和计算量较传统算法分别减小了0.2 M和0.9 GFLOPs。平均精度均值比YOLOv4s、YOLOv6s、YOLOx-s和YOLOv7模型分别高2.5、1.3、3.5、2.2百分点。该方法能快速准确识别苹果叶部病害,为苹果种植过程中提供智能化管理做参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号