首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 296 毫秒
1.
针对棉花病虫害文本语料数据匮乏且缺少中文命名实体识别语料库,棉花病虫害实体内容复杂、类型多样且分布不均等问题,构建了包含11种类别的棉花病虫害中文实体识别语料库CDIPNER,提出了一种基于RoBERTa多特征融合的命名实体识别模型。该模型采用掩码学习能力更强的RoBERTa预训练模型进行字符级嵌入向量转换,通过BiLSTM和IDCNN模型联合抽取特征向量,分别捕捉文本的时序和空间特征,使用多头自注意力机制将抽取的特征向量进行融合,最后利用CRF算法生成预测序列。结果表明,该模型对于棉花病虫害文本中命名实体的识别精确率为96.60%,召回率为95.76%,F1值为96.18%;在ResumeNER等公开数据集上也有较好的效果。表明该模型能有效地识别棉花病虫害命名实体且具有一定的泛化能力。  相似文献   

2.
为解决因外来海洋生物领域实体复杂且实体间存在嵌套导致命名实体识别效果较差等问题, 提出基于融合注意力机制的卷积神经网络 (CNN) -双向门控循环单元网络 (BiGRU) -条件随机场 ( CRF) 网络模型进行外来海洋生物命名实体识别, 并构造词向量、词性特征向量等特征作为网络模型的联合输入, 以提升网络模型识别效果.结果表明: 使用融合多特征向量的CNN-BiGRU-CRF网络模型对外来海洋生物名称实体、时间实体、地名实体3类实体上的命名实体识别结果平均准确率达到了90. 62%, 平均召回率达到了89. 50%, 平均F1值达到了90. 05%, 较传统命名实体识别方法均有较大提高.研究表明, 本研究中提出的网络模型可以充分提取文本特征, 解决了文本的长距离依赖问题, 对外来海洋生物领域的命名实体识别具有较好的识别效果.  相似文献   

3.
李百红  彭勃  董超 《安徽农业科学》2021,49(19):214-217
[目的]该研究对小麦、玉米轮作制下耕地的面积与分布有重要意义.[方法]基于目视判别收集样本点和GEE平台,分析地物的NDVI、EVI等指数时序特征,开发特征识别算法提取2018年玉麦轮作区面积分布,同时与CART算法监督分类结果进行精度分析.[结果]与基于多光谱的监督分类相比,基于时序特征的识别算法准确率、精准率、F1 Score和Kappa系数分别提高了0.121、0.110、0.136和0.246.[结论]基于时序特征的特征识别算法可有效识别玉麦轮作区,该算法可为轮作区农业生产提供基础数据支持.  相似文献   

4.
为解决渔业标准命名实体识别任务中部分实体语料分布稀疏导致的效果不佳问题,提出了基于多元组合数据增广(data augmentation method based on multiple combination,MCA)的渔业标准命名实体识别方法,该方法融合了基于领域词典的联合替换算法(joint replacement algorithm based on domain dictionary,DDR)、基于槽点保护的随机删除算法(random deletion algorithm based on slot protection,SPD)和基于槽点保护的随机插入算法(random insertion algorithm based on slot protection,SPI)进行语料库的数据增广,首先构建"水产品名称"同类词词典和领域同义词词典,通过两个词典分别对"水产品名称"类实体和随机词进行同类词替换和同义词替换,生成新的句子,以增加目标实体数量和句子的多样性,然后在基于槽点保护的情况下对原句子分别进行随机删除和随机插入操作,在保留实体及上下文特征的情况下进一步丰富语料的多样性,提高模型的泛化能力.结果表明,采用基于融合注意力机制的BERT+BiLSTM+CRF网络模型和多元组合数据增广方法进行渔业标准命名实体识别,准确率、召回率、F1值分别达到了91.73%、88.64%、90.16%,具有较好的效果.研究表明,基于多元组合数据增广的渔业标准命名实体识别方法有效解决了部分实体样本稀疏问题,提升了渔业标准命名实体识别的整体效果.  相似文献   

5.
[目的]基于Faster R-CNN模型对不同成熟度蓝莓果实进行精准识别分类,为浆果类果实的自动化采摘、产量预估等提供技术支撑.[方法]选取成熟果、半成熟果、未成熟果剪切图像各4000幅和8000幅背景图像作为训练集,1000幅原始图像用于验证集开展试验,改进Faster R-CNN算法,设计一种对背景干扰、果实遮挡等因素具有良好鲁棒性和准确率的蓝莓果实识别模型,模型通过卷积神经网络(CNN)、区域候选网络(RPN)、感兴趣区域池化(ROI Pool-ing)和分类网络来实现蓝莓图像背景消除及果实识别并与DPM算法进行对比.[结果]以WOA算法优化的训练参数作为参考,在蓝莓数据集上训练网络模型.在分析P-R曲线后计算F发现,Faster R-CNN算法在成熟果、半成熟果和未成熟果上的F值分别为95.48%、95.59%和94.70%,与DPM算法相比平均高10.00%.在对3类蓝莓果实的识别精度方面,Faster R-CNN同样有着优秀的识别效果.对成熟果、半成熟果和未成熟果的识别准确率分别为97.00%、95.00%和92.00%,平均识别准确率为94.67%,比DPM算法高20.00%左右.该网络模型在高精度的识别效果下,对于蓝莓果实的平均识别速度依然达0.25 s/幅,能满足实时在线识别的需求.[建议]获取多角度、复杂环境下的图像用来提高模型识别率;利用迁移学习建立蓝莓识别模型;数据集样本扩充并分类.  相似文献   

6.
为快速精准对奶牛个体进行自动化识别,提出一种基于改进方向梯度直方图与局部二值模式(HOG-LBP)特征融合的特征提取算法,结合主成分分析对奶牛个体进行分类。首先依据奶牛头部鼻镜和额部位差异明显的特点,利用方向梯度直方图(HOG)特征检测算法进行边缘特征提取,得到奶牛头部的轮廓特征,然后与改进的局部二值模式(LBP)纹理特征提取进行特征融合,结合主成分分析方法进行奶牛个体识别,对20 000张奶牛图像进行试验。结果表明,该方法识别正确率超过99%,可成功应用到奶牛识别领域。  相似文献   

7.
提出基于局部二值化模式和像素相关算子的半色调图像纹理特征提取方法,以实现误差分散类半色调图像的分类。该方法是将误差分散类图像先进行局部二值化模式变换,再以任一像素点为中心,取适当的距离提取八个方向的像素相关值作为图像的特征向量,最后将提取的特征通过BP神经网络进行分类。实验结果表明,提出的算法适用于二值图像的特征提取,能够降低局部二值模式的特征维数,提高时间效率和空间利用率;相对灰度共生矩阵算法提出的算法在计算复杂度、识别精度等性能方面都有所改善。  相似文献   

8.
针对如何高效地发现农业舆情话题,提出了一种基于叙词表的舆情话题发现算法。该算法首先基于《农业叙词表》和综合性词表及网络新词构建叙词词典,作为中文分词软件的词典;然后运用TF-IDF计算特征词的权值,选取前P个特征词表示文本,并基于叙词间的关系计算词语相似度;最后,以叙词为节点构建无向图,通过对无向图聚类实现网络热点话题的发现。分析结果表明,该算法的最小识别代价为0.3534,算法运行效率相比传统算法较高。  相似文献   

9.
针对深度学习群猪目标检测算法精确度低和模型占用内存大等问题,提出基于Transformer与自适应空间特征融合的群猪目标检测算法。搭建群猪图像采集设备,以视频帧作为数据源,提取关键帧并剔除模糊图像,采用Labelme标注图像中猪只,建立群猪图像数据集;将Swin Transformer网络作为主干网络,在FPN后引入自适应空间特征融合方法作为特征融合网络;提出RIoU作为预测框回归损失计算方法。结果表明,该算法在精确率、召回率、F1值和平均精确率指标方面分别达到93.6%、97.2%、0.953、96.5%,检测速度为34.9 Hz且模型大小仅为20.6 MB,与YOLOv4相比上述指标分别提高1.5%、1.7%、1.6%、2.4%,模型占用内存量缩小12.5倍,检测速度提高13 Hz。研究有助于智能化猪场建设,为养殖场动物计数和行为识别等方面提供技术支持。  相似文献   

10.
基于自适应中心对称局部二值模式的作物病害识别方法   总被引:1,自引:0,他引:1  
基于局部二值模式(LBP)算子在模式识别中直方图维数高、判别能力差、具有冗余信息等缺点,针对作物病害叶片图像的特点,提出一种自适应中心对称局部二值模式(Adaptive Center-Symmetric Local Binary Patterns,ACSLBP)算法,并应用于作物病害识别。该算法能够得到光照和旋转不变性的纹理特征,利用模糊C均值聚类算法对病害叶片图像进行分割,再将分割后的病斑图像进行分块,然后采用自适应阈值提取每个子块的ACSLBP纹理直方图,结合作物病害叶片图像的颜色特征,利用最近邻分类器识别作物病害。在黄瓜4种常见病害叶片图像数据库上进行试验,平均识别率高达95%以上,表明该方法是有效可行的。  相似文献   

11.
针对农业垂直搜索中中文分词要求的特殊性,提出-5基于词典和全切分的中文分词算法。该算法首先对经过预处理的网页进行基于词典的机械式切分,对未识别的字串再进行基于贝叶斯(Bayes)方法的全切分概率计算,通过计算字串的最大切分可信度确定最合理的切分,并更新词典。实验从120万张农业中文网页中随机抽取14组生成测试集,测试结果表明,该算法与正向最大匹配算法(FMM)和逆向最大匹配算法(RMM)相比具有更高的召回率,F1测度平均达到88%。  相似文献   

12.
根据汉语中二字词较多的特点,提出了一种新的分词词典机制.该机制在词典数据结构中添加二字词检测位图表,在分词时,利用位图表可快速判断二字词优化分词速度.选取人民日报语料片断进行了实验测试.实验结果表明,基于二字词检测位图表的分词词典机制有效地提高了汉语自动分词的速度和效率.  相似文献   

13.
转向成为近年来翻译研究的新倾向。通过分析和梳理汉语词英译研究转向的含义及其主要方面,为汉语词英译提供新的研究视角。并得出结论,英译汉语词时,需综合考虑转向和传统英译策略两个方面,以实现最佳的英译。  相似文献   

14.
以《同义词词林》为基础,结合云南种子植物特有属领域知识补充了《同义词词林》中该领域的词语,并提出了一种基于同义词词林的词语相似度改进算法。经过测试对比,在植物检索领域该计算方法比一般的基于同义词词林的词语相似度算法更加准确,而且召回率得到了明显提升,更适用于云南种子植物特有属领域信息的检索。  相似文献   

15.
张文慧  张冉 《安徽农业科学》2011,39(20):12586-12587
针对农业科技人员和其他农业信息用户面对海量异构农业信息文档缺乏高校检索方法的问题,提出基于中文分词的信息检索平台系统构架,以倒排文档方式来处理各种农业信息文档,采用TF/IDF相似度计算作为评分排序的标准,构建基于中文分词的信息检索系统应用于农业信息领域,取得较好效果。  相似文献   

16.
一种基于统计的中文自动文摘方法   总被引:2,自引:1,他引:2  
为开发出实现容易,成本低,实用性强的计算机中文自动文摘系统,研究,设计了一个基于 中文自动文摘系统模型,提出了一种新的特征词加权函数和一种新的句子重要性加权函数,该系统能对任意领域,任意体裁,任意长度的文章以任意比例提取文摘。  相似文献   

17.
随着农业信息化、智能化的不断发展,农业信息量呈现井喷式增长,为广大农业从业者和农业科研人员提供便捷有效的信息检索方法是目前农业搜索引擎亟需解决的问题.为此,本文提出了基于Heritrix+Solr的农业信息垂直搜索引擎框架,并设计了适用于农业信息垂直搜索引擎的隐马尔科夫Web信息抽取模块和基于词典的mmseg4j中文分词模块,同时改进了页面排序算法,对进一步提升农业垂直搜索引擎的用户体验和工作效率具有一定的参考价值.  相似文献   

18.
词汇石化是语言学习中的一个普遍现象。对于这种现象, 多数研究者利用外部因素来解释, 认为中西方存在的客观现实因素、语言和文化因素是造成词汇石化的原因。这无疑是正确的。但词汇心理表征、词汇网络建设策略和情感因素等内在心理认知机制也是词汇石化现象的重要原因  相似文献   

19.
在农业垂直搜索引擎研究过程中,中文分词是重要的研究方向。针对传统农业垂直搜索引擎搜索信息抽取不准确、速度慢等缺点,采用双数组Trie树为基本模型,利用中文词条首字区位码与数据库表行号相对应的方式,并根据农业垂直搜索引擎的需要设置了农业词汇的词性编码,以My SQL数据库为例设计了农业领域专用的分词词典。该分词词典可充分利用数据库的优势进行词典组织,并且可以进行词库的远程共享和共同维护,方便不同的系统进行访问;词条按首字分类存放构造双数组Trie树,可有效减少构造过程的内存空间。该农业分词词典结构对其他领域和行业也具有借鉴意义。  相似文献   

20.
在英汉翻译中 ,一个词应如何理解和翻译 ,取决于它特定的语境。语境包括微观语境和宏观语境。微观语境和宏观语境对英汉翻译中词义的确定都产生了重大影响  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号