首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为实现普米语孤立词语谱图的分类,引入基于卷积神经网络的语谱图模型,该模型可以无监督学习语谱图特征实现分类.本文搭建了一个9层的卷积神经网络模型,利用彩色语谱图样本集进行训练,并针对已训练好的模型,通过实验检验各项因素对分类的影响,从而得到适当的参数.参数确定后,进行卷积神经网络与支持向量机、 BP神经网络的对比实验,验证算法的可行性和有效性.实验显示基于卷积神经网络的普米语孤立词语谱图分类准确率达到91%~95%,这说明该算法是可行和有效的.与支持向量机、 BP神经网络相比,卷积神经网络具有自动提取特征,避免过拟合问题,适合大样本数据进行训练的优点.  相似文献   

2.
为了提高水稻病虫害问答的准确性、快捷性和智能性,构建一种基于word2vec和注意力机制(Attention)优化的Seq2Seq问答模型。采用爬虫技术获取网络问答数据2万余条,经Jieba分词对数据进行分词处理,去除停用词无用符号等。同时,为提高模型的准确率,采用word2vec中的Skip-Gram模型将句子中的词语进行转换,得到具有语义等信息的词向量,并将经word2vec训练得到的词向量与加入了Attention(注意力机制)的Seq2Seq(Sequence to Sequence,序列到序列)模型进行问答模型训练。试验选取20000条水稻病虫害问答数据,按照随机选取方式,将数据按7/1/2进行训练、验证与测试。将本研究的问答模型与Seq2Seq模型和仅加入Attention机制的Seq2Seq模型进行对比分析,以BLEU评分标准与问答正确率为判断依据。试验结果表明:采用加入了word2vec与Attention机制的Seq2Seq问答模型相比其他两种模型,其模型的测试结果更为准确。该模型在BLEU评分和问答准确率上均高于其他两种模型,BLEU评分与问答正确率分别为33.58%和71%。比其他两种问答模型分别提高22.34%、9.51%和28%、14%。本研究构建的问答模型显著地提高了问答的准确率,能较好地解决农户在水稻种植生产过程中遇到的难题。  相似文献   

3.
问题分类是问答系统的重要组成部分,其作用是将问题划分到对应的类别里以提高问答系统的准确率。本研究提出了一种基于领域本体的农作物病虫害问题分类方法,该方法首先构建农作物病虫害领域本体,将领域本体中的领域词添加到分词系统中以提高分词的准确率。然后提取特征词,并利用同义词词林和领域本体对特征词进行扩展。最后,针对农作物病虫害领域的特殊性将问题分为4类,利用语义和规则相结合的问题分类方法对问题分类。试验结果表明,该方法有助于提高问题分类的准确率。  相似文献   

4.
基于神经网络的大麦病害识别研究   总被引:1,自引:0,他引:1  
试验首先提取甘肃大麦病斑的颜色和纹理特征,以特征向量为输入向量来构造大麦病害神经网络分类器模型.然后利用神经网络对采集到的训练集病害图像进行分类模型训练,最后以随机选取的两组测试图像进行了分类试验.结果表明:大麦病害神经网络分类器模型对甘肃大麦病害的整体识别正确率达到86.7%以上.因而,基于神经网络的大麦病害图像识别研究为大麦田间病害归类诊治提供了新型技术,为西北特别是甘肃大麦病害的早期诊断与科学防治奠定了技术基础.  相似文献   

5.
农业技术需求文本实体提取是农业技术转移工作中需求分析能够量化、特征化的关键技术.基于主流农业技术转移网站上的农业技术需求文本进行分析,提出农业技术需求文本中需求主体对象、需求意图、需求程度3种关键实体成分;分别使用传统的CRF和基于神经网络的词向量+BiLSTM+CRF 2种模型对关键实体进行识别提取.试验结果表明,词向量+BiLSTM+CRF在正确率、召回率指标上分别能达到88.51%和82.28%以上,均优于CRF模型.  相似文献   

6.
针对油气领域知识图谱构建过程中命名实体识别使用传统方法存在实体特征信息提取不准确、识别效率低的问题,提出了一种基于BERT-BiLSTM-CRF模型的命名实体识别研究方法。该方法首先利用BERT(bidirectional encoder representations from transformers)预训练模型得到输入序列语义的词向量;然后将训练后的词向量输入双向长短期记忆网络(bi-directional long short-term memory, BiLSTM)模型进一步获取上下文特征;最后根据条件随机场(conditional random fields, CRF)的标注规则和序列解码能力输出最大概率序列标注结果,构建油气领域命名实体识别模型框架。将BERT-BiLSTM-CRF模型与其他2种命名实体识别模型(BiLSTM-CRF、BiLSTM-Attention-CRF)在包括3万多条文本语料数据、4类实体的自建数据集上进行了对比实验。实验结果表明,BERT-BiLSTM-CRF模型的准确率(P)、召回率(R)和F1值分别达到91.3%、94.5...  相似文献   

7.
黄瓜病害识别是病害防治的提前。针对现有作物病害识别方法中存在实体关系交叉关联、多源异构数据聚合能力差、依靠大规模标注数据、缺乏专家经验知识指导等问题,提出一种知识图谱与深度学习的黄瓜叶部病害识别方法(KGCNN)。该方法通过知识图谱与实体链接消歧嵌入获取作物病害知识图谱中的结构化病害知识,并将病害特征词向量与知识实体向量作为卷积神经网络的多通道输入,在卷积过程中从知识和语义2个层面表示不同病害类型。与现有的作物叶部病害识别方法相比,该方法充分利用了知识图谱和CNN分别在知识表示和特征学习方面的优势。在由黄瓜白粉病、斑点病和角斑病的病害叶片及其对应的环境气候气象信息的数据集上进行训练和测试。结果表明该方法的识别性能优于基于CNN及其改进模型和其他病害识别方法。该方法适用于作物初步病害识别,可为其他作物病害的识别提供技术支持。  相似文献   

8.
为解决羊群疾病检索过程中出现的大量冗余数据及检索后仍需人工挑选准确答案造成的资源浪费,本研究通过以下3个步骤构建基于知识图谱的羊群疾病问答系统:(1)通过爬虫获取数据,人工提取部分信息,再进行自动化信息抽取,在命名实体识别任务中使用双向长短期记忆循环神经网络Bi-LSTM模型,并添加注意力机制提高识别效率,然后使用BIO规则进行实体标注,完成信息抽取,将数据融合后存储在Neo4j图数据库中,构建羊群疾病知识图谱。(2)针对属性映射,构建Bert-softmax模型;根据用户提问,采用Bert模型计算问句和属性的语义相似度,并通过softmax算法进行归一化处理,返回合适答案给用户,实现羊群疾病问答系统算法设计。(3)构建羊群疾病诊断平台,使用Bootstrap、Echarts、Vue组件实现羊群疾病问答系统的可视化,利用Python语言包含的flask框架搭建后台,封装疾病信息,通过web前端呈现给用户,并于后端建立连接,实现数据之间的交互。试验结果显示,基于Bi-LSTM+Attention+CRF模型实体识别的F1值为83.16%,构建的知识图谱包含实体4 576个,实体关系超13...  相似文献   

9.
以吉林省延边朝鲜族自治州汪清县的主要针叶纯林树种为研究对象,结合Landsat 8 OLI数据和地面调查数据,通过提取半径为15 m圆形样地林分尺度下的遥感特征变量实现对地上生物量的估算。首先提取128块样地内的34个遥感特征,其次采用随机森林特征重要性分析遥感特征的贡献率,再利用BP神经网络算法的2种训练算法、SVM支持向量机的3种核函数构建地上生物量模型,最后利用32个测试样本评价模型的估算精度。结果表明,BP神经网络的L-M训练算法和贝叶斯正则化训练算法的R2分别为0.602 9、0.672 1,RMSE分别为5.096 9、4.263 7,MAE分别为4.166 9、3.211 8;SVM支持向量机的线性核函数、RBF核函数、多项式核函数的R2分别为0.585 8、0.561 9、0.487 7,RMSE分别为5.859 4、5.600 9、5.763 7,MAE分别为4.24、3.89、4.176。以贝叶斯正则化训练算法构建地上生物量模型的估测精度最佳;BP神经网络算法比SVM向量机更适用于本研究;同一种机器学习算法不同的训练函数存在差异性。  相似文献   

10.
新词识别是食品安全信息处理中的一个难点,新词是造成分词错误的重要原因.利用互信息提取新词特征并采用BP神经网络过滤垃圾词串以识别新词,以提高食品安全文本分词准确率.首先在互信息新词识别基础上,得到候选新词的多个统计量特征.然后对候选字串是否成词进行人工标记.最后将统计量特征和人工标记的新词作为训练样本,建立BP神经网络...  相似文献   

11.
由于语言上的差异,中文垃圾邮件过滤与英文邮件在信息处理技术上差别较大.针对中文垃圾邮件过滤的邮件训练集、过滤规则和分类器特征库更新不及时,经常出现误判和漏判等问题,以文本分类技术为基础,将基于规则方法和Bayes分类方法相结合,设计了一种中文垃圾邮件过滤方法,详细阐述了中文邮件过滤的邮件预处理、中文分词、特征选取等技术.试验结果表明,该方法可以明显改善中文垃圾邮件过滤效果.  相似文献   

12.
基于本体(ontology)知识抽取的主要目标是研究如何从没有语义信息的非结构文档中抽取与领域本体匹配的知识,从而实现对知识充分、有效的利用。以农业知识为研究对象,提出一种利用本体从Web网页上提取知识的方法。首先利用自顶向下的方法建立农业领域本体,然后利用噪声消除算法去除噪音块,接着将农业领域本体解析的结果应用到中文分词、命名实体识别及知识抽取过程中,从而使得中文分词和命名实体识别的结果更准确,解决Web信息抽取系统中抽取结果缺乏语义信息的问题。最后,通过试验验证该抽取系统能够得到性能较高的抽取结果。  相似文献   

13.
[目的]水稻FAQ(frequently asked question,常问问题集)问答系统对农户在水稻种植过程中遇到的问题进行解答,问句相似度计算是其核心,用来匹配用户问题和FAQ中的问题。针对传统句子相似度算法准确率普遍较低的问题,本研究旨在用深度学习计算问句相似度,以提高系统回答的准确性。[方法]构建一个基于word2vec和LSTM(long-short term memory,长短期记忆)神经网络,包括输入层、嵌入层、LSTM层、全连接层和输出层的句子相似度模型。对水稻FAQ中的3 007个问题进行归类和组合得到32 072个问题对,并标注其相似性作为训练和测试数据。使用基于农业领域语料库训练得到的word2vec模型对训练数据向量化后作为输入,训练句子相似度模型。[结果]在测试集上对模型进行验证,并与基于How Net、基于词向量的余弦距离以及基于word2vec和卷积神经网络(convolutional neural network,CNN)的3种句子相似度算法进行对比。对句子相似度的计算结果进行抽样检查,该模型的计算结果更符合人的直观印象。从准确率和ROC(receiver operating characteristic curve)曲线进行分析,该模型也明显优于其他3种方法,准确率达到了93.1%。[结论]本研究构建的模型显著提升了句子相似度计算的准确率,基于该模型开发的水稻FAQ问答系统,能够准确匹配用户问题和水稻FAQ中的问题,帮助农户更好地解决水稻生产中遇到的问题。  相似文献   

14.
鲍彤  罗瑞  郭婷  贵淑婷  任妮 《南方农业学报》2022,53(7):2068-2076
【目的】研究不同词向量和深度学习模型组合对农业问句分类结果的影响,为构建农业智能问答系统提供技术支撑。【方法】通过爬虫获取农业种植网等网站的问答数据,选择20000条问句进行人工标注,构建农业问句分类语料库。采用BERT对农业问句进行字符编码,利用文本卷积神经网络(TextCNN)提取问句高维度特征对农业问句进行分类。【结果】在词向量对比实验中,BERT字向量与TextCNN结合时农业问句分类F1值达93.32%,相比Word2vec字向量提高2.1%。在深度学习模型的分类精度对比方面,TextCNN与Word2vec和BERT字向量结合的F1值分别达91.22%和93.32%,均优于其他模型。在农业问句的细分试验中,BERT-TextCNN在栽培技术、田间管理、土肥水管理和其他4个类别中分类F1值分别为86.06%、90.56%、95.04%和85.55%,均优于其他深度学习模型。超参数设置方面,BERT-TextCNN农业问句分类模型卷积核大小设为[3,4,5]、学习率设为5e-5、迭代次数设为5时效果最优,该模型在数据样本不均衡的情况下,对于农业问句的平均分类准确率依然能达93.00%以上,可满足农业智能问答系统的问句分类需求。【建议】通过阿里NLP等开源平台提升数据标注质量;在分类过程中补充词频和文档特征,提高模型分类精度;农业相关政府职能部门加强合作,积极探索农业技术数字化推广和服务新模式。  相似文献   

15.
基于深度学习的渔业领域命名实体识别   总被引:2,自引:0,他引:2  
为了解决基于分词的渔业领域命名实体识别效果受分词准确度影响这一问题,采用一种基于深度学习的渔业领域命名实体识别方法。该方法使用神经网络训练得到字向量作为模型输入,避免了分词不准确对渔业领域命名实体识别效果造成的影响;针对渔业领域命名实体长度较长这一特点,使用LSTM单元保持较长时间记忆信息,并将标记信息融入到CRF模型中构建Character+LSTM+CRF实体识别模型。为验证方法的有效性,在渔业领域语料集上进行多组实验,结果表明,本研究中提出的Character+LSTM+CRF方法具有较好的效果,与LSTM模型相比较,在准确率、召回率、F值上分别提升了3.39%、2.99%、3.19%,对于渔业领域实体识别具有较好的效果。  相似文献   

16.
针对珍稀濒危植物形态特征、分类等级、濒危系数、保护措施等知识不明确的问题,设计了文本融合轻量级双向转换编码表示模型(Albert)的知识抽取模型框架,实现批量抽取珍稀濒危植物知识,从而构建珍稀濒危植物知识图谱:1) 在现存一般性植物本体的基础上,采用自顶向下的方式构建珍稀濒危植物本体,得到5个体系,即物种分类体系、生长形态特征体系、命名体系、保护现状体系和生态习性体系;2) 采取Albert预训练模型来增强下游任务模型输入向量的珍稀濒危植物属性描述文本语义的表征能力;3) 利用BiLSTM–CRF模型和BiGRU–Attention模型分别实现命名实体识别和关系抽取。在珍稀濒危植物数据测试集上对模型的有效性进行验证,结果表明,命名实体识别模型和关系抽取模型的召回率和准确率的调和平均值(F1)值分别达到98.07%和93.76%,将得到的大量的实体和关系所形成的三元组存储在图数据库Neo4j中,完成珍稀濒危植物知识图谱的可视化展示。  相似文献   

17.
基于优化卷积神经网络的玉米螟虫害图像识别   总被引:2,自引:2,他引:2  
【目的】随着人工智能和大数据技术的不断发展,针对常规玉米虫害识别方法存在的准确率和效率低等问题,本文提出了一种基于改进GoogLeNet卷积神经网络模型的玉米螟虫害图像识别方法。【方法】首先通过迁移学习将GoogLeNet的Inception-v4网络结构知识转移到玉米螟Pyrausta nubilalis虫害识别的任务上,构建模型的训练方式;然后通过数据增强技术对玉米螟虫图像进行样本扩充,得到神经网络训练模型的数据集;同时利用Inception模块拥有多尺度卷积核提取多尺度玉米螟虫害分布特征的能力构建网络模型,并在试验过程中对激活函数、梯度下降算法等模型参数进行优化;最后引入批标准化(BN)操作加速优化模型网络训练,并将该模型运用到玉米螟虫害识别中。【结果】基于TensorFlow框架下的试验结果表明,优化后的神经网络算法对玉米螟虫害图像平均识别准确率达到了96.44%。【结论】基于优化的卷积神经网络识别模型具有更强的鲁棒性和适用性,可为玉米等农作物虫害识别、智能诊断提供参考。  相似文献   

18.
马铃薯表面缺陷检测是马铃薯分级的重要组成部分。传统的马铃薯表面缺陷检测方法通常涉及到手工特征提取和特征判断,但是马铃薯生长环境复杂,缺陷种类繁多,提取合适的特征是一个难题。为了解决上述问题,本试验提出一种基于改进的卷积神经网络(Convolution Neural Networks,CNN)和支持向量机(Support Vector Machine,SVM)模型的马铃薯表面缺陷检测新方法。该模型通过CNN自动提取马铃薯图片深度特征,利用特征向量训练SVM得到分类器。此外,改进的CNN中采用dropout正则化技术,能有效减小模型过拟合;加入1×1卷积层,加快模型运算时间。试验中,对CNN模型学习率和训练次数等超参数进行了对比选择,基于Adam优化算法通过GPU加速技术进行CNN模型训练;采用网格搜索算法对SVM参数进行优选。试验样本集由实验室机器视觉平台和数据增广方法所得图片组成。试验结果表明,本试验设计的CNN+SVM改进模型能解决现有研究中存在的问题,且性能优于常规CNN模型和传统检测方法,算法运行速度更快,准确率达99.20%。  相似文献   

19.
分析了几种典型的文本分类算法的特点,并基于中文文本数据集和英文文本数据集对算法性能进行了综合评价.实验结果表明:对于英文文本数据,支持向量机具有最优的性能,但时间开销最大,贝叶斯算法速度较快;对于中文文本数据,由于分词的困难,使得算法性能普遍低于同等规模下在英文数据集上的性能.几种算法性能均随训练集规模的增大而有改善.  相似文献   

20.
采集烤烟不同叶位烟叶图像并进行预处理,提取烟叶叶长、叶宽、面积、周长和最小外接矩形面积5个叶片绝对形态特征参数,计算狭长度、矩形度、圆形度、叶宽最大处占比、叶宽轴与质心夹角5个相对形态特征;通过主成分分析筛选出特征向量,构建基于K近邻算法(KNN)、逻辑回归(LR)、基于线性核函数和径向基核函数的支持向量机(SVM)和BP神经网络的烟叶部位识别模型,并对比5种模型的识别效果。结果表明:基于图像轮廓特征所提取的形态特征参数可以较为有效地反映烤烟部位特征;5种识别模型中,基于BP神经网络模型的识别效果最好,识别准确度为93.75%,训练集和测试集的模型决定系数均高于90%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号