首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 62 毫秒
1.
长距离输水工程线路长,沿线环境复杂,在输水工程日常运行过程中,工程安全巡检是维护生产安全的重要手段。在工程巡检中产生了大量的巡检文本数据。在传统生产管理过程中,巡检文本依赖于管理人员人工按照出现问题的严重程度进行分类,效率低下且容易出现主观性问题分类出错,不足以良好管理长线路,沿线环境复杂的输水工程。针对这一问题,提出一种结合双向长短期记忆神经网络(Bi-directional Long Short-Term Memory)和BERT神经网络的混合深度学习模型对巡检文本智能分类方法,模型使用BERT作为输入层将巡检文本转化为特征向量,再将结果输入到BiLSTM模型挖掘文本特征,实现巡检文本智能分类。以南水北调中线巡检文本为算例,实验结果表明:该模型与主流深度学习模型文本卷积神经网络(TextCNN),BERT,BiLSTM模型相比,准确率、召回率和F1值分别达到92.30%、92.32%、92.30%,模型性能优于其他深度学习模型。  相似文献   

2.
作物蒸腾量是指导作物灌溉关键参数之一,实时获取作物蒸腾量,实现按需灌溉是节约用水的有效途径。然而,温室内小气候效应显著,作物蒸腾与环境因子间关系较为复杂,且各环境因子之间相互关联并呈非线性变化。本文以番茄作为研究对象,使用称量法测量作物实时蒸腾量,通过布设传感器实时获取温室小气候数据,包括空气温度(Air temperature, AT)、相对湿度(Relative humidity, RH)、光照强度(Light intensity, LI)作为模型的小气候环境输入,冠层相对叶面积指数(Relative leaf area index,RLAI)作为模型的作物生长输入,在此基础上,提出了基于长短期记忆网络(Long short term memory, LSTM)的番茄蒸腾量预测模型。利用该模型对番茄蒸腾量进行预测,并与非线性自回归(Nonlinear autoregressive with exogeneous inputs, NARX)神经网络、Elman神经网络、循环神经网络(Recurrent neural network, RNN)模型进行了对比。试验结果表明,LSTM预测模型决定系数(Determination coefficient, R2)与平均绝对误差(Mean absolute error, MAE)分别为0.9925和4.53g,与NARX神经网络、Elman神经网络、RNN方法进行对比,其决定系数分别提高了8.97%、1.18%和0.82%,其平均绝对误差分别降低了8.16、6.23、0.52g。本研究所提的预测模型具有较高的预测精度及泛化性能,研究成果可为温室作物需水规律及需水量研究提供参考。  相似文献   

3.
为解决文本特征提取不准确和因网络层次加深而导致模型分类性能变差等问题,提出基于深度卷积神经网络的水稻知识文本分类方法.针对水稻知识文本的特点,采用Word2Vec方法进行文本向量化处理,并与One-Hot、TF-IDF和Hashing方法进行对比分析,得出Word2Vec方法具有较高的分类精度,正确率为86.44%,能...  相似文献   

4.
基于支持向量机的中文农业文本分类技术研究   总被引:1,自引:0,他引:1  
高效地组织、分类信息,是提供个性化农业信息推荐服务的基础。根据农业文本信息特点,提出了一种基于线性支持向量机(Support vector machine,SVM)的中文农业文本分类模型,首先构建农业行业分类关键词库,通过特征词选择和权重计算,构建分类器模型,实现信息的自动分类。实验选取了1 071个测试文档,并按照种植业、林业、畜牧业、渔业进行分类。结果表明,分类准确率为96.5%,召回率为96.4%。实验结果高于贝叶斯、决策树、KNN、SMO等分类算法,将该模型应用于农业物联网行业信息综合服务平台,运行结果表明,该方法能够实现中文农业文本信息的自动分类,响应时间满足系统要求。  相似文献   

5.
基于Spark框架XGBoost的林业文本并行分类方法研究   总被引:1,自引:0,他引:1  
针对当前互联网+技术与林业的交叉融合,涌现出海量待挖掘的涉林文本,而林业文本分类的相关研究尚不成熟的问题,使用网络爬虫技术面向互联网采集涉林文本,基于丰富的语料重新构建分类标签,提出基于Spark计算框架的XGBoost并行化方法,对林业文本进行分类。经由交叉验证,构建的XGBoost并行分类算法准确率为0. 923 4,在各类别中最低F1为0. 860 4,最高为0. 998 4;其在2. 1万条、4. 2万条、8. 4万条数据集上的训练加速比分别为2. 13、3. 47、3. 82。结果表明,基于该标签设定的分类模型对现存互联网中涉林文本的适应性较好;Spark环境下实现的XGBoost并行化算法的准确率显著优于其他4种机器学习(朴素贝叶斯、GBDT决策树、BP神经网络和ELM神经网络算法)的并行化算法,算法执行效率远高于单机版本,且数据量越大,其加速比越高,能有效应对海量林业文本的实时、准确分类。  相似文献   

6.
基于深度学习的降水预测是近年来水文研究的热点。月降水数据为典型的小样本数据,无法满足深度学习对大数据量的需求。为此,融合信号分解和边界修正的思想,提出一种改进的月降水长短期记忆网络(LSTM)预测方法。首先,针对序列分解的“端点效应”,采用波形特征匹配延拓法扩展原始序列边界。然后,利用极点对称模态分解(ESMD)和变分模态分解(VMD)对原始序列进行二次分解。ESMD提取月降水序列不同尺度信息,得到频率依次降低的几个模态分量及一个残余分量;切除各子序列中对内部数据“污染”最严重的扩展部分后,VMD进一步对高频分量进行平稳化处理。最后,对各子序列分别运用LSTM预测,预测结果重构后得到最终预测结果。选取湖北省巴东县的月降水量作为实例验证。通过模型对比分析,结果表明:相较于传统的单一SVM和LSTM模型,组合了信号分解算法的预测模型在月降水预测中更具优越性;将边界修正的方法融入到采用ESMD算法的组合模型,提高了整体模型的预测精度;高频分量的预测效果是决定组合模型预测精度高低的关键因素;提出的方法不但在选取的评价指标上均表现最佳,而且对数据极值点的拟合效果提升显著。特别地,即使面对小样本数...  相似文献   

7.
为了有效提高非平稳非线性径流序列的预测精度,采用具有自适应序列特征的时变滤波经验模态分解(TVF-EMD)与长短期记忆神经网络(LSTM)耦合,构成TVF-EMD-LSTM预测模型.首先利用TVF-EMD方法自适应地将径流序列分解为高频序列和低频序列;进而,利用LSTM神经网络对分解后的序列分别预测;最终,将预测结果加...  相似文献   

8.
针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectional encoder representation from transformers)预训练语言模型进行文本向量化表示;通过双向长短时记忆网络(Bidirectional long short-term memory network, BiLSTM)获取上下文语义特征;由条件随机场(Conditional random field, CRF)输出全局最优标签序列。基于此,在CRF层后加入畜禽疫病领域词典进行分词匹配修正,减少在分词过程中出现的疫病名称及短语等造成的歧义切分,进一步提高了分词准确率。实验结果表明,结合词典匹配的BERT-BiLSTM-CRF模型在羊常见疫病文本数据集上的F1值为96.38%,与jieba分词器、BiLSTM-Softmax模型、BiLSTM-CRF模型、未结合词典匹配的本文模型相比,分别提升11.01、1...  相似文献   

9.
构建日光温室环境预测模型,准确预测温室环境变化有助于精准调控作物生长环境,促进果蔬生长。而温室小气候环境数据多参数并存、耦合关系复杂,且具有时序性和非线性,难以建立准确的预测模型。针对以上问题,提出一种基于麻雀搜索算法(SSA)优化的长短期记忆网络(LSTM)温室环境预测模型,实现了温室环境数据的精准预测。实验结果表明,采用SSA自动进行参数选优的方式,解决了LSTM模型参数手动选择的难题,大幅缩短模型训练时间,且最优的网络参数能够发挥模型的最佳性能。对日光温室内空气温湿度、土壤温湿度、CO2浓度和光照强度6种环境参数进行预测,SSA-LSTM平均拟合指数高达97.6%,相比BP、门控循环单元(GRU)、LSTM,其预测拟合指数分别提升8.1、4.1、4.3个百分点,预测精度明显提升。  相似文献   

10.
基于Sentinel-1和Sentinel-2数据融合的农作物分类   总被引:5,自引:0,他引:5  
郭交  朱琳  靳标 《农业机械学报》2018,49(4):192-198
基于光学影像的遥感技术受云雨、昼夜影响较大,导致获取连续的作物时序生长曲线较困难,而雷达影像作为主动式成像,能够很好地克服这一缺陷。本文以陕西省渭南市大荔县某农场为研究区域,分别采用最大似然法(Maximum likelihood,ML)和支持向量机(Support vector machine,SVM)2种方法,融合Sentinel-1雷达影像和Sentinel-2光学影像,提高农作物的分类精度。研究结果表明,融合数据的农作物分类精度相比光学数据分类精度有所提高。在无云层覆盖的情况下,利用SVM方法融合Sentinel-2的红、绿、蓝、近红外4个波段数据与Sentinel-1数据,总体分类精度提高了2个百分点,Kappa系数提高了5个百分点;在有少量云层覆盖情况下,利用ML处理融合数据的分类结果精度和Kappa系数分别提高2个百分点和4个百分点,SVM方法下的分类精度提高了6个百分点,Kappa系数提高了8个百分点。  相似文献   

11.
“中国农技推广APP”农业问答社区存在提问数据量大、规范性差、涉及面广、噪声多、特征稀疏等影响文本语义匹配的问题,为了改善农业提问数据相似性判断的性能,提出了融合多语义特征的文本匹配模型Co_BiLSTM_CNN,从深度语义、词语共现、最大匹配度3个层面提取短文本特征,并利用共享参数的孪生网络结构,分别运用双向长短期记忆网络、卷积神经网络和密集连接网络构建文本匹配模型。试验结果表明,该模型可以更全面提取文本特征,文本相似性判断的正确率达94.15%,与其他6种模型相比,文本匹配效果优势明显。  相似文献   

12.
为提高径流预测精度,研究提出海洋捕食者算法(MPA)与长短期记忆(LSTM)神经网络相结合的径流预测方法.通过6个仿真函数对MPA、粒子群优化(PSO)算法进行测试,利用MPA优化LSTM隐藏层神经元数、训练次数等关键参数,基于主成分分析(PCA)降维和不降维处理分别建立PCA-MPA-LSTM、MPA-LSTM径流预...  相似文献   

13.
热词提取对于监控和分析农业舆情具有重要意义,目前已有一定研究基础,但仍存在针对性差等问题,无法满足农业领域不同产业用户群的个性化需求,为此,提出一种基于农业网络信息分类的热词自动提取方法。首先采用多标记分类算法对文本语料进行分类,按分类类别构建语料库,然后采用基于信息熵的方法对每个类别分别提取热词候选词,最后采用基于时间变化的方法进行候选词热度计算,根据候选词热度排序结果得到热词。本文抽取农业网站上的15 354条文本进行实验,结果表明,热词提取准确率达到0.9以上,能够较高质量地提取农业热词,为不同农业用户群体发现和分析产业热点提供帮助。  相似文献   

14.
针对目前冷链储运环境状态仅通过当前环境监测数据进行判断,未能对环境变化趋势做出预判,无法很好地满足冷链储运环境性能评估的需求,提出了一种基于K中心点算法(K-medoids)和长短时记忆网络(LSTM)相结合的冷藏车厢温湿度多步预测方法。将冷藏车厢内历史温湿度数据、采集节点分布特征按照时间序列作为输入,采用K-medoids对其进行数据融合,然后将融合后的数据按照时间序列输入LSTM网络进行温湿度预测。将该预测方法应用于舟山兴业集团的冷藏车内进行温湿度预测验证。试验结果表明:该预测方法对于冷藏车厢内温度预测的均方根误差、平均绝对误差、平均绝对百分比误差分别为0.343 8℃、0.273 0℃、1.51%;对于冷藏车厢内相对湿度均方根误差、平均绝对误差、平均绝对百分比误差分别为2.561 9%、1.995 6%、3.53%,相比于BP神经网络等其他浅层模型,该模型具有较好的预测精度和泛化能力,能够满足冷链储运环境预测的实际需求,可为冷链运输环境精细化管理和调控提供策略支持。  相似文献   

15.
当前电池健康状态估算与预测在处理大量电池数据、时间间隔较长存在一定缺陷。长短期记忆神经网络算法在解决该问题时效果明显。在完成电池循环充放电实验基础之上,分析和提取电池放电过程中外部信号变化的特征指标,以电池放电数据中放电容量、放电时间、循环次数训练并建立了长短期记忆神经网络预测模型,采用3种不同的自适应学习率优化算法对学习训练部分进行优化,最后对比分析模型预测的准确程度。结果表明,长短期记忆神经网络估算电池健康状态的误差小于5%,证明预测模型的有效性。  相似文献   

16.
基于多时相Sentinel-2A的县域农作物分类   总被引:1,自引:0,他引:1  
利用遥感技术精准地获取区域农作物种植结构数据,对指导农业生产、制定农业政策具有重要意义。以景泰县为研究区,以多时相Sentinel-2A遥感影像为数据源,计算时序归一化植被指数(Normalized difference vegetation index,NDVI)和红边归一化植被指数(Red edge normalized vegetation index,RENDVI)及其组合特征(NDVI+RENDVI、NDVI-RENDVI和NDVIRENDVI),分析作物特征曲线,并采用随机森林法分别以5种特征参数作为分类特征对研究区农作物进行精细分类。结果表明:根据形态特征,研究区农作物特征值曲线可划分为3种类型:高值型(玉米、水稻、胡麻和马铃薯)、低值型(洋葱、大棚作物和砂田瓜果)和开口型(春小麦、春小麦-秋油葵)。高值型和低值型可在7、8月影像中区分,开口型和前两种类型在5月和9月影像上的特征值有明显差异。3种类型内的作物可以通过不同时相影像区分,高值型的4种作物在9月影像上通过成熟期差异可以区分;低值型的3种作物的特征值差异在全年影像上都可以明显体现;开口型的两种作物利用9月影像可以明显区分。利用NDVI、RENDVI、NDVI+RENDVI、NDVI-RENDVI和NDVIRENDVI 5种特征分类的总体精度分别为82. 14%、78. 16%、81. 17%、75. 64%和86. 20%,Kappa系数分别为0. 78、0. 74、0. 77、0. 71和0. 83,总体精度和Kappa系数由大到小依次为NDVIRENDVI、NDVI、NDVI+RENDVI、RENDVI、NDVI-RENDVI,说明RENDVI辅助NDVI可以有效提高分类精度(精度较仅用NDVI提高4. 06个百分点)。选择合适的时期和分类特征,利用Sentinel-2A特有的红边波段数据及其较高的空间分辨率在县域农作物精细分类上具有较好的精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号