首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 943 毫秒
1.
针对大数据背景下地理标志大米产地真伪鉴别的算法模型与实现技术,以大米中矿物质元素含量数据为基础,运用Hadoop分布式集群技术,构建了基于MapReduce的并行化随机森林、支持向量机、人工神经网络与线性判别分析算法模型.结果表明,并行化随机森林模型的判别准确率为97.55%,与相同条件下并行化构建的支持向量机、人工神经网络与线性判别分析模型相比具有更好的产地判别精度,同时依托并行化随机森林模型构建的云平台能获取到较好加速比,不仅能够实现对未知地区大米数据进行准确的产地鉴别,而且能够通过提升数据量或计算节点数,更高效地处理大规模数据.  相似文献   

2.
为满足快速无损的大米产地确证需求,采集吉林省梅河口市水稻主产区及松原、大安、辉南等其他水稻产区共990个大米样本的高光谱图像(400~1 000 nm)作为研究对象,利用多元散射校正(MSC)处理方法对光谱进行预处理。采用多层感知机(MLP)、极限学习机(ELM)与在线序列极限学习机(OS-ELM)算法,分别基于全波段高光谱数据以及经多维尺度分析(MDS)方法降维后的数据建立产地确证模型。结果表明,基于全波段高光谱数据的OS-ELM模型分类性能最好,准确率达到98.3%。经MDS处理后,输入的数据变量减少了96.6%,MDS-OS-ELM模型准确率稳定在97.4%。对三种模型的训练时间进行对比分析,OS-ELM训练时间明显优于MLP,在分批次获取数据时训练时间优于ELM。为大米产地确证提供了一种高效、准确、稳定的方法。  相似文献   

3.
为满足快速无损的大米产地确证需求,采集吉林省梅河口市水稻主产区及松原、大安、辉南等其他水稻产区共990个大米样本的高光谱图像(400~1 000 nm)作为研究对象,利用多元散射校正(MSC)处理方法对光谱进行预处理。采用多层感知机(MLP)、极限学习机(ELM)与在线序列极限学习机(OS-ELM)算法,分别基于全波段高光谱数据以及经多维尺度分析(MDS)方法降维后的数据建立产地确证模型。结果表明,基于全波段高光谱数据的OS-ELM模型分类性能最好,准确率达到98.3%。经MDS处理后,输入的数据变量减少了96.6%,MDS-OS-ELM模型准确率稳定在97.4%。对三种模型的训练时间进行对比分析,OS-ELM训练时间明显优于MLP,在分批次获取数据时训练时间优于ELM。为大米产地确证提供了一种高效、准确、稳定的方法。  相似文献   

4.
为探讨梅河大米产地确证因子与产地环境之间的关系,以梅河大米及其对应根际稻土矿物元素含量和产地环境因子为对象,采用方差分析、相关分析、冗余分析法(RDA),对梅河大米矿物元素含量与根际稻土、环境因子之间的空间关系进行分析.结果表明:根际稻土矿物元素与环境因子密切相关,产地环境的纬度、经度、土壤酸碱度、有机质和年均温度对土...  相似文献   

5.
【目的】对不同品种的茶叶进行区分和产地溯源,同时为其他植物分类提供参考依据。【方法】以简单重复序列标记(Simple sequence repeat,SSR)为基础,运用生物信息学的研究方法,对来自湖南、云南、福建和浙江省的 313 个茶叶样本的来源属地及 10 个外类群关系进行研究:首先,筛选出高质量的 54 个 SSR 位点,通过主成分分析(Principal compon ent analysis,PCA),构建进化树,分析各省间茶叶样本的差异度;其次,通过比较线性回归模型、随机森林模型和深度神经网络(Deep neural network,DNN)模型的分类准确度,选择准确度最高的神经网络模型进行溯源模型构建及优化。【结果】4 个省的茶叶样本个体相对聚集,其中云南省的样本个体较其他省份差异大;福建、浙江、湖南的样本分别聚集,表明福建、浙江、湖南三省间茶叶差异显著,但有少量交叉,具有一定的相似遗传结构特性,亲缘关系较近。利用 3 种不同的模型对 54 个 SSR 分子标记矩阵构建模型,初步鉴定出线性回归模型准确率为 81%,随机森林模型准确率为 77%,而 DNN 模型准确率最高、为86%,由此可得出 DNN 模型对茶叶的分类效果最好。随后利用 54 个 SSR 分子标记和 323 个样本构建预测模型,并对一次训练的样本个数(Batch size)、训练的次数(Step size)、隐藏层层数及每层节点数进行优化,发现这 4 个参数的优化结果当样本个数为 150、训练次数为 20 000、隐藏层层数为 2 层时验证集和测试集的准确率最高、约 95%,即 2 层神经网络对茶叶分析效果最佳。【结论】基于深度神经网络的 SSR 分子标记为茶叶分类、产地溯源研究和茶叶育种等方面提供支持依据,构建的分类模型也可用于其他物种重测序数据的属地来源鉴定。  相似文献   

6.
对江苏、辽宁、湖北、黑龙江4个省份的169个大米样品,利用波数测定范围为10 000~4 000 cm~(-1)的Thermo AntarisⅡ傅里叶变换近红外分析仪,采用化学计量学模式识别主成分分析(PCA)和线性判别分析(LDA)方法进行产地溯源分析。结果表明,PCA方法基于前2个主成分可基本区分大米产地,但各类样品有部分重叠;采用PCA-LDA法可更有效区分大米产地,利用蒙特卡罗模拟方法随机重复选取训练集和预测集判别4个省份的大米产地准确率在93.00%以上,识别准确率相对较高。因此,化学计量学模式识别方法结合红外光谱用于大米产地溯源分析具有一定的可行性和应用价值。  相似文献   

7.
水稻品种对大米产地溯源判别正确性的影响   总被引:1,自引:0,他引:1  
为提高大米产地溯源判别的正确性,试验研究了水稻品种对于大米产地溯源判别正确性的影响。利用原子吸收分光光度法(AAS)检测来自吉林省松原市、德惠市、梅河口市3个产地的3个水稻品种120个样品中11种矿物元素(Pb,Cd,K,Na,Ca,Mg,Zn,Cu,Fe,Mn,Cr)的含量,对大米中矿物元素数据进行差异分析、雷达分析和线性判别分析。结果显示:元素Cd、Cr、Fe、K、Mg、Zn、Pb在大米品种与产地间均存在相对较大的差异。德惠(同一产地)不同品种大米的判别正确率为100%,成功利用不同品种大米中矿物元素含量将大米品种进行正确分类。进行大米产地判别时,3个产地不同品种大米的判别分析正确率为90%,3个产地同一品种大米的产地判别分析正确率为100%,证明了水稻品种对于大米产地溯源判别正确性有影响。  相似文献   

8.
加强云贵川区域林火管理,预测云贵川地区森林火灾的发生概率,对保护森林资源和森林生态系统结构和功能具有重要意义。利用MCD64A1火灾数据集、气象数据、地形数据和可燃物含水率数据构建模型训练数据集,结合逻辑回归、随机森林与极端梯度提升等机器学习模型,对中国云贵川区域日尺度林火燃烧概率进行预测。结果表明:单独使用气象数据集对林火燃烧概率进行预测时,极端梯度提升模型表现最好,预测精度为88.6%,其次为随机森林模型与逻辑回归模型,预测精度分别为86.0%与76.7%。地形因素及植被水分指数的引入对机器学习模型有一定的优化效果,极端梯度提升模型与随机森林模型的预测精度的提升均超过1%。  相似文献   

9.
大米中矿物元素种类多(38种),为了快速、准确地筛选出判别大米产地的有效指标,在分析大米矿物元素含量相关性的基础上,进行了大米产地判别分类算法对比实验。首先通过R型聚类方法将大米矿物元素样本进行分块,然后从每一类中选取数据再进行Fisher与KNN判别分类对比,这样可以改进传统算法中剪辑样本带来的判别误差,又大大降低了无效的计算量。实验表明,基于聚类选出一种元素最优组合方案,采用23种矿物元素进行Fisher判别的分类率达86.76%,此方法准确高效地降低了计算机的运算量,提高了判别分类速度。  相似文献   

10.
黄硬皮马勃(Scleroderma flavidum Ell.et EV.)主要生长在我国南方地区,有食用和药用价值。利用红外技术对其进行产地鉴别,为黄硬皮马勃的资源鉴别提供基础分析方法和理论依据。利用傅里叶变换红外光谱(Fourier transform infrared spectroscopy,FTIR)仪采集4个不同产地共40个黄硬皮马勃样本的红外光谱,每个样本平行扫描3次,取平均值。随机选择12个样本作为验证集,其余作为校正集,采用1 800~500 cm-1波段的光谱数据,对比多种预处理方法,选择最佳预处理方法建立模型并进行判别分析(discriminant analysis,DA)。结果表明,预处理方法 ND(7∶3)+SD+MSC(ND为诺里斯导数平滑,SD为二阶导数,MSC为多元散射校正)构建的判别模型性能最佳,验证集样本的分类准确率和校正集样本的回判准确率均达到100%,模型鉴别效果良好,可靠性高。傅里叶变换红外光谱法结合判别分析,能有效鉴别不同产地黄硬皮马勃。  相似文献   

11.
食品产地溯源及确证技术研究和应用方法探析   总被引:4,自引:0,他引:4  
食品产地溯源和确证是食品安全监管的重要内容,也是地域或特色食品产业可持续发展的重要保障。本文旨在探析食品产地溯源及确证技术原理和方法,推动食品溯源及确证技术支撑体系的研究与应用。作者通过对食品产地溯源及确证技术原理和应用分析,总结出食品产地溯源及确证技术研究和应用的基本思路、步骤和方法。食品产地溯源及确证技术的基本研究思路为:分析表征地域差异的特性、建立判别模型、验证判别模型、建立数据库、判别和举证分析;应用的基本方法为化学成分分析和多元数理统计方法,如方差分析、多重比较分析、聚类分析、主成分分析、判别分析等化学计量学方法。食品产地溯源及确证技术是基于能够表征食品地域特征的化学分析方法和多元数理统计方法建立的一套甄别食品地域来源的技术体系。  相似文献   

12.
【目的】探索建立具有空间相邻约束的森林收获调整模型的方法,为制定乡村集体林的采伐规划、实现森林资源的可持续利用提供方法和依据。【方法】以福建省永安市洪田村的杉木用材林为研究对象,利用森林资源档案数据,将空间相邻约束纳入到森林采伐作业中,运用混合整数规划方法,构建村级森林收获调整的空间优化模型。【结果】在未来10年内,洪田村杉木用材林的最大允许采伐量为8 623.5m3;根据最优可行解可以确定各小班的采伐决策和具体地点,有效阻止采伐相邻斑块,保证利用成熟林、过熟林而避免采伐未成熟林;2个分期的木材收获量分别为4 106.5和4 517m3,实现了木材的均衡生产。【结论】村级森林收获调整的空间优化模型在保证最优采伐量的同时,有效保护了当地生态环境,促进了森林保护与利用的良性循环。  相似文献   

13.
【目的】建立基于现代智能方法的洪水危险性评价模型,进一步提高评价精度,为制定区域防洪规划、实现洪水资源安全利用提供决策依据。【方法】鉴于可变模糊识别模型相对差异度函数构造困难、计算量大的不足,利用集对分析方法直接构造可变模糊识别模型相对差异度函数,进而通过确定指标权重,将洪水样本不同指标相对差异度综合为样本隶属度,建立基于集对分析的洪水危险性评价可变模糊识别模型,并将其应用于长江下游南京站历史洪水样本的等级评价中,实现对不同洪水样本危险等级的分类排序。【结果】实例应用表明,采用基于集对分析的洪水危险性评价可变模糊识别模型确定的洪水样本危险等级差异明显、分辨率高,与投影寻踪方法确定的洪水分类结果基本一致,有效避免了模型参数取值的主观随意性给评价结果带来的不确定性。【结论】基于集对分析的洪水危险性评价可变模糊识别模型计算过程简便、可行,结果稳健、可靠,在缺乏标准评价等级资料的复杂系统综合评价问题中具有一定的推广应用价值。  相似文献   

14.
森林火灾可燃物蓄积量的提取为森林火灾蔓延模型提供了定量的森林火灾可燃物信息。利用遥感影像对森林火灾可燃物的分类结果,采用多元回归法、参数优化的神经网络法和支持向量机法建立森林火灾可燃物蓄积量模型。研究了遥感影像的数据处理、建模方法对森林火灾可燃物蓄积量模型精度的影响。利用最优的森林火灾可燃物蓄积量模型,进行整个研究区域的森林火灾可燃物蓄积量反演。结果表明,数据处理后的遥感影像,采用支持向量机法建立的模型精度较高。  相似文献   

15.
以81份来自西双版纳、普洱市、临沧市3个不同产地的普洱茶样本为研究对象,其中校正集54份,验证集27份,利用近红外光谱采集单个普洱茶样本在1 100~2 498 nm的光谱数据,分别采用主成分聚类分析法和判别分析法建立普洱茶产地识别定性分析模型。结果表明,2种分析模型的校正集正确识别率均大于90%,可用于普洱茶产地的识别。其中,基于判别分析方法建立的判别分析模型效果更好,其校正集和验证集的识别正确率达到98.15%和100%,更适用于普洱茶产地的识别。应用近红外光谱技术可快速、无损识别普洱茶产地,为普洱茶产地检测提供参考。  相似文献   

16.
为了保护黑龙江大米原产地,开发大米产地溯源技术。以产自黑龙江不同地区的大米为研究对象,利用电子鼻对大米蒸煮前后挥发性物质进行检测。通过主成分分析和线性判别分析,进行产地溯源和品种鉴别。结果表明,线性判别分析优于主成分分析,利用电子鼻产地溯源技术结合线性判别分析对黑龙江大米产地溯源是可行的。结合线性判别分析分别构建查哈阳、建三江和五常大米产地溯源模型,得到精米样品产地正确判别率分别为80%、70%、100%,而蒸煮后大米样品的产地正确判别率均为100%,说明大米经过蒸煮预处理,挥发性成分被充分释放,放大了电子鼻传感器感应信号,有效提高了电子鼻产地溯源判别率,为电子鼻产地溯源技术体系构建提供理论基础。  相似文献   

17.
【目的】中国柑橘产区分布广、生态类型复杂,不同产地纽荷尔脐橙果实品质和市场效应具有较大差异。研究基于近红外光谱技术的柑橘产地识别技术,利于不同柑橘产地果品的识别和鉴伪。【方法】从中国南方17个纽荷尔脐橙主要产地选择代表性成年果园,分别采摘成熟鲜果样品100个。利用SupNIR-1500近红外分析仪采集脐橙果实赤道部、肩部表面以及果汁滤液的近红外反射光谱,光谱波长范围为1 000-2 499 nm。采用主成分分析法对原始光谱数据进行预处理,提取近红外光谱的特征信息以降低数据集维度以及噪声。研究人工神经网络理论,构建由一个输入层、一个具有非线性激励函数的隐藏层和一个输出层组成的典型的3层人工神经网络识别模型。研究由径向基函数作为核函数、以光谱主成分作为输入的支持向量机模型,构建由126个分类器组成的一对一扩展支持向量机模型。研究遗传算法优异的自然选择特性,利用遗传算法从光谱主成分中选择出最优的特征基因子集作为支持向量机的输入,构建遗传算法-支持向量机模型。利用3种模型分别对果汁滤液的近红外反射光谱数据进行分类,从而实现产地识别测试,并根据产地识别精度筛选出最优的产地识别模型。进一步对比该最优识别模型对果实赤道部、肩部反射光谱数据的识别精度,从而确定识别精度最高的光谱数据采集源。【结果】利用所建立的3层人工神经网络模型对纽荷尔脐橙果汁滤液的近红外光谱进行产地识别测试,确定当输入神经元数量为11、隐藏神经元数量为13时,模型对果实产地识别的最佳精度达81.45%。采用一对一扩展方式建立支持向量机产地识别模型,研究确定采用径向基函数作为核函数,当主成分数量为20时,脐橙产地识别精度最高可达86.98%。测试利用遗传算法-支持向量机混合模型进行脐橙产地分类识别,确定当种群数量为200、遗传代数为100、交叉概率0.7、突变概率0.01时,遗传算法选择出最优的基因子集进行产地识别,遗传算法-支持向量机模型的产地识别精度最高可达89.72%,优于人工神经网络分类模型和支持向量机分类模型的产地识别精度。进一步利用遗传算法-支持向量机产地识别模型对果实赤道部及肩部的果面反射光谱进行产地识别测试,得到对应的最高识别精度分别为80.00%和69.00%。【结论】遗传算法-支持向量机模型对果汁反射近红外光谱进行产地识别精度最高,优于人工神经网络模型和支持向量机模型。该模型对果实赤道部反射光谱进行分类的精度次于果汁滤液反射光谱但优于果实肩部反射光谱,因此,可利用赤道部的反射光谱实现非破坏性果实产地分类识别。  相似文献   

18.
针对现在市场上常见的两种大米掺伪现象,利用近红外光谱技术结合化学计量学方法分别建立了大米中掺入低档米和掺入矿物油的定量分析模型。制配不同掺伪比例的大米样品,采集其近红外光谱,并选用标准正态变量变换、最大最小归一化、平滑和一阶导数4种方法对原始光谱进行预处理,分别结合偏最小二乘法建立PLS定量分析模型。通过对比建模结果选出的最优预处理方法是最大最小归一化,建立的掺低档米模型的校正集和预测集相关系数分别为0.9698和0.9845,均方根误差分别为8.66和6.46;掺矿物油米模型的校正集和预测集相关系数分别为0.9739和0.9888,均方根误差分别为0.106和0.0698。模型的预测精度和稳定性均很好,实现了对两种掺伪大米快速、准确的定量判别,为大米的品质监控提供了一种新的方法思路。  相似文献   

19.
为了解决烟叶外观质量检验和烟叶品质等级评估中主观因素影响过大的问题,首次采用模型集群分析-随机森林方法(MPA-RF)结合近红外光谱建立的烟叶采收成熟度和烤后烟叶等级划分判别模型对烟叶进行了品质分类。结果表明:MPA-RF模型对采收成熟度烟叶样本(数据集A)和不同等级烟叶样本(数据集B)的训练集分类精度分别为96.67%、99.02%,预测模型分类精度分别为100%、96.15%;MPA-RF模型对烟叶的分类准确率明显高于常用的PCA、SVM和RF分类方法。  相似文献   

20.
为了解决烟叶外观质量检验和烟叶品质等级评估中主观因素影响过大的问题,首次采用模型集群分析-随机森林方法(MPA-RF)结合近红外光谱建立的烟叶采收成熟度和烤后烟叶等级划分判别模型对烟叶进行了品质分类。结果表明:MPA-RF模型对采收成熟度烟叶样本(数据集A)和不同等级烟叶样本(数据集B)的训练集分类精度分别为96.67%、99.02%,预测模型分类精度分别为100%、96.15%;MPA-RF模型对烟叶的分类准确率明显高于常用的PCA、SVM和RF分类方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号