共查询到18条相似文献,搜索用时 187 毫秒
1.
《信阳农业高等专科学校学报》2021,(1):121-126
针对传统支持向量机(support vector machine,SVM)对时间序列数据分类,仅通过样本在空间中的几何距离判别样本的类别,提出了一种基于改进核函数的支持向量机算法(SVM_IK,SVM with improved kernel function)。该算法计算样本与空间基数据的时间序列互相关距离,将样本数据映射到新的特征空间中,实现对线性核函数改进,最终根据改进的线性核函数SVM算法对样本数据进行分类。算法通过25组UCR数据集的验证,实验结果显示与1-NN算法和传统SVM算法相比,SVM_IK算法对时间序列数据具有较好的分类效果。 相似文献
2.
分别利用参数模型和无参数估计法预测南海陆坡沉积物柱MD05-2896中的细菌丰度.基于非培养的PCR-RFLP的16SrRNA基因分子技术,扩增了沉积物柱中的细菌16S rRNA基因序列,并构建16S rRNA基因文库.系统发育分析表明16S rRNA基因文库中,大多数序列属于17个已知的“门”.分别以99%、97%、90%和80%序列一致性作为分类单元分界点,将16SrRNA基因序列组群为分类单元.使用逆高斯分布模型、对数正态分布模型、负二项式分布模型、帕雷托分布模型、双指数分布模型以及ACE、ACE-1等估计方法预测不同分类单元分类水平下的细菌丰度.结果表明在“种”级分类水平上,负二项式分布为最优估计模型,估计细菌丰度为244±10(SE).不过,受实验条件的限制,该估计值可能偏低. 相似文献
3.
基于支持向量机和神经网络的土壤水力学参数预测效果比较 总被引:2,自引:0,他引:2
在美国土壤水分物理性质数据库(UNSODA 2.0)的基础上,考虑土壤质地不分类和分类2种情况,分别构建了基于支持向量回归机(SVR)的土壤传递函数模型,比较了在土壤质地不分类和分类情况下预测土壤水力学参数(水分特征曲线和饱和导水率)的效果,并与建立在相同数据库上的基于神经网络的Rosetta模型的预测效果进行了比较.结果表明:土壤质地不分类的情况下,输入参数越多,基于SVR模型的预测效果越好;土壤质地分类情况下,基于SVM分类建模的预测结果普遍好于不分类情况.无论土壤质地是否分类,样本和输入参数相同的条件下,基于SVR的模型预测的效果都优于Rosetta模型. 相似文献
4.
5.
6.
从分类算法和特征基因选择两个方面研究基因表达数据的分类,将传统的Support Vector Machines(SVM)算法和K-nearest neighbor(KNN)算法两者结合成为一种应用于基因表达数据分类的算法,并针对基因表达数据分类数据集“样本少,维数高”的特点,提出了一种改进的基于相关性的递归特征消除算法(简称为C-RFE),消除了数据冗余.实验结果表明,新方法可有效提高分类准确率和特征选取的效率. 相似文献
7.
[目的]快速鉴别不同品种的薰衣草精油,为精油品质控制提供可靠的科学方法依据.[方法]通过气相色谱质谱(GC-MS)测定三个品种共66个薰衣草精油样品,应用峰面积归一法确定各成分的相对含量.对构建的特征信息数据进行主成分分析(PCA),选取7个主成分代替原始数据,再利用支持向量机技术进行分类和预测,对不同品种的薰衣草精油进行鉴别.[结果]通过48个样本建立支持向量机的分类模型,对18个样本进行预测,对训练集样本的训练正确率达到97.92;,对预测集样本的正确识别率达到94.44;.[结论]主成分分析结合支持向量机方法具有很好的分类和鉴别作用,可作为薰衣草精油品种区分的有效方法之一,为薰衣草精油的质量控制提供了一定的科学依据. 相似文献
8.
采用机器学习中的支持向量机(SVM)方法,建立以适应区域尺度生产指导为目的的水稻发育期预测模型。通过整合水稻发育期数据和气象数据,构建训练集与测试集,并应用SVM算法建立针对5个不同发育阶段,应用2种不同样本构建方法的10个发育期预测模型。对其逐一进行评估,最终挑选出具有最佳预测效果的模型作为研究成果。结果表明:采用第1类样本(提前150d的样本)生成策略的5个发育期模型,其预测精度均大于80%,甚至达到95%的水平;而采用第2类样本(提前30d的样本)生成策略的5个发育期模型,其精度普遍在80%左右。与此同时,对这2种样本构建方法分别进行了敏感性及假阳性比较。结果表明:虽前者敏感性高于后者,但其假阳性也高,预测误差在9d左右,而第2类样本的预测误差则能控制在4~5d内,更符合模型构建的要求。采用第2类样本生成策略进行发育期模型的研究可获得更准确的预测结果。 相似文献
9.
基于多种植被指数时间序列与机器学习的作物遥感分类研究 总被引:1,自引:0,他引:1
《江苏农业科学》2017,(16)
开展了基于多种植被指数(vegetation index,VI)时间序列和机器学习(machine learning,ML)算法的作物遥感分类研究。从Landsat-8 OLI与EO-1 ALI影像中提取了内蒙古五原县的时间序列数据。2颗卫星的参数类似,且它们联合提供了更多无云覆盖的数据。7种常用的VI从时间序列遥感数据中提取出来,以用作ML算法的输入。对比分析了SVM、RF、DT 3种ML算法对玉米、向日葵和小麦的区分效果。共选取了2 584个样本,其中1 556个样本用于算法训练。得到了127种VI组合作为输入时3种算法的分类精度。结果表明,SVM的分类效果优于另外2种算法;VI数目并非越多越好,综合考虑算法的精度和稳定性,3种VI可以取得最佳的效果;SVM+NDI5+NDVI+TVI是平均分类精度最高的组合,平均精度为91.97%。 相似文献
10.
应用近红外光谱和小波网络构建的木材基本密度预测模型 总被引:1,自引:0,他引:1
以柞木为研究对象,将120个样本以2∶1的比例分为校正集和预测集,80个校正集,40个预测集;使用900~1 700 nm的近红外光谱仪,获取样本径切面的近红外光谱数据;采用蒙特卡洛采样法剔除奇异样本,采用多元散射校正和S-G平滑对光谱数据进行预处理,消除光谱漂移、表面散射和噪声的影响;通过Bi PLS-SPA算法对特征波长进行提取,构建小波神经网络模型,预测柞木基本密度;将建模方法与常用的偏最小二乘(PLS)和BP神经网络进行了对比,验证小波网络的有效性。结果表明:小波神经网络对预测集样本验证结果更好,相关系数为0.968,预测均方根误差为0.014 4。 相似文献
11.
人类基因启动子识别是医学研究的基本需要。提取DNA序列碱基的PZ曲线特征、二核苷酸空间结构特征、保守信号似然得分,以及K联体似然得分,结合GC含量变化和非均匀指数,构建基于粒子群优化的支持向量机算法来识别人类基因启动子。利用粒子群优化支持向量机参数进行优化避免了人为选择的随机性,并且在分类问题中表现出较好的稳健性。对测试集的10-折交叉检验结果为:敏感性为92%,特异性为91%,马修斯关联系数为0.83。该结果表明,基于粒子群优化的支持向量机算法能有效识别启动子序列。 相似文献
12.
针对SVM法线特征筛选算法仅考虑法线对特征筛选的贡献,而忽略了特征分布对特征筛选的贡献的不足,在对SVM法线算法进行分析的基础上,基于特征在正、负例中出现概率的不同提出了加权SVM法线算法,该算法考虑到了法线和特征的分布。通过试验可以看出,在使用较小的特征空间时,与SVM法线算法和信息增益算法相比,加权SVM法线算法具有更好的特征筛选性能。 相似文献
13.
[目的]研究木材纤维饱和点近区段含水率预测模型。[方法]电阻法测量木材纤维饱和点近区段含水率会出现测量值突然偏离真值的现象,即出现测量“盲点”。在研究检测原理的基础上,提出利用支持向量机方法对已测木材含水率、温度和湿度数据进行训练建模,通过模型预测得出纤维饱和点近区段含水率数值。[结果]支持向量机方法建立的模型能够预测木材纤维饱和点近区段含水率数值,模型泛化能力强,预测精度高,而且只需要少量样本数据就可以实现预测,很好地解决了电阻法在测量过程中的“盲点”问题。[结论]支持向量机预测模型提高了木材干燥过程中全量程含水率的检测精度,对木材干燥过程的含水率建模具有一定研究意义。 相似文献
14.
使用竹片图像实现竹片缺陷自动识别,目前深度学习可以有效地解决该类问题,但是必须使用大量样本数据做训练才能获得较高的识别准确率。当图像数量有限时,利用基于迁移学习的方法,把经过预训练的卷积神经网络模型进行迁移,即共享卷积层和池化层的权重参数,调整新网络模型的超参数,并建立一个包含4种共计6 360张竹片缺陷图像的数据库,把图片分成4种训练集测试集形式,即80%训练、20%测试;60%训练、40%测试;40%训练、60%测试;20%训练、80%测试,分别利用支持向量机SVM分类方法、深度学习方法和迁移学习方法进行训练和测试,并将这3种方法作对比。最后,通过构建竹片缺陷识别的混淆矩阵对迁移学习进行具体分析与说明。结果表明,按照80%训练、20%测试的识别准确率最高,通过迁移学习得到的竹片缺陷最高识别精度分别达到98.97%,比普通深度学习提高了11.55% ,比SVM分类方法提高了13.04%。说明迁移学习比普通深度学习和传统支持向量机SVM分类方法更适合用于小样本数据集的分类识别,并且效果优于普通深度学习和 SVM 分类方法。 相似文献
15.
为探索应用近红外光谱技术检测玉米单籽粒蛋白质含量,本研究采用JDSU近红外光谱检测仪采集了205份不同基因型玉米材料的单籽粒光谱值,用常规化学法测定玉米单籽粒蛋白质含量化学值,以117个样本为建模集,拟合了玉米单籽粒近红外光谱仪扫描得到的光谱图与玉米单籽粒蛋白质含量化学值之间的相互关系,用88个样本作预测集,比较了偏最小二乘回归法(PLSR)和支持向量机回归法(SVR)2种预测模型的效果。结果表明,玉米单籽粒种子的蛋白质含量在样本中变异范围为3.48%~18.15%,平均值为10.17%。偏最小二乘回归法(PLSR)和支持向量机回归法(SVR)所建的模型预测效果基本相同,其决定系数(R2)分别为0.99和0.99,校正标准差(SEC)分别为0.32和0.32,预测标准差(SEP)分别为0.46和0.46,相对预测标准差(RSEP)分别为4.61和4.60,RPD分别为6.106和6.111。上述参数表明PLSR和SVR所建立的模型预测效果都比较好,预测值基本接近参比值,便携式JDSU近红外光谱检测仪可以应用于定量分析玉米单籽粒蛋白质含量。 相似文献
16.
17.
基于BP神经网络和支持向量机的杉木人工林收获模型研究 总被引:3,自引:2,他引:1
以闽西北杉木人工林为研究对象,选取涵盖中龄林、近熟林、成熟林3个龄组的700个小班作为样地进行调查,以林龄、地位指数、林分密度、平均胸径作为输入变量,单位蓄积量为输出变量,运用BP神经网络和支持向量机2种机器学习方法建立林分收获模型,并采用遗传算法对模型参数进行优化。随机将样本数据分成350个训练样本和350个验证样本,对不同模型的拟合精度、预测精度进行对比分析,其中参数优化后的BP神经网络和支持向量机模型训练样本精度分别达到0.935 37和0.936 33,预测结果精度分别为0.921 30和0.926 97,训练样本和验证样本的总体拟合平均相对误差值均低于7%。分析结果表明,2种模型拟合精度高、预测性能好,为杉木人工林林分收获模拟和预测奠定了基础。为比较2种方法预测结果的差异性,将350个验证样本样地平均分为7组,分别用优化后的2种模型计算各组的预测精度,对预测精度与训练精度的差值进行t检验,结果表明,2种建模方法的预测结果不存在显著性差异,但模型精度的提高对森林资源的精确监测和森林生长动态预测具有重要的理论价值。同时,研究发现支持向量机模型的拟合精度和泛化能力均优于BP神经网络,该方法为收获模型研究提供了新思路。 相似文献
18.
研究使用R软件中的CaretEnsemble和Caret程序包,并基于Stacking方法来实现模型集成,研究南方红豆杉Taxus chinensis var.mairei在浙江省丽水市莲都区的潜在分布区,并比较5种单一模型的模拟结果及其与集成模型的差异。结果表明:单一模型中极端梯度上升模型表现最好,其次是随机森林模型、支持向量机模型、朴素贝叶斯模型和分类回归树模型,集成模型模拟结果好于单一模型,其Kappa值达0.80,准确率达0.90。集成模型模拟结果显示:影响南方红豆杉分布的主要环境因子为海拔、归一化植被指数和年平均最少降雨量。南方红豆杉主要适宜生长在浙江省丽水市莲都区的山地丘陵地区,中部盆地及平原地区不适宜南方红豆杉的生长,其在莲都区的潜在分布区面积为5.01万hm2。构建的集成模型在一定程度上提高了模型精度,使预测效果更优。 相似文献