首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
几种QSAR建模方法的研究进展与应用   总被引:2,自引:0,他引:2  
定量构效关系(QSAR)对药物设计和新药研制、环境毒物的毒性评价与预测有着显著的作用,本文简单介绍了几种QSAR建模方法:多元线性回归(MLR)、主成分分析(PCA)、偏最小二乘法(PLS)、人工神经网络(ANN)和支持向量机(SVM),并对这几种不同的建模方法在实际中的应用进行举例。可以看出PLS和ANNS是优秀的建模方法,预测能力强,SVM通过结构风险最小化原则建模,有效将期望风险降至最低,模型预测力得到显著提高,在环境毒物评价中具有广阔的应用前景。  相似文献   

2.
首先基于支持向量回归(SVR)依均方根误差最小原则确定最优核函数,再以最优核函数为基础,进行SVR非线性自变量筛选,最后以所选自变量进行建模预测.将该方法应用于酚类化合物的QSAR研究,最优核函数确定为径向基核,最终保留自变量为疏水性参数(lgp)与拓扑指数(Am3).结果表明:基于SVR进行变量筛选能有效地剔除无关自变量,进一步改进SVR对小样本数据的建模预测能力.该方法在农业环境毒性污染物的QSAR研究领域有较广泛的应用前景.  相似文献   

3.
建立可见-近红外漫反射光谱与沙棘汁品种之间的数学模型,以评价可见-近红外漫反射光谱技术快速检测沙棘汁品种。采用美国ASD公司的FieldSpec3光谱仪对三种不同品种的沙棘汁进行光谱分析,各获取30个样本的光谱数据,对原始光谱进行一阶微分和二阶微分预处理,并利用偏最小二乘法(PLS)数学校正方法对三种不同预处理的光谱数据建模。结果表明,采用二阶微分预处理数据,应用PLS方法建模较好,其校正模型相关系数为0.9992,均方根误差为0.0317;采用主成分回归(PCR)和偏最小二乘法(PLS),对沙棘汁的二阶微分数据进行分析比较,结果也表明,基于二阶微分数据,应用PLS方法建模较为理想,其预测集的相关系数为0.9988,所测预测样本的均方根误差为0.0392。近红外光谱可作为一种快速、有效的无损检测方法来识别沙棘汁的品种。  相似文献   

4.
[目的]探索一种有效的组合预测方法,用于定量构效关系(QSAR)的研究分析。[方法]提出一种基于支持向量机回归(SVR)与K-最近邻法(KNN)的组合预测方法:以均方误差(MSE)最小为择优准则,对SVR实施核函数寻优;基于最优核函数以SVR进行描述符筛选并得到保留描述符;以"多轮末尾强制淘汰法"阐述各保留描述符对预测精度影响的程度;基于保留描述符,以不同KNN预测值反映样本集异质性并构建子模型,最后基于SVR以留一法实施组合预测。运用该组合预测方法研究磺酰脲和三唑并嘧啶磺酰胺类除草剂QSAR建模。[结果]建模结果表明,基于SVR与KNN的组合预测方法在参比模型中预测精度最高,具有结构风险最小、非线性、能有效克服过拟合、泛化推广能力优异等优点。[结论]基于SVR与KNN的组合预测具有许多优点,在QSAR研究中应用前景广泛。  相似文献   

5.
为了进一步提升近红外光谱法测定烟草绿原酸、莨菪亭、芸香苷含量的稳定性和准确性,分别采用7500~4000 cm(-1)、随机蛙跳(Random Frog)和间隔随机蛙跳(Interval Random Frog)波长或波长筛选方法结合偏最小二乘(PLS)法建立了烟草中上述3种物质的近红外校正模型,并采用模型的内部参数和外部预测集样本对建模效果进行了评价。结果表明:3种物质近红外校正模型的决定系数均有一定程度提高,校正均方根误差(RMSEC)和交叉验证均方差(RMSECV)均在一定程度上降低;外部验证预测平均相对误差均在一定程度上降低。说明采用近红外光谱法测定烟草中绿原酸、莨菪亭和芸香苷时,Interval Random Frog+PLS建模效果优于Random Frog+PLS方法,后者又优于7500~4000 cm(-1)、随机蛙跳(Random Frog)和间隔随机蛙跳(Interval Random Frog)波长或波长筛选方法结合偏最小二乘(PLS)法建立了烟草中上述3种物质的近红外校正模型,并采用模型的内部参数和外部预测集样本对建模效果进行了评价。结果表明:3种物质近红外校正模型的决定系数均有一定程度提高,校正均方根误差(RMSEC)和交叉验证均方差(RMSECV)均在一定程度上降低;外部验证预测平均相对误差均在一定程度上降低。说明采用近红外光谱法测定烟草中绿原酸、莨菪亭和芸香苷时,Interval Random Frog+PLS建模效果优于Random Frog+PLS方法,后者又优于7500~4000 cm(-1)光谱波长变量+PLS。  相似文献   

6.
为实时、准确地获取原位土壤含水量信息,利用可见/近红外光谱技术,分别使用全局偏最小二乘(PLS)建模、局部PLS建模方法,对田间原位土壤含水量进行快速估测。结果表明:全局PLS模型中,其建模集的决定系数(R~2)、交叉验证均方根误差(RMSECV)分别为0.943和1.750%,检验集的决定系数(R~2)、预测均方根误差(RMSEP)分别为0.956和1.260%。局部PLS模型中,分别比较了选取定标子集的2种方法(欧氏距离法和马氏距离法),采用欧氏距离法和马氏距离法选取定标子集进行建模的R~2值分别为0.974和0.979,RMSEP值分别为0.976%和0.943%。因此,将可见/近红外光谱技术应用到田间原位含水量测量是可行的,其中,使用局部建模方法的效果优于全局建模。  相似文献   

7.
针对农业中虫害受多种复杂因素的影响及发生量预测问题非线性、样本少、特征变量多的特点,结合偏最小二乘回归(PLS)、遗传算法(GA)与Elman神经网络,建立了虫害发生量的PLS_GA_Elman预测模型。通过PLS回归算法对影响因素进行特征提取后,将降维变量输入Elman模型,并运用GA对Elman建模中的权值和阀值进行优化。通过实例分析表明该模型预测准确性高,能有效地预测虫害的发生量。同时为验证算法的有效性,与PLS算法、Elman神经网络算法、基于GA的Elman神经网络算法(GA_Elman)、基于GA的BP神经网络算法(GA_BP)进行比较。  相似文献   

8.
害虫预测预报方法的研究进展   总被引:2,自引:0,他引:2  
回顾了害虫预测预报方法的发展,概述了非线性预测理论的原理及其在害虫预测中的应用,重点阐述最新预测方法SVM及SVR-CAR的建模原理以及在害虫预测的应用,展望了害虫发生预测的发展趋势及SVM与SVR-CAR的应用前景.  相似文献   

9.
为了进一步提升近红外光谱法测定烟草绿原酸、莨菪亭、芸香苷含量的稳定性和准确性,分别采用7500~4000 cm~(-1)、随机蛙跳(Random Frog)和间隔随机蛙跳(Interval Random Frog)波长或波长筛选方法结合偏最小二乘(PLS)法建立了烟草中上述3种物质的近红外校正模型,并采用模型的内部参数和外部预测集样本对建模效果进行了评价。结果表明:3种物质近红外校正模型的决定系数均有一定程度提高,校正均方根误差(RMSEC)和交叉验证均方差(RMSECV)均在一定程度上降低;外部验证预测平均相对误差均在一定程度上降低。说明采用近红外光谱法测定烟草中绿原酸、莨菪亭和芸香苷时,Interval Random Frog+PLS建模效果优于Random Frog+PLS方法,后者又优于7500~4000 cm~(-1)光谱波长变量+PLS。  相似文献   

10.
对中国近年来基于偏最小二乘法(PLS)建模在近红外光谱分析中的应用情况作了综述,对基于偏最小二乘法(PLS)建模与其他方法单独建模的研究、非线性偏最小二乘法的建模过程及其在近红外线光谱分析中应用、基于偏最小二乘法(PLS)建模在近红外光谱分析中应用进行了展望。  相似文献   

11.
可视化建模技术(VMT)是当前国际上新颖的计算机应用开发环境,能使实际问题应用抽象复杂的数学方法变得易行。本文就此技术用于产业化风险诊断与风险预警仿真模型的研究,并在计算机上加以实现,探讨一种化解风险的新思路。  相似文献   

12.
基于PLS 和组合预测方法的冬小麦收获 指数高光谱估测   总被引:1,自引:0,他引:1  
【目的】通过遥感反演测量收获指数(HI),可节省时间和人力,但需要提高精度。通过权重最优组合算法改善收获指数估算精度,为基于多时相多光谱信息的HI遥感估算提供新方法参考。【方法】利用测定的冬小麦多个关键生育期的冠层光谱数据,对筛选的44种常用植被指数与实测收获指数进行相关性分析,挑选出每个育期中5种最优的典型植被指数;应用偏最小二乘(PLS)的方法建模,分别得到基于单个生育期光谱信息的HI遥感估测模型;借鉴组合预测原理,应用组合预测方法对全部单生育期的各HI光谱模型赋予最优权重,最终构建基于多生育期数据的HI光谱组合预测模型。【结果】(1)利用PLS后,单一生育期的建模结果较单一植被指数有所改进,但仍有待提高;(2)应用组合预测原理的HI组合预测模型,显著改善了HI的估测精度,R2达到0.55,较单生育期的建模预测,提升了13%。【结论】基于多生育期信息的组合预测方法,对各单一生育期HI预测模型赋予最优权重进行优化组合,实质间接利用了各生育期对作物HI形成的贡献,显著提高冬小麦收获指数的估测精度,是一种新颖的作物HI遥感估测方法。  相似文献   

13.
李冉  姜朋  贺影  向妍  邓小龙  周玮 《安徽农业科学》2014,42(32):11470-11472
[目的]构建可靠的QSAR模型用于评价醇类化合物的毒性。[方法]利用MLR、SLR和SVR 3种方法研究60种醇类化合物辛醇/水分配系数lgKow和水溶解度lgSw这两个指标与mX的相关性。[结果]模型评估结果显示出MLR和SLR的建模能力与文献方法一样优异,SVR在具有合适核函数时其建模能力也能表现出优异的泛化推广能力。[结论]该研究可为QSAR模型的构建提供参考。  相似文献   

14.
汪西原  马毅  刘丹 《安徽农业科学》2011,39(30):18971-18973,18977
[目的]研究结合WT预处理的近红外光谱PLS算法模型预测鲜枣糖度的方法。[方法]用S-G、MSC、FD、SD、WT和WT+MSC 6种预处理法,SMLR、PCR和PLS 3种算法模型,对60个鲜枣样品的近红外光谱数据进行预处理、糖度预测和建模精度分析,建立最佳算法的数学模型。[结果]在鲜枣糖度近红外光谱预处理阶段引进小波变换方法去除导数光谱噪声,得到了很好的去噪效果。不同的小波函数、分解尺度使消噪的结果有所不同。与常见的光谱预处理法相比,在选用db4-3小波函数、默认阈值情况下,采用WT+MSC预处理及建模算法为PLS时所建立的模型最好,其相关系数R为0.919 02,校正集标准差RMSEC为0.863,预测集标准差RMSEP为1.71。[结论]结合小波变换预处理的PLS算法模型可有效预测鲜枣糖度,改善模型的预测精度。  相似文献   

15.
岳征文  张瑞强  阎立功  刘铁军  高天明  刘召 《安徽农业科学》2013,(28):11477-11479,11562
[目的]基于近红外光谱技术,研究保水剂吸水倍率的快速测定新方法。[方法]通过近红外光谱技术结合偏最小二乘法,对9种聚丙烯酰胺型保水剂的吸水倍率进行研究.[结果]保水剂样品光谱数据采用一阶导数法预处理后,应用PLS法建模预测效果最佳。真值与预测值的决定系数达99.55%,模型预测准确率都在96%以上,可应用于生产实践。[结论]应用近红外光谱技术结合PLS法可以准确预测出保水剂的吸水倍率,是一种快速、无损、环保的新方法。  相似文献   

16.
[目的]得到一种快速检测叶片含水量和叶绿素含量的定量估计模型。[方法]选取88片赣南脐橙叶片作为研究对象,运用近红外光谱技术检测叶片含水量和叶绿素含量2个指标。通过6种不同预处理方法(SG/MSC/1st D/2nd D/SNV/Baseline)在全波段4 000~12 000 cm-1范围内建立了叶片含水量和叶绿素含量的PLS、PCR和LS-SVM定量检测模型。[结果]试验得出,在预测叶片含水量的模型中,PLS、PCR和LS-SVM预测效果整体相差不大,其最优的预测模型是使用PLS建模,其中RP=0.985,RMSEP=0.023。在预测叶片叶绿素含量的模型中,3种方法预测效果相差不大,最优预测模型是MSC-LS-VSM,其中RP=0.933,RMSEP=0.23。[结论]研究表明,应用近红外光谱技术对赣南脐橙叶片含水量和叶绿素含量的快速检测具有可行性。  相似文献   

17.
基于最小二乘支持向量机的灌区粮食产量预测研究   总被引:1,自引:0,他引:1  
对常用作物产量预测模型进行了简要评述,建立了基于最小二乘支持向量机的灌区产量预测模型。最小二乘支持向量机,采用二次规划方法代替传统的支持向量机来解决函数估计问题。最小二乘支持向量机在利用结构风险原则时,在优化目标中选取了不同的损失函数,即误差ξ_i(允许错分的松弛变量)的二范数。这使得最小二乘向量机的优化问题为:min(1/2)‖w‖^2+C(1/2)sum from i=1 to 1ξi~2(ξi是松驰变量;C为正则化参数)。用于函数估计的最小二乘SVM为:y(x)=sum from k=1 to Nαk K(x,xk)+b。采用等式约束可以将求解的优化问题转化成线性方程,大大减少算法的复杂性,另外,采用径向基核函数的最小二乘SVM仅需确定γ、σ2个参数(γ为可调参数,σ为核函数宽度系数),参数的搜索空间由标准SVM的三维降低到二维,极大地加快了建模速度。对γ,σ2个参数通过模型评估来确定参数最优值,大大提高了预测的精度。对河南省人民胜利渠灌区作物产量进行模拟计算,并用检验样本与灰色预测和神经网络模型的预测结果进行了比较。结果表明,最小二乘SVM预测的最大误差7.12%,平均误差4.81%;灰色理论预测的最大误差38.36%,平均误差17.52%;神经网络预测的最大误差10.40%,平均误差6.80%。可见,最小二乘支持向量机模型有较高的预测精度和良好的推广能力,预测结果优于灰色预测理论和人工神经网络,可作为灌区粮食产量预测的一种新方法。  相似文献   

18.
为了实现文冠果脂肪含量的无损快速检测,满足文冠果育种材料筛选和工业加工需求,选取46个文冠果作为标准样品集,采用索式抽提法测定种仁的脂肪含量,并应用近红外光谱(NIRS)技术采集样品的光谱数据,运用Unscrambler软件,采用偏最小二乘法(PLS)构建文冠果脂肪含量的NIRS预测模型,结果显示,该模型回归曲线R-Square (决定系数)为0.985 6、RMSE (标准误差)为0.414 9,可以进行有效预测。同时,选取32个未参加建模的文冠果样品作为验证材料,进一步对模型的预测效果进行外部检验,结果显示,外部检测回归曲线R-Square为0.901 4、RMSE为0.825 9,脂肪含量预测值与化学值的吻合性较好。建立的NIRS模型可靠,预测结果较为准确,可用于检测文冠果脂肪含量。该脂肪含量检测方法经济、快速、高效,为育种材料筛选和工业加工提供了快捷有效的途径。  相似文献   

19.
[目的]通过定标集、预测集、检验集的建模过程,采用偏最小二乘(PLS)方法结合波段选择建立土壤总氮快速分析的近红外(NIR)光谱模型。[方法]为了避免模型评价失真,基于随机性、相似性和稳定性,提出一种严谨的建模体系。将全谱扫描区(400~2 498nm)分成可见区(400~780 nm)、短波近红外区(780~1 100 nm)和长波近红外区(1 100~2 498 nm)。[结果]经过比较、检验,结果表明长波近红外达到了最好的模型效果和稳定性,最优PLS因子数为8,检验的预测均方根误差(V-SEP)和预测相关系数(V-RP)分别为0.118 g/kg和0.857,得到客观、稳定的预测模型。  相似文献   

20.
基于漫反射法的番石榴可溶性固形物含量(SSC)无损检测中,确定番石榴最佳光谱取样的位置和数量,对提高检测精度具有重要意义。分别采集番石榴顶端、赤道和底部区域漫反射光谱,每个区域采集4 处,以赤道1处、赤道4 处平均和全部12 处平均光谱作为各样本的光谱,建立PLS 模型并对独立预测集样本进行预测。结果显示,12 处平均光谱数据建模效果最好,其预测相关系数Rp=0.962,预测均方根误差RMSEP=0.432;赤道4 处平均光谱建模效果次之,Rp=0.793,RMSEP 为0.588;赤道1 处光谱建模效果最差,Rp=0.687,RMSEP=0.599。再经过连续投影算法(SPA)筛选全谱变量,得到23 个特征波长,此时PLS 模型的Rp=0.902,RMSEP=0.438。试验结果表明,番石榴多处平均的漫反射光谱充分携带其内在品质信息,建模效果优于单处或单区域采样光谱。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号