首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 578 毫秒
1.
几种QSAR建模方法的研究进展与应用   总被引:2,自引:0,他引:2  
定量构效关系(QSAR)对药物设计和新药研制、环境毒物的毒性评价与预测有着显著的作用,本文简单介绍了几种QSAR建模方法:多元线性回归(MLR)、主成分分析(PCA)、偏最小二乘法(PLS)、人工神经网络(ANN)和支持向量机(SVM),并对这几种不同的建模方法在实际中的应用进行举例。可以看出PLS和ANNS是优秀的建模方法,预测能力强,SVM通过结构风险最小化原则建模,有效将期望风险降至最低,模型预测力得到显著提高,在环境毒物评价中具有广阔的应用前景。  相似文献   

2.
首先基于支持向量回归(SVR)依均方根误差最小原则确定最优核函数,再以最优核函数为基础,进行SVR非线性自变量筛选,最后以所选自变量进行建模预测.将该方法应用于酚类化合物的QSAR研究,最优核函数确定为径向基核,最终保留自变量为疏水性参数(lgp)与拓扑指数(Am3).结果表明:基于SVR进行变量筛选能有效地剔除无关自变量,进一步改进SVR对小样本数据的建模预测能力.该方法在农业环境毒性污染物的QSAR研究领域有较广泛的应用前景.  相似文献   

3.
建立可见-近红外漫反射光谱与沙棘汁品种之间的数学模型,以评价可见-近红外漫反射光谱技术快速检测沙棘汁品种。采用美国ASD公司的FieldSpec3光谱仪对三种不同品种的沙棘汁进行光谱分析,各获取30个样本的光谱数据,对原始光谱进行一阶微分和二阶微分预处理,并利用偏最小二乘法(PLS)数学校正方法对三种不同预处理的光谱数据建模。结果表明,采用二阶微分预处理数据,应用PLS方法建模较好,其校正模型相关系数为0.9992,均方根误差为0.0317;采用主成分回归(PCR)和偏最小二乘法(PLS),对沙棘汁的二阶微分数据进行分析比较,结果也表明,基于二阶微分数据,应用PLS方法建模较为理想,其预测集的相关系数为0.9988,所测预测样本的均方根误差为0.0392。近红外光谱可作为一种快速、有效的无损检测方法来识别沙棘汁的品种。  相似文献   

4.
[目的]探索一种有效的组合预测方法,用于定量构效关系(QSAR)的研究分析。[方法]提出一种基于支持向量机回归(SVR)与K-最近邻法(KNN)的组合预测方法:以均方误差(MSE)最小为择优准则,对SVR实施核函数寻优;基于最优核函数以SVR进行描述符筛选并得到保留描述符;以"多轮末尾强制淘汰法"阐述各保留描述符对预测精度影响的程度;基于保留描述符,以不同KNN预测值反映样本集异质性并构建子模型,最后基于SVR以留一法实施组合预测。运用该组合预测方法研究磺酰脲和三唑并嘧啶磺酰胺类除草剂QSAR建模。[结果]建模结果表明,基于SVR与KNN的组合预测方法在参比模型中预测精度最高,具有结构风险最小、非线性、能有效克服过拟合、泛化推广能力优异等优点。[结论]基于SVR与KNN的组合预测具有许多优点,在QSAR研究中应用前景广泛。  相似文献   

5.
为了进一步提升近红外光谱法测定烟草绿原酸、莨菪亭、芸香苷含量的稳定性和准确性,分别采用7500~4000 cm(-1)、随机蛙跳(Random Frog)和间隔随机蛙跳(Interval Random Frog)波长或波长筛选方法结合偏最小二乘(PLS)法建立了烟草中上述3种物质的近红外校正模型,并采用模型的内部参数和外部预测集样本对建模效果进行了评价。结果表明:3种物质近红外校正模型的决定系数均有一定程度提高,校正均方根误差(RMSEC)和交叉验证均方差(RMSECV)均在一定程度上降低;外部验证预测平均相对误差均在一定程度上降低。说明采用近红外光谱法测定烟草中绿原酸、莨菪亭和芸香苷时,Interval Random Frog+PLS建模效果优于Random Frog+PLS方法,后者又优于7500~4000 cm(-1)、随机蛙跳(Random Frog)和间隔随机蛙跳(Interval Random Frog)波长或波长筛选方法结合偏最小二乘(PLS)法建立了烟草中上述3种物质的近红外校正模型,并采用模型的内部参数和外部预测集样本对建模效果进行了评价。结果表明:3种物质近红外校正模型的决定系数均有一定程度提高,校正均方根误差(RMSEC)和交叉验证均方差(RMSECV)均在一定程度上降低;外部验证预测平均相对误差均在一定程度上降低。说明采用近红外光谱法测定烟草中绿原酸、莨菪亭和芸香苷时,Interval Random Frog+PLS建模效果优于Random Frog+PLS方法,后者又优于7500~4000 cm(-1)光谱波长变量+PLS。  相似文献   

6.
害虫预测预报方法的研究进展   总被引:2,自引:0,他引:2  
回顾了害虫预测预报方法的发展,概述了非线性预测理论的原理及其在害虫预测中的应用,重点阐述最新预测方法SVM及SVR-CAR的建模原理以及在害虫预测的应用,展望了害虫发生预测的发展趋势及SVM与SVR-CAR的应用前景.  相似文献   

7.
为实时、准确地获取原位土壤含水量信息,利用可见/近红外光谱技术,分别使用全局偏最小二乘(PLS)建模、局部PLS建模方法,对田间原位土壤含水量进行快速估测。结果表明:全局PLS模型中,其建模集的决定系数(R~2)、交叉验证均方根误差(RMSECV)分别为0.943和1.750%,检验集的决定系数(R~2)、预测均方根误差(RMSEP)分别为0.956和1.260%。局部PLS模型中,分别比较了选取定标子集的2种方法(欧氏距离法和马氏距离法),采用欧氏距离法和马氏距离法选取定标子集进行建模的R~2值分别为0.974和0.979,RMSEP值分别为0.976%和0.943%。因此,将可见/近红外光谱技术应用到田间原位含水量测量是可行的,其中,使用局部建模方法的效果优于全局建模。  相似文献   

8.
针对农业中虫害受多种复杂因素的影响及发生量预测问题非线性、样本少、特征变量多的特点,结合偏最小二乘回归(PLS)、遗传算法(GA)与Elman神经网络,建立了虫害发生量的PLS_GA_Elman预测模型。通过PLS回归算法对影响因素进行特征提取后,将降维变量输入Elman模型,并运用GA对Elman建模中的权值和阀值进行优化。通过实例分析表明该模型预测准确性高,能有效地预测虫害的发生量。同时为验证算法的有效性,与PLS算法、Elman神经网络算法、基于GA的Elman神经网络算法(GA_Elman)、基于GA的BP神经网络算法(GA_BP)进行比较。  相似文献   

9.
为了进一步提升近红外光谱法测定烟草绿原酸、莨菪亭、芸香苷含量的稳定性和准确性,分别采用7500~4000 cm~(-1)、随机蛙跳(Random Frog)和间隔随机蛙跳(Interval Random Frog)波长或波长筛选方法结合偏最小二乘(PLS)法建立了烟草中上述3种物质的近红外校正模型,并采用模型的内部参数和外部预测集样本对建模效果进行了评价。结果表明:3种物质近红外校正模型的决定系数均有一定程度提高,校正均方根误差(RMSEC)和交叉验证均方差(RMSECV)均在一定程度上降低;外部验证预测平均相对误差均在一定程度上降低。说明采用近红外光谱法测定烟草中绿原酸、莨菪亭和芸香苷时,Interval Random Frog+PLS建模效果优于Random Frog+PLS方法,后者又优于7500~4000 cm~(-1)光谱波长变量+PLS。  相似文献   

10.
对中国近年来基于偏最小二乘法(PLS)建模在近红外光谱分析中的应用情况作了综述,对基于偏最小二乘法(PLS)建模与其他方法单独建模的研究、非线性偏最小二乘法的建模过程及其在近红外线光谱分析中应用、基于偏最小二乘法(PLS)建模在近红外光谱分析中应用进行了展望。  相似文献   

11.
可视化建模技术(VMT)是当前国际上新颖的计算机应用开发环境,能使实际问题应用抽象复杂的数学方法变得易行。本文就此技术用于产业化风险诊断与风险预警仿真模型的研究,并在计算机上加以实现,探讨一种化解风险的新思路。  相似文献   

12.
李冉  姜朋  贺影  向妍  邓小龙  周玮 《安徽农业科学》2014,42(32):11470-11472
[目的]构建可靠的QSAR模型用于评价醇类化合物的毒性。[方法]利用MLR、SLR和SVR 3种方法研究60种醇类化合物辛醇/水分配系数lgKow和水溶解度lgSw这两个指标与mX的相关性。[结果]模型评估结果显示出MLR和SLR的建模能力与文献方法一样优异,SVR在具有合适核函数时其建模能力也能表现出优异的泛化推广能力。[结论]该研究可为QSAR模型的构建提供参考。  相似文献   

13.
基于PLS 和组合预测方法的冬小麦收获 指数高光谱估测   总被引:1,自引:0,他引:1  
【目的】通过遥感反演测量收获指数(HI),可节省时间和人力,但需要提高精度。通过权重最优组合算法改善收获指数估算精度,为基于多时相多光谱信息的HI遥感估算提供新方法参考。【方法】利用测定的冬小麦多个关键生育期的冠层光谱数据,对筛选的44种常用植被指数与实测收获指数进行相关性分析,挑选出每个育期中5种最优的典型植被指数;应用偏最小二乘(PLS)的方法建模,分别得到基于单个生育期光谱信息的HI遥感估测模型;借鉴组合预测原理,应用组合预测方法对全部单生育期的各HI光谱模型赋予最优权重,最终构建基于多生育期数据的HI光谱组合预测模型。【结果】(1)利用PLS后,单一生育期的建模结果较单一植被指数有所改进,但仍有待提高;(2)应用组合预测原理的HI组合预测模型,显著改善了HI的估测精度,R2达到0.55,较单生育期的建模预测,提升了13%。【结论】基于多生育期信息的组合预测方法,对各单一生育期HI预测模型赋予最优权重进行优化组合,实质间接利用了各生育期对作物HI形成的贡献,显著提高冬小麦收获指数的估测精度,是一种新颖的作物HI遥感估测方法。  相似文献   

14.
汪西原  马毅  刘丹 《安徽农业科学》2011,39(30):18971-18973,18977
[目的]研究结合WT预处理的近红外光谱PLS算法模型预测鲜枣糖度的方法。[方法]用S-G、MSC、FD、SD、WT和WT+MSC 6种预处理法,SMLR、PCR和PLS 3种算法模型,对60个鲜枣样品的近红外光谱数据进行预处理、糖度预测和建模精度分析,建立最佳算法的数学模型。[结果]在鲜枣糖度近红外光谱预处理阶段引进小波变换方法去除导数光谱噪声,得到了很好的去噪效果。不同的小波函数、分解尺度使消噪的结果有所不同。与常见的光谱预处理法相比,在选用db4-3小波函数、默认阈值情况下,采用WT+MSC预处理及建模算法为PLS时所建立的模型最好,其相关系数R为0.919 02,校正集标准差RMSEC为0.863,预测集标准差RMSEP为1.71。[结论]结合小波变换预处理的PLS算法模型可有效预测鲜枣糖度,改善模型的预测精度。  相似文献   

15.
岳征文  张瑞强  阎立功  刘铁军  高天明  刘召 《安徽农业科学》2013,(28):11477-11479,11562
[目的]基于近红外光谱技术,研究保水剂吸水倍率的快速测定新方法。[方法]通过近红外光谱技术结合偏最小二乘法,对9种聚丙烯酰胺型保水剂的吸水倍率进行研究.[结果]保水剂样品光谱数据采用一阶导数法预处理后,应用PLS法建模预测效果最佳。真值与预测值的决定系数达99.55%,模型预测准确率都在96%以上,可应用于生产实践。[结论]应用近红外光谱技术结合PLS法可以准确预测出保水剂的吸水倍率,是一种快速、无损、环保的新方法。  相似文献   

16.
玉米秸秆磷含量近红外漫反射光谱的建模研究   总被引:1,自引:1,他引:0  
利用近红外光谱(NIRS)技术,建立玉米秸秆磷含量的快速定量分析模型,有利于植物养分利用效率和遗传育种研究。本研究选取了来源广泛的200份玉米自交系秸秆样品,结合近红外光谱仪在4 000~10 000cm~(-1)波段处测量的秸秆样品的光谱数据和钼锑抗比色法测量的样品磷浓度,分别用偏最小二乘(PLS)、最小绝对值收敛和选择算子(LASSO)、支持向量机(SVM)和回归树(RT)的方法,建立了玉米秸秆磷含量的近红外定量分析模型。5折交叉验证结果显示,PLS为最优建模方法,测试集预测值和真实值的相关系数(r_(test))为0.80±0.05,训练集的拟合相关系数(r_(training))为0.97±0.03。将PLS与不同的光谱预处理方法结合来优化模型,在11种预处理方法中,归一化以及平滑化的预处理方法效果最好,r_(test)均为0.80±0.05,与原始光谱数据相比相关性并未显著提高。随着训练集个体的增加,预测准确性不断提高,当训练集和验证集比例为8∶2时,预测相关系数为0.80,与留一法的预测相关系数(0.81)相当。综上,PLS建立的玉米秸秆磷含量的近红外定量分析模型预测准确性较高,可用于育种或者遗传学研究中磷含量的测定。  相似文献   

17.
[目的]得到一种快速检测叶片含水量和叶绿素含量的定量估计模型。[方法]选取88片赣南脐橙叶片作为研究对象,运用近红外光谱技术检测叶片含水量和叶绿素含量2个指标。通过6种不同预处理方法(SG/MSC/1st D/2nd D/SNV/Baseline)在全波段4 000~12 000 cm-1范围内建立了叶片含水量和叶绿素含量的PLS、PCR和LS-SVM定量检测模型。[结果]试验得出,在预测叶片含水量的模型中,PLS、PCR和LS-SVM预测效果整体相差不大,其最优的预测模型是使用PLS建模,其中RP=0.985,RMSEP=0.023。在预测叶片叶绿素含量的模型中,3种方法预测效果相差不大,最优预测模型是MSC-LS-VSM,其中RP=0.933,RMSEP=0.23。[结论]研究表明,应用近红外光谱技术对赣南脐橙叶片含水量和叶绿素含量的快速检测具有可行性。  相似文献   

18.
基于最小二乘支持向量机的灌区粮食产量预测研究   总被引:1,自引:0,他引:1  
对常用作物产量预测模型进行了简要评述,建立了基于最小二乘支持向量机的灌区产量预测模型。最小二乘支持向量机,采用二次规划方法代替传统的支持向量机来解决函数估计问题。最小二乘支持向量机在利用结构风险原则时,在优化目标中选取了不同的损失函数,即误差ξ_i(允许错分的松弛变量)的二范数。这使得最小二乘向量机的优化问题为:min(1/2)‖w‖^2+C(1/2)sum from i=1 to 1ξi~2(ξi是松驰变量;C为正则化参数)。用于函数估计的最小二乘SVM为:y(x)=sum from k=1 to Nαk K(x,xk)+b。采用等式约束可以将求解的优化问题转化成线性方程,大大减少算法的复杂性,另外,采用径向基核函数的最小二乘SVM仅需确定γ、σ2个参数(γ为可调参数,σ为核函数宽度系数),参数的搜索空间由标准SVM的三维降低到二维,极大地加快了建模速度。对γ,σ2个参数通过模型评估来确定参数最优值,大大提高了预测的精度。对河南省人民胜利渠灌区作物产量进行模拟计算,并用检验样本与灰色预测和神经网络模型的预测结果进行了比较。结果表明,最小二乘SVM预测的最大误差7.12%,平均误差4.81%;灰色理论预测的最大误差38.36%,平均误差17.52%;神经网络预测的最大误差10.40%,平均误差6.80%。可见,最小二乘支持向量机模型有较高的预测精度和良好的推广能力,预测结果优于灰色预测理论和人工神经网络,可作为灌区粮食产量预测的一种新方法。  相似文献   

19.
有机磷农药氯过氧化物酶反应活性的定量构效研究   总被引:3,自引:0,他引:3  
氯过氧化物酶(CPO)是应用最广的一种过氧化物酶,能催化一系列底物的氧化。采用量子化学从头算方法在HF/6—31G(d)水平下计算了7种含S=P键的有机磷农药的多个量子化学参数,运用偏最小二乘法建立CPO对有机磷农药反应活性的定量结构-活性关系(QSAR)模型。结果表明,CPO对有机磷农药的反应活性与所考查的量子化学参数之间存在非线性关系。以对数关系建模得到了相关系数为0.910的模型,该模型具有较高的拟合精度和较强的预测能力。模型辅助分析表明。农药分子的S=P键中S原子电荷的大小对氧化活性的影响最大,P原子电荷大小的影响次之,分子偶极矩对氧化活性也有一定影响:农药分子中S原子带负电荷越多,P原子所带正电荷越多,分子极性越小,该农药就越容易被CPO催化氧化。最后运用所得模型预测了2种有机磷农药的CPO反应活性。  相似文献   

20.
[目的]通过定标集、预测集、检验集的建模过程,采用偏最小二乘(PLS)方法结合波段选择建立土壤总氮快速分析的近红外(NIR)光谱模型。[方法]为了避免模型评价失真,基于随机性、相似性和稳定性,提出一种严谨的建模体系。将全谱扫描区(400~2 498nm)分成可见区(400~780 nm)、短波近红外区(780~1 100 nm)和长波近红外区(1 100~2 498 nm)。[结果]经过比较、检验,结果表明长波近红外达到了最好的模型效果和稳定性,最优PLS因子数为8,检验的预测均方根误差(V-SEP)和预测相关系数(V-RP)分别为0.118 g/kg和0.857,得到客观、稳定的预测模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号