首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为了研究三唑噻吩并嘧啶衍生物对小麦赤霉菌抑菌活性(G/%)的定量构效关系(QSAR),按照分子的拓扑环境编程计算了14种上述化合物的电性距离矢量(M_D)。通过最佳变量子集回归,建立了它们的二参数(M_(26)、M_(32))QSAR模型,非交叉验证相关系数(R~2)与逐一剔除法交叉验证相关系数(R_(cv)~2)分别为0.857、0.648,显示良好的稳健性和预测能力。根据进入模型可知,影响三唑噻吩并嘧啶衍生物对小麦赤霉菌抑菌活性的主要因素是C-、-O等结构碎片。  相似文献   

2.
在B3LYP/6-311++(d,p)水平上对26个咪唑并嘧啶类抗菌剂进行全优化和振动分析计算,得到各分子的量子参数、拓扑指数和热力学参数。应用遗传算法(GA)-主成分分析法(PCA)-神经网络(PNN)筛选出与抗菌活性密切相关的6个参数作为分子描述符;采用主成分神经网络方法建立了咪唑类抗菌剂与大肠杆菌抑制活性的定量结构—活性关系(QSAR)模型,同时采用内外部双重验证的方法检验模型的稳定性。模型的统计学参量如下:相关系数的平方(R~2)、留一法(LOO)交互验证相关系数(Q_(LOO)~2)、外部样本验证相关系数(Q_(F1)~2)、均方根误差(RMSE)分别为0.9991、0.9989、0.9996和0.155。结果表明:最低空轨道能(E_(lumo))和正辛醇/水分配系数(logP)是影响咪唑并嘧啶类杀菌剂的抗菌活性的主要因素,模拟外部验证和交叉验证表明模型具有良好的稳健性和预测能力,可用于同系列化合物抗菌活性的预测。  相似文献   

3.
对具有抑制人早幼粒白血病细胞(HL-60)活性的倍半萜类化合物进行二维定量构效关系研究,利用遗传算法建立2D-QSAR模型,得到10个具有较好预测能力的QSAR模型。分析模型得出:脂水分配系数(ALogP)、分子量(Molecular_Weight)与化合物活性呈正相关,偶极距x分量(Dipole_X)、分子表面积(Molecular_SurfaceArea)与化合物活性呈负相关;倍半萜2D-QSAR模型中独特的2个分子参数分别是VSA_AlogP[2]和VSA_AlogP[10];VSA_AlogP[2]参数与化合物抗癌活性呈正相关,在此区域内增加羟基等影响分子脂水分配系数的官能团能增加化合物的抗癌活性,VSA_AlogP[10]参数与化合物活性呈负相关,此区域内减少羟基等影响分子酯水分配系数的官能团会增加化合物的抗癌活性。该组模型将为新型抗癌类药剂的筛选以及新型抗癌类药物设计提供指导。  相似文献   

4.
籽粒直链淀粉质量分数的快速、无损伤测定是高直链淀粉玉米育种的关键环节。以196份高直链单籽粒和360份高直链单穗玉米籽粒为样本,分别利用碘染色法和一阶导数+标准正态变量变换(SNV)的光谱预处理法,构建单籽粒和单穗籽粒直链淀粉质量分数的NIRS分析模型,并通过分割建模样品化学值变异范围的方法建立2个单穗籽粒的NIRS子模型,以期提高对单穗籽粒样品的预测准确度。结果表明,所建立的4个模型的交叉验证标准偏差(RMSECV)分别为1.805、3.370、2.394、2.408,预测标准偏差(RMSEP)分别为2.017、3.205、2.369、2.596,各项决定系数(R2cal、R2cv、R2val)为0.626 1~0.897 0。表明,所建玉米单籽粒NIRS模型的预测准确度较高,可用于早代玉米单籽粒直链淀粉质量分数的鉴定;单穗NIRS子模型能够在一定程度上弥补单穗NIRS模型在预测准确度上的不足,将总模型与子模型配合使用能提高预测准确度。  相似文献   

5.
海洋生物的多样性、活性物质结构的新颖性以及海洋环境的独特性使得海洋生物成为天然抗肿瘤活性物质的重要来源之一。以分子电性距离矢量(MEDV-13)为结构描述子,应用基于预测的变量筛选(VMSP)方法,对44种海洋Fascaplysin类CDK4抑制剂的活性作用数据进行模拟分析,获得一个6变量的定量结构—活性关系(QSAR)模型,而且对样本内部使用LOO(Leave-One-Out)验证方法、外部通过测试集对模型进行了验证。模型相关系数r=0.923 9,LOO交互检验相关系数q=0.878 9,显示模型具有良好的估计能力和对外部样本的预测能力。随后,计算了模型最优子集各变量对生物活性的碎片贡献率,结果显示,影响抑制剂活性的主要分子结构单元为=C-(或-C-)、>C-、>N-、-O-以及二联苯中苯环的位置,苯环在对位时对活性有利。研究亮点:发展小分子CDK4抑制剂是当前癌症治疗的新研究领域。首次使用QSAR方法对44种海洋Fascaplysin类化合物的生物活性与其分子结构之间的定量关系进行研究,且对模型进行了内部验证和外部验证,计算了基团对活性的贡献大小。  相似文献   

6.
基于高光谱的稻米品质估测模型的构建   总被引:2,自引:0,他引:2  
通过测试不同试验条件下稻米品质及其高光谱数据,研究稻米中淀粉、蛋白质和胶稠度与高光谱数据特征之间的相关关系。结果表明:在不同施肥条件下,通过构建归一化指数(NDI,x)与稻米品质指标(y)的多种关系模型,比较模型预测的显著性,得出的多项式模型对稻米品质指标具有较高预测性,通用模型y=ax2+bx+c中的构成系数a、b、c因肥料水平差异取值不同;在不同品种条件下,通过比较波段比值指数(RI,x)与稻米品质指标(y)的相关系数,得出的最佳波段组合分别为x直链淀粉=R783nm/R634nm、x蛋白质=R829nm/R646nm和x胶稠度=R900nm/R670nm,推算出预测稻米品质指标的线性回归方程通用模型y=ax+b中的构成系数a、b因品种差异取值不同。这表明,运用高光谱方法估算稻米中的直链淀粉、蛋白质含量和胶稠度切实可行,可为稻米品质遥感监测提供依据。  相似文献   

7.
以黄色甜椒为研究对象,利用改进偏最小二乘法(MPLS)建立其近红外漫反射光谱无损检测可溶性固形物(SSC)和总酸含量的数学模型。在400~2 500 nm以及400~980 nm+1 108~1 900 nm 2个波长范围内分别建立了甜椒的SSC和总酸质量分数的定标MPLS模型,并用最优模型进行预测。结果表明,最优的预处理是在400~980 nm+1 108~1 900 nm下建立的模型,SSC采用SNV处理的定标模型较好,交互验证相关系数(RCV)、交互验证标准误差(SECV)分别为0.926 9和0.186 2,预测集的相关系数RP和预测标准误差(SEP)分别为0.924 8和0.158 9;总酸则是采用None处理的模型较好,交互验证相关系数(RCV)、交互验证标准误差(SECV)分别为0.868 0和0.012 5,预测集的相关系数RP预测标准误差(SEP)分别为0.903 8和0.011 1。试验结果说明,基于改进偏最小二乘法对甜椒鲜果SSC和总酸含量的近红外漫反射快速无损检测是可行的,近红外光谱与SSC和总酸含量呈显著相关性。  相似文献   

8.
以分子拓扑指数作为结构描述符,采用最佳子集回归方法,建立了35种有机磷酸酯类化合物在3种不同极性固定相上的定量结构-色谱保留关系(QSRR)模型。3个QSRR模型均具有良好的拟合能力,对QSRR模型分别进行了交叉验证及外部数据集验证,结果表明各模型具有较强的预测能力。对QSRR模型的系数、标准误差及相关系数均进行了蒙特卡洛模拟,结果证实蒙特卡洛方法可用于QSRR模型的稳健性分析。  相似文献   

9.
研究利用近红外光谱分析技术定量测定茶叶中咖啡碱的含量,目的是通过变量筛选简化模型并提高预测精度.试验中以135个来自大闽食品公司的茶叶作为研究对象,利用基于小波系数蒙特卡罗无信息变量消除法(WT-MC-UVE)进行变量筛选并结合偏最小二乘法(PLS)建立咖啡碱定量分析模型,选择交互验证均方根误差(RMSECV)和预测集均方根误差(RMSEP)以及预测相关系数(Rp)作为模型的评价指标.应用 WT-MC-UVE筛选的90个变量所建立的模型,交互验证均方根误差,预测卷均方根误差,预测相关系数分别为0.1248、0.1611和0.9574.结果表明,该方法有效可行.  相似文献   

10.
研究利用近红外光谱分析技术定量测定茶叶中咖啡碱的含量,目的是通过变量筛选简化模型并提高预测精度。试验中以135个来自大闽食品公司的茶叶作为研究对象,利用基于小波系数蒙特卡罗无信息变量消除法(WT-MC-UVE)进行变量筛选并结合偏最小二乘法(PLS)建立咖啡碱定量分析模型,选择交互验证均方根误差(RMSECV)和预测集均方根误差(RMSEP)以及预测相关系数(Rp)作为模型的评价指标。应用WT-MC-UVE筛选的90个变量所建立的模型,交互验证均方根误差,预测卷均方根误差,预测相关系数分别为0.124 8、0.1611和0.957 4。结果表明,该方法有效可行。  相似文献   

11.
秦正龙  冷检  冯长君 《湖北农业科学》2015,54(3):674-675,679
采用电拓扑态指数(Ek)及分子价连接性指数(mXtV)对从密蒙花(Buddleja officinalis Maxim)挥发油中分离出的27种化合物进行结构表征,通过多元线性回归及最佳变量子集方法,建立了色谱保留时间的定量构效关系模型。该模型的相关系数(R2)为0.988,逐一剔除法交叉验证系数(Q2)为0.982,计算值与实验值颇为吻合,较好地揭示了密蒙花挥发油成分色谱保留时间的递变规律,该研究对中药化学成分的分离、纯化、检测、结构表征及其药用价值的开发,具有理论指导意义。  相似文献   

12.
采用误差反传前向人工神经网络(artificial neural network,ANN)建立了21种2-(4-取代-苯基)-3-异噻唑啉酮类化合物的结构与其抗菌活性之间的定量关系模型(ANN模型),以21种3-异噻唑啉酮类化合物的量子化学参数和拓扑指数作为输入、抗菌活性作为输出,所构建网络模型的交叉检验相关系数为0.991 6、标准偏差为0.080 1、残差绝对值≤0.221,应用于外部预测集,预测集相关系数为0.973 1;而多元线性回归(multiple linearregression,MLR)法模型的相关系数为0.841 8、标准偏差为0.303 9、残差绝对值≤0.636。结果表明,ANN模型获得了比MLR模型更好的拟合效果。  相似文献   

13.
丁瑞 《安徽农业科学》2012,(30):14627-14628
[目的]建立一种预测有机物对孔雀鱼急性毒性(pLC50)的定量结构-活性相关性(QSAR)模型。[方法]基于化学拓扑理论,计算了19种有机物的分子电性距离矢量(Md)。运用多元统计回归方法,建立这些有机物对孔雀鱼pLC50与Md的QSAR模型。[结果]经最佳变量子集回归,建立了它们的最佳三元数学模型,传统的判定系数(R2)为0.958,逐一剔除法的交互验证系数(Q2)为0.920。[结论]该模型具有良好的稳健性及预测能力。  相似文献   

14.
为了建立昌吉市近地面AQI监测的关系模型,利用昌吉市2015—2016年MODIS AOD产品与同期地面观测的AQI进行相关分析,结果表明二者直接相关程度较低(R2=0. 2921,p 0. 01);按照季节分类统计(春、夏、秋)的相关系数R2分别为0. 4629、0. 4192、0. 3487,均大于统计学上99%的置信度要求;加入气象因子风速,建立含气象因子的AQI和AOD的多元回归模型,结果表明全年及各季的相关系数R2分别为0. 3648、0. 4528、0. 4247、0. 5089;对气象因子风速进行分级,在综合考虑R2检验值和F检验值的基础上,平均风速2m·s-1时的模型为线性模型R2为0. 47,预测平均相对误差为10. 8%,结果较好。文章为监测空气污染提供了一定的参考价值。  相似文献   

15.
比较分子相似性指数分析(CoMSIA)方法用于皮质类固醇类化合物的3D-QSAR研究,较系统地分析了立体场、静电场、疏水场、氢键受体场与氢键配体场及其协同作用对皮质类固醇化合物与人体CBG亲合力的贡献,并建立相应的3D-QSAR模型.研究结果表明,使用静电场与立体场协同作用建立的3D-QSAR模型(r2=0.995,q2=0.882),对该类化合物具有良好预测能力.通过静电场、立体场等值面可直观分析到叠合分子周围的各种作用对化合物与CBG间亲合力的影响,对皮质类固醇类化合物的结构改造具有指导作用.  相似文献   

16.
利用人工神经网络模型(artificial neural network,ANN)以分子电性距离适量和保留时间分别作为输入和输出,建立了地下水26个挥发性有机物的定量结构-色谱保留相关关系模型(quantitative structure-retention relationship,QSRR),所构建网络模型的相关系数为0.998 5,留一交叉检验应用于训练集,其相关系数为0.998 3,该模型应用于外部预测集,其相关系数为0.979 5;而多元线性回归(Multiple Linear regression,MLR)法模型的相关系数为0.949 2,留一交叉检验相关系数为0.897 8。结果表明,ANN模型具有较准确的预测能力,并获得了较好的拟合效果。  相似文献   

17.
【目的】应用人工神经网络来解决苹果叶片叶绿素含量与高光谱数据之间的非线性关系,建立估测苹果叶片叶绿素含量的最佳模型,为苹果叶片叶绿素含量的快速无损监测提供参考。【方法】以位于陕西扶风杏林镇的树龄为4~5年的15棵苹果树为研究对象,2015年分别于果树花期(4月27日)、幼果期(5月30日)、果实膨大期(7月6日)、果实着色期(8月5日)、果实成熟期(9月11日)采集叶片样本,利用SVC HR-1024i型高光谱仪和SPAD-502叶绿素仪同步获取苹果叶片光谱值和对应的叶绿素含量,对原始光谱和一阶导数光谱与叶绿素含量之间的关系进行分析,从一阶导数光谱中提取苹果叶片光谱的5个红边参数,从5个红边参数中筛选出相关性好的红边参数,使用传统单变量回归算法、反向传播(back propagation,BP)神经网络和径向基函数(radial basis function,RBF)神经网络,建立叶绿素含量估测模型,用决定系数(R2)、均方根误差(RMSE)和相对误差(RE)来验证模型的准确性。【结果】与原始光谱相比,一阶导数光谱与苹果叶片叶绿素含量的相关性更高。5个红边参数中,红边位置、峰度系数、偏度系数与叶绿素含量的相关系数均较高,且均达极显著水平。建立的传统单变量回归模型中,基于红边位置、峰度系数和偏度系数的R2均大于0.7,其中基于偏度系数建立的多项式模型模拟精度最高,验证结果R2为0.872,RMSE为4.631,RE为8.81%。选取红边位置、峰度系数和偏度系数为人工神经网络的输入变量,分别优化BP神经网络的隐含层节点数和网络类型以及RBF神经网络的扩展系数(SPREAD值)来提高预测精度,结果发现,建立隐含层节点数为4的双隐含层BP神经网络最优模型R2为0.891,RMSE为3.844,RE为7.55%;当SPREAD值为0.6时,建立的RBF神经网络最优模型的R2为0.955,RMSE和RE分别为2.517和3.69%。【结论】估算苹果叶片叶绿素含量时,人工神经网络模型比传统单变量模型精度高,其中RBF神经网络模型学习速度快、精度高,拟合结果更加可靠。  相似文献   

18.
应用近红外透射光谱技术(NITS),采用偏最小二乘法(PLS)建立重庆地区稻米活体蛋白质含量(PC)定量分析数学模型。结果表明,糙米和精米蛋白质含量预测数学模型的定标标准误偏差(SEC)、交叉检验标准误差(SECV)、定标相关系数(RSQ)和交叉验证相关系数(1-VR)分别为0.252、0.247;0.256、0.278;-0.953、0.946;0.951、0.940;近红外预测值与化学值误差范围分别为-0.61~0.18、-0.39~0.46,相关系数分别为0.984、0.978,均达到极显著相关。利用该模型能够对育种材料的蛋白质含量进行快速非破坏性活体测定,可大大提高育种选择效率。  相似文献   

19.
【目的】建立牛奶中尿素氮的快速、无损检测方法,为牛奶中尿素氮的快速检测提供支持。【方法】对200个牛奶样品进行近红外扫描,并用多功能乳制品分析仪对牛奶样品中尿素氮的含量进行测定;剔除20个异常样品后,得到由180个牛奶样品组成的得分样品,将得分样品分为定标集(144个)和验证集(36个),将正交试验设计与主成分回归法(PCR)、偏最小二乘法(PLS)、改进偏最小二乘法(MPLS)3种定量校正方法和多种光谱预处理方法结合,建立牛奶中尿素氮的近红外检测模型,利用目标函数法对模型预测效果进行评定。【结果】建立了定量检测牛奶中尿素氮的最优模型,其定标相关系数(R2)和定标标准差(SEC)分别为0.986 4和0.238 4。用验证集对所建模型进行验证,其校正相关系数(RSQ)和预测标准差(SEP)分别为0.976 0和0.360 0。利用所有得分样品对预测结果进行监控,并绘制尿素氮测定值与模型预测值的线性相关曲线,相关系数r2为0.980 5。【结论】利用近红外光谱法建立的尿素氮定量检测最优模型具有很好的适用性和准确性,可用于牛奶尿素氮的快速定量检测。  相似文献   

20.
利用在小波变换下奇异信号和噪声在多尺度空间中的模极大值传递特性的不同,对33个小麦样品的近红外光谱信号进行了消噪处理,并利用小波消噪后重构光谱信号对小麦蛋白质含量进行偏最小二乘法交叉验证(PLS-CV).计算实例表明,在最大分解层数不同时,PLS-CV效果各不相同,但大多数的小波消噪重构光谱进行PLS-CV,相关系数R及测定系数R2都有提高,交叉校验预测均方差RMSPCV都有减小,特别在最大分解层数为6时,PLS-CV效果最好,较使用原始光谱进行PLS-CV,相关系数R从0.9222提高到0.9698,交叉校验预测均方差RMSPCV从0.8014减小到0.4983.因此,使用小波消噪方法有消除原始光谱的噪声的作用,从而使最终的PLS模型更有代表性、稳定、稳健,也提高了品质检测时模型预测精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号