首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
本文对有人采用的模糊聚类的一种算法给出了一个反例。并说明这种方法的采用是有条件的。  相似文献   

2.
考虑多元线性回归模型Y=XB+ε,其中E(Vec(ε))=0,Cov(Vec(ε))=V In,当设计阵X呈病态时,模型参数的LS估计不再是一个优良估计.为此,提出了一种有偏估计———BC估计.在均误差意义下,参数的BC估计优于它的LS估计,并证明了参数的BC估计是可容许线性估计.  相似文献   

3.
提出了一种基于数据驱动的系统建模方法,采用减法聚类和模糊C-均值聚类相结合的模糊聚类算法进行前件RBF网络辨识,自适应地获得精确的聚类个数和隶属度参数;用BP算法训练后件网络的权值,从而仅利用输入输出数据,就建立了T-S模糊神经网络模型,在该过程中充分利用了BP神经网络和RBF神经网络的优点。最后用该模型对一个非线性系统进行辨识,用MATLAB进行仿真,结果表明,该方法具有可行性。  相似文献   

4.
为解决在海量数据中实时、精准挖掘网络舆情热点话题的问题,提出一种基于Hadoop的网络舆情数据分析模型。对于话题发现核心模块,给出一种WCGFMR网络舆情热点话题挖掘算法,采用Map(映射)和Reduce(规约)规则进行舆情文本特征分组加权策略。实验结果表明,采用基于Hadoop架构的WCGFMR算法进行热点话题挖掘,热点话题的平均召回率达到85.32%,平均话题类纯度达到95.36%。随舆情数据集增大到2GB后,在Map数一定的条件下,多任务数Reduce执行时间相比少任务数Reduce大大缩短,数据中热点话题挖掘速度显著提高。  相似文献   

5.
谱聚类是一种无监督学习的聚类方法,其具有能够收敛至全局最优且适用于任意形状样本空间的优点.然而,传统方法构造的相似矩阵有时难以准确反映出数据之间的近似关系,从而导致聚类结果不佳.粒计算技术能够很好地解决这一问题.通过将数据邻域粒化,从粒子的视角重新衡量数据之间的近似关系,提出了一种基于邻域粒的谱聚类方法.首先,将样本的单一属性通过邻域粒化的方式形成邻域粒子;然后,将属于同一样本的粒子组合构造成粒子向量;接着,利用定义的2种邻域粒距离公式,对构造出的粒向量进行距离度量,并通过径向基函数生成相似矩阵,从而进行谱聚类;最后,使用UCI数据集进行验证,将谱聚类算法与邻域粒结合,从邻域参数和邻域粒向量的距离度量方式2个方面进行性能测试,并与传统聚类算法进行对比.实验结果表明,基于邻域粒构造的相似矩阵在谱聚类中是可行且有效的.  相似文献   

6.
成熟芒果的质量取决于芒果采收时的成熟度,迄今为止主要依靠人的主观经验来判断该成熟度。目前人们正在探求一种有潜力的非损伤方法,即通过手提式比色计测定芒果的色度值来预测芒果成熟度。芒果的成熟度依据成熟指数而定,该成熟指数是指试验中芒果的总可溶性固形物(TSS)与成熟芒果的TSS最低水平的比率,用百分比表示。通过HunterLab比色计,可以测定315个新鲜采收的芒果(未熟到熟透)的HunterLab比色计的L值,a值和b值。通过手提式折光计,测出整个芒果汁的TSS,算出成熟指数。通过多元线性回归(MLR)、偏最小二乘和主成分回归,分析160个芒果样品的成熟度和L值,a值和b值,得出不同的模型。从带有MLR变量a和b的模型,可挑选出ab样品。  相似文献   

7.
结合聚类分析方法与主成分分析方法,得到了线性模型参数的一种新估计-聚类主成分估计,并把它与最小二乘估计(LSE)和主成分估计(PCE)比较,获得了一些优良的性质。  相似文献   

8.
模糊聚类计算方法的理论分析   总被引:21,自引:0,他引:21  
分析了聚类分析4种原始数据规格化处理的数据特征,提出最大值规格化与均值规格化,由于能保持不同指标的原分辨力,是较好的方法。将常用的相似性度量方法分为绝对差数、相对差数、比例相似性3种类型。论证了基于模糊等价关系的模糊聚类法就是经典系统聚类的最短距离法,模糊系统聚类仅是一般系统聚类法的特例。  相似文献   

9.
[目的]构建水稻叶片SPAD值的高光谱精确估算模型,为进一步提高高光谱对水稻SPAD值反演估算精度提供参考依据.[方法]利用SPAD-502型叶绿素测定仪测量水稻叶片SPAD值,以FieldSpec 4光谱仪采集水稻叶片光谱数据.通过分析光谱植被指数、位置参数与SPAD值的相关性,构建4个水稻叶片SPAD值高光谱估测模型,即逐步多元线性回归(SMLR)模型、支持向量机回归(SVR)模型、基于主成分分析的支持向量机回归(PCA+SVR)模型和以逐步多元线性回归确定最佳参数的支持向量机回归(SMLR+SVR)模型;并采用均方根误差(RMSE)、平方相关系数(R2)、相对分析误差(RPD)和平均相对误差(MRE)等指标对模型进行评价.[结果]在分析的15个光谱特征参数中,除黄边位置(λy)无显著相关外(P>0.01),水稻叶片SPAD值与叶片光谱位置参数及植被指数参数间存在显著相关性,选择相关系数大于0.800的5个植被指数参数(VOG1、VOG2、VOG3、CARI和PRI)和7个光谱位置参数[蓝边面积(SDb)、黄边振幅(Dy)、黄边面积(SDy)、绿峰反射率(Rg)、红谷净深度(Hr)、蓝边振幅(Db)和红边位置(λh)]作为输入变量构建水稻叶片SPAD值的估测模型.R2和RPD值越大,RMSE和MRE值越小,则表明模型的性能越好,估算精度高.比较4个模型训练与测试结果的R2、RMSE、MRE和RPD可知,在模型估算精度上,SMLR+SVR模型高于SMLR模型,PCA+SVR模型高于SVR模型.总体上,SMLR+SVR模型能更好地实现对水稻叶片SPAD值的预测,其模型各项评价指标R2、RMSE、MRE和RPD分别为0.856、2.076、3.984%和2.550.[建议]进一步挖掘分析光谱特征参数与水稻叶片SPAD值间的关系,提出新的光谱特征参数或优化特征参数选择组合方法,增加回归建模算法,提高高光谱对水稻叶片SPAD值的有效估算.采集水稻冠层高光谱图像,反演出高光谱图像中的水稻冠层SPAD值,研究冠层SPAD与水稻长势关系,为水稻科学管理提供技术支持.  相似文献   

10.
针对现有算法时间效率低且不稳定的缺点,提出了一种视频序列中二值图像的快速聚类算法,其通过对图像标号的方式构建反映聚类像素点密度分布的密度树,然后通过对密度树底层节点的删除实现二值图像的聚类,使得算法的时间效率高而稳定,最差时间效率只与图像尺寸有关,并且可以有效屏蔽噪声的影响、实验结果证明所提算法的时间效率和聚类质量都有显著提高。  相似文献   

11.
一个高效实现灰色关联分析的R程序   总被引:1,自引:0,他引:1  
灰色关联分析模型是一种广泛应用于各个科研领域的重要的统计模型,但其数据处理过程计算量很大。R是一门高级统计计算编程语言,可以在通用公共许可(GPL)规则下从互联网免费获取。该研究基于灰色关联分析方法设计了一个可快速自动计算邓氏关联度的R程序,通过成功应用于实例,验证了本程序的可行性和高效性。  相似文献   

12.
选取贵州省19个气象站50a(1960-2009年)的气温、降水资料,并以26?876°N 为界(威宁测站纬度)将贵州分为南北两个区域———南区和北区,同时以1 km ×1 km 的 DEM 数据为基础,结合多元回归等方法,分区域建立基于纬度、归一化的海拔和坡向、以及坡度因子的气温和降水推算模型,由此在其选定区域进行气候要素小网格推算。结果表明:地理因子中,纬度因子对温度和降水的贡献最大;南区温度模型相关显著,但降水模型没通过检验;而北区温度和降水模型效果都很好;在推算区域中,温度,降水分布存在纬向差异。  相似文献   

13.
针对洛阳牡丹花期与牡丹花会开幕时间不相吻合这一现象,通过研究洛阳高山种植区1992-2010年迎日红、洛阳红和首案红牡丹花期资料与气象资料,采用SPSS软件分析大气温度、地温、有效积温等与牡丹花期之间的内在关系,构建洛阳高山种植区牡丹花期预测模型。结果表明:15cm土层厚度处地温稳定通过4℃的平均温度和积温与牡丹花期有极显著的相关性。采用晚花品种构建模型预测误差范围在-2.375 2~2.456 5d,误差较小,效果较好。  相似文献   

14.
几种QSAR建模方法的研究进展与应用   总被引:2,自引:0,他引:2  
定量构效关系(QSAR)对药物设计和新药研制、环境毒物的毒性评价与预测有着显著的作用,本文简单介绍了几种QSAR建模方法:多元线性回归(MLR)、主成分分析(PCA)、偏最小二乘法(PLS)、人工神经网络(ANN)和支持向量机(SVM),并对这几种不同的建模方法在实际中的应用进行举例。可以看出PLS和ANNS是优秀的建模方法,预测能力强,SVM通过结构风险最小化原则建模,有效将期望风险降至最低,模型预测力得到显著提高,在环境毒物评价中具有广阔的应用前景。  相似文献   

15.
Hyperspectral data sets contain useful information for characterizing vegetation canopies not previously available from multi-spectral data sources. However, to make full use of the information content one has to find ways for coping with the strong multi-collinearity in the data. The redundancy directly results from the fact that only a few variables effectively control the vegetation signature. This low dimensionality strongly contrasts with the often more than 100 spectral channels provided by modern spectroradiometers and through imaging spectroscopy. With this study we evaluated three different chemometric techniques specifically designed to deal with redundant (and small) data sets. In addition, a widely used 2-band vegetation index was chosen (NDVI) as a baseline approach. A multi-site and multi-date field campaign was conducted to acquire the necessary reference observations. On small subplots the total canopy chlorophyll content was measured and the corresponding canopy signature (450-2500 nm) was recorded (nobs = 42). Using this data set we investigated the predictive power and noise sensitivity of stepwise multiple linear regression (SMLR) and two ‘full spectrum’ methods: principal component regression (PCR) and partial least squares regression (PLSR). The NDVI was fitted to the canopy chlorophyll content using an exponential relation. For all techniques, a jackknife approach was used to obtain cross-validated statistics. The PLSR clearly outperformed all other techniques. PLSR gave a cross-validated RMSE of 51 mg m−2 for canopy chlorophyll contents ranging between 38 and 475 mg m−2 (0.99 ≤ LAI ≤ 8.74 m2 m−2). The lowest accuracy was achieved using PCR (RMSEcv = 82 mg m−2 and ). The NDVI, even using chlorophyll optimized band settings, could not reach the accuracy of PLSR. Regarding the sensitivity to artificially created (white) noise, PCR showed some advantages, whereas SMLR was the most sensitive chemometric technique. For relatively small, highly multi-collinear data sets the use of partial least square regression is recommended. PLSR makes full use of the rich spectral information while being relatively insensitive to sensor noise. PLSR provides a regression model where the entire spectral information is taken - in a weighted form - into account. This method seems therefore much better adapted to deal with potentially confounding factors compared to any 2-band vegetation index which can only avoid the most harmful factor of variation.  相似文献   

16.
对山西省晋中、忻州、吕梁、运城、晋城、长治等地市不同肥力水平 0~ 2 0cm的 1 0 0个土样 ,分别采用常规分析与速测法 (目测 )对各土样中速效磷 ,速效钾进行测定 ,以探索速测与常规分析法测定值间的相关性。通过回归分析对数据的处理、统计分析 ,表明两种方法测定值间相关性显著 ,并建立了它们之间的线性转换模式 (1 )、(2 )。 (本模式适用于石灰性土壤 )  相似文献   

17.
分析了外文文献回溯建库的必要性,介绍了东北农业大学图书馆外文书目数据库建设现状,总结了在回溯建库过程中遇到的问题及解决方案。  相似文献   

18.
本文用遗传相关、遗传通径分忻、多元线性回归等分析方法,用电子计算机对八个甘蓝型油菜(Brassicanapus L.)品种的十个植株性状进行了统计分析,同时,根据各性状的遗传力和遗传变异系数,提出高产育种的选择方法。本试验结果表明,单株产量受多因素影响,其中单株有效角果数、每角粒数、千粒重和株高对单株产量的直接影响显著,且为正值。其他性状对单株产量的直接影响不显著。育种中,早期应进行株高的选择,中后期分别对单株有效角果数、千粒重和每角粒数进行连续的定向选择,同时还应考虑各性状间的遗传相关,以选出高产的油菜新品种。  相似文献   

19.
铁是植物必需的一种微量营养元素。农作物的产量及品质经常因土壤缺铁而降低。研究植物在低铁条件下生长发育及对铁缺乏响应的分子机制,有助于揭示植物铁营养的遗传基础,有利于改良和培育耐低铁的农作物。笔者根据野生型拟南芥在低铁条件下的生长和生理表型确定了遗传筛选突变体的指标,并建立了筛选拟南芥与缺铁信号及信号转导相关突变体的方法。利用这种方法,笔者筛选出11株突变体并克隆了一个可能与植物耐低铁胁迫相关的基因,证明该方法适用于鉴别铁营养相关的重要基因以及分子遗传学的研究。  相似文献   

20.
【目的】构建云南省甘蔗产量预测模型,对云南省甘蔗主产区甘蔗产量进行预测。【方法】选取云南省5个甘蔗主产区的甘蔗种植数据和地区气象数据作为研究对象,使用关联规则算法对研究区水库数、氮肥用量、磷肥用量、钾肥用量、复合肥用量、地膜使用量、甘蔗种植面积、年均气温、年降水量9个影响因素进行分析,得出5个甘蔗产量的强关联因素作为样本特征,将样本特征代入多元线性回归算法,构建产量预测模型。【结果】根据测试集验证结果显示,使用多元线性回归算法构建甘蔗产量预测模型,普洱、临沧、红河、文山、德宏地区模型的准确率分别为81.1%、89.3%、67.8%、85.3%、73.7%;使用关联规则算法与多元线性回归算法构建甘蔗产量预测模型,普洱、临沧、红河、文山、德宏地区模型的准确率分别为95.4%、92.8%、97.9%、94%、91.4%,关联规则算法对模型准确率的提升分别为14.3%、3.5%、30.1%、8.7%、17.7%。【结论】关联规则算法可提升多元线性回归产量预测模型的准确率,该模型在云南省的5个甘蔗主产区均表现出较好的预测效果,为甘蔗产量预测提供了新的方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号