首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
提出一种基于训练集分解的不平衡分类算法,该算法使用能输出后验概率的支持向量机作为分类器,使用基于测度层次信息源合并规则实现分类器的集成.在4个不同领域的不平衡数据集上的仿真实验表明:该算法有效提高分类器对正类样本的正确率,同时尽量减少对负类样本的误判.实验结果验证集成学习算法处理不平衡分类问题的有效性.  相似文献   

2.
提出了一种基于遗传算法的多样化特征选择和集成极限学习机(ELM)的软件缺陷分配算法,以快速、有效地将缺陷分配给合适的开发人员。首先,从缺陷报告中提取有用的信息。然后对数据进行预处理以建立向量空间模型,并对各种特征选择进行预处理,以选择具有最大统计信息的最小代表性非冗余特征集。最后,设计了集成ELM训练分类器对缺陷报告进行分类。实验结果表明,与现有方法相比,提出的特征选择技术和基于ELM的缺陷分类方法能提高分类的准确性。  相似文献   

3.
一种改进的支持向量机集成分类算法   总被引:2,自引:0,他引:2  
为了更好地改进集成分类器的性能,提出了一种基于反馈学习的支持向量机Bagging集成分类算法.该算法在对子分类器的训练中,引入反馈学习的思想,首先对每个训练得到的子分类器进行测试,找到被错分的样本,把这些样本添加到训练样本集中,重新进行训练、测试,直到没有新的被错分的样本出现为止,最后采用多数投票策略对得到的各子分类器进行组合.仿真实验结果表明,该算法可通过提高各分类器的分类能力改进集成学习器的性能.  相似文献   

4.
为实现对冷却羊肉表面细菌总数(TVC)的无损检测,采用高光谱技术结合数学建模的方法,通过高光谱成像系统采集波长范围为400~1 100 nm冷却羊肉样本的高光谱信息,并采用基于极限学习机(ELM)及其改进算法建立冷却羊肉表面细菌总数预测模型,分别实现了基本的极限学习机(ELM)、核极限学习机(KELM)以及遗传算法优化核极限学习机(GA-KELM) 3种建模方法。通过试验验证,3种建模方法中,GA-KELM模型预测效果最佳,其训练集样本和预测样本的相关系数分别为Rc=0. 983 7,Rp=0. 930 6,均方根误差为RMSEc=0. 001 6,RMSEp=0. 001 6,从而验证了该方法的有效性。  相似文献   

5.
为满足快速无损的大米产地确证需求,采集吉林省梅河口市水稻主产区及松原、大安、辉南等其他水稻产区共990个大米样本的高光谱图像(400~1 000 nm)作为研究对象,利用多元散射校正(MSC)处理方法对光谱进行预处理。采用多层感知机(MLP)、极限学习机(ELM)与在线序列极限学习机(OS-ELM)算法,分别基于全波段高光谱数据以及经多维尺度分析(MDS)方法降维后的数据建立产地确证模型。结果表明,基于全波段高光谱数据的OS-ELM模型分类性能最好,准确率达到98.3%。经MDS处理后,输入的数据变量减少了96.6%,MDS-OS-ELM模型准确率稳定在97.4%。对三种模型的训练时间进行对比分析,OS-ELM训练时间明显优于MLP,在分批次获取数据时训练时间优于ELM。为大米产地确证提供了一种高效、准确、稳定的方法。  相似文献   

6.
为满足快速无损的大米产地确证需求,采集吉林省梅河口市水稻主产区及松原、大安、辉南等其他水稻产区共990个大米样本的高光谱图像(400~1 000 nm)作为研究对象,利用多元散射校正(MSC)处理方法对光谱进行预处理。采用多层感知机(MLP)、极限学习机(ELM)与在线序列极限学习机(OS-ELM)算法,分别基于全波段高光谱数据以及经多维尺度分析(MDS)方法降维后的数据建立产地确证模型。结果表明,基于全波段高光谱数据的OS-ELM模型分类性能最好,准确率达到98.3%。经MDS处理后,输入的数据变量减少了96.6%,MDS-OS-ELM模型准确率稳定在97.4%。对三种模型的训练时间进行对比分析,OS-ELM训练时间明显优于MLP,在分批次获取数据时训练时间优于ELM。为大米产地确证提供了一种高效、准确、稳定的方法。  相似文献   

7.
针对目前玻璃空瓶回收再生产过程中造成瓶口缺陷破损的在线实时检测难题,提出一种基于极限学习机(Extreme Learning Machine, ELM)的检测算法。首先对采集的瓶口进行预处理,通过研究表面缺陷,提取灰度方差等6种表面特征。然后运用遗传算法对极限学习机的输入层层的阈值和权值进行优化,提高算法的检测精度。最后现场选取569个样本对所设计ELM分类器进行训练学习与测试,并与LVQ算法、BP分类器对比实验。结果表明该算法能够满足对机器视觉检测系统缺陷检测高速高精度的要求。  相似文献   

8.
为了解决分布式拒绝服务(Distributed Denial of Service, DDoS)攻击使云计算的最终用户无法访问云服务的问题,该文提出一种基于投票极限学习机(Voting Extreme Learning Machine, V-ELM)和黑洞优化的云计算DDoS攻击检测算法.该算法采用V-ELM作为分类器进行系统设计,使用多个极端学习机器同时检测攻击.使用数据包分析器捕获网络流量生成供分类器使用的样本,然后使用黑洞优化训练V-ELM中的所有ELM,在攻击检测过程中将样本应用于每个ELM并计算输出,最后在多数投票的基础上合并得到最终输出.实验结果表明:该文提出的算法在网络安全实验知识发现与数据挖掘(Network Security Lab Knowledge Discovery and Data Mining, NSL KDD)数据集和KDD分布式拒绝服务(KDD Distributed Denial of Service, KDD DDoS)数据集上的准确性、灵敏度和特异性均优于所对比的方法.  相似文献   

9.
基于集成学习的数据流分类问题已成为当前研究热点之一,而集成学习存在集成规模大、训练时间长、时空复杂度高等不足,为此提出了一种基于蚁群优化的选择性集成数据流分类方法,用蚁群优化算法挑选出优秀的基分类器来构建集成分类模型。该方法首先对所有基分类器采用交叉验证计算分类精度,同时采用Gower相似系数求出基分类器之间的差异性,然后把分类精度和分类器差异性作为分类器挑选标准,从全部基分类器中选出一部分来构建集成模型,最终挑选的基分类器不仅具有良好的分类精度,同时保持一定差异性。在标准仿真数据集上对构建的集成分类模型进行仿真试验,结果表明,该方法与传统集成方法相比在准确率和稳定性方面均有显著提高。  相似文献   

10.
针对养殖水体氨态氮含量预测准确性低的问题,提出了一种基于改进粒子群算法优化极限学习机的水产养殖氨态氮含量预测模型。引入自适应变异算子改进粒子群算法的搜索性能,利用改进粒子群算法优化极限学习机的初始权值和阈值,最后训练极限学习机预测模型求得最优解。将该预测模型应用在小汤山水产品养殖系统进行有效性验证,通过试验发现,与PSO-ELM和普通BP神经网络相比,IPSO-ELM预测氨态氮含量模型有更高的精度和更好的拟合能力。结果表明,基于改进粒子群优化的极限学习机氨态氮含量预测模型简单易懂、预测精度高、易于实现,具有较好的预测性能。  相似文献   

11.
提高智能采棉机效率的一个重要途径是实现单个、重叠和遮挡棉花的识别,避免误采摘和漏采摘。针对不同形态棉花的识别,常规的特征提取方法难以达到令人满意的结果,因而采用基于迁移学习的棉花识别方法和基于迁移模型的特征提取与极限学习机(extreme learning machine,ELM)相结合的方法进行棉花识别研究。首先更改AlexNet、GoogleNet、ResNet-50模型分类层和设置相关参数,用训练好的迁移模型对棉花验证集识别,然后利用训练好的迁移模型进行棉花数据集特征提取,再用训练集的特征训练ELM模型,统计不同隐含层神经元个数的ELM模型对棉花的识别准确率。AlexNet、GoogleNet、ResNet-50迁移模型识别率依次为92.03%、93.19%、93.68%;使用特征提取再与ELM结合的方法,准确率比对应迁移模型分别提高了1.97、1.34、1.55百分点。结果表明,迁移模型对小样本棉花识别也有较高准确率,基于特征提取与ELM相结合的方法可进一步提高准确率。  相似文献   

12.
流形学习的一个目标是寻找一个映射,使得邻域内不同类数据点之间的边界最大化.观察数据点映射后在子空间内使得同类数据点更聚集,而不同类数据点更分类.基于这个目标,提出了一种判别映射分析的算法,并将其应用于叶片分类中,该算法能够得到数据较优的判别分类特征,适用于样本分类.在瑞典植物叶片数据库上进行了试验验证,结果表明该方法是有效可行的.  相似文献   

13.
提出了一种基于β因子历史样本淘汰机制的在线学习算法.对UCI标准数据集中的部分样本集的测试结果表明:该机制有效地淘汰了一些样本,在保持了分类精度和泛化能力的情况下,大大加快了增量学习的训练速度.  相似文献   

14.
【目的】针对作物害虫数据集样本较少、现有单一模型在作物害虫识别上的准确率不高以及泛化能力较差的问题,提出一种基于迁移学习与多模型集成的害虫识别模型。【方法】在大规模公开作物害虫数据集IP102上进行试验,使用迁移学习单独训练6个深层神经网络,选择识别性能较好的EfficientNet、Vision Transformer、Swin Transformer和ConvNeXt进行组合,采用不同策略集成预测结果。【结果】提出的基于迁移学习与多模型集成方法的识别准确率达到75.75%,比性能最好的单模型ConvNeXt提高了1.34%,与目前该数据集上最优算法(CA-EfficientNet)的性能相比,识别准确率高出了6.3%。【结论】害虫图像智能识别模型具有较好的稳定性与泛化能力。  相似文献   

15.
为实现普米语孤立词语谱图的分类,引入基于卷积神经网络的语谱图模型,该模型可以无监督学习语谱图特征实现分类.本文搭建了一个9层的卷积神经网络模型,利用彩色语谱图样本集进行训练,并针对已训练好的模型,通过实验检验各项因素对分类的影响,从而得到适当的参数.参数确定后,进行卷积神经网络与支持向量机、 BP神经网络的对比实验,验证算法的可行性和有效性.实验显示基于卷积神经网络的普米语孤立词语谱图分类准确率达到91%~95%,这说明该算法是可行和有效的.与支持向量机、 BP神经网络相比,卷积神经网络具有自动提取特征,避免过拟合问题,适合大样本数据进行训练的优点.  相似文献   

16.
针对多肉植物种类多,类内差异大、类间差异小,数据难收集,导致传统分类算法不能有效解决多肉植物图像分类的问题,提出一种基于对比学习的多肉植物图像分类网络CL_ConvNeXt。该网络以ConvNeXt为基础结构引入对比学习思想,在网络中间层添加非线性投影层(Projection head)作为辅助分类器来帮助模型对浅层网络进行特征提取;在一个批处理中通过数据增强来构造正样本,将剩余样本看作负样本;将交叉熵损失函数和对比损失函数进行加权计算,重新设计新的损失函数计算方法,实现单阶段模型训练。训练时采用迁移学习将预训练权重迁移到模型中来提高模型训练时的收敛速度,通过优化各种策略和参数来进一步提升模型的识别准确率。结果表明,在自制的190类多肉植物数据集中,在使用相同训练策略和环境配置的情况下,最终模型CL_ConvNeXt对多肉植物图像分类识别准确率达到了91.79%,较原ConvNeXt模型结构的识别准确率提升了12.24个百分点,对解决多肉植物图像分类识别问题有较好的效果。  相似文献   

17.
针对财务危机预警研究中样本集的不平衡现象,提出了一种基于混合策略的模型构建方法。基本思想是结合数据层面的预处理和算法层面的集成学习,为财务危机预警提供有效的建模方案。首先使用SMOTE算法对财务危机公司重采样,有效避免了传统财务危机预警研究中样本配对挑选造成的信息严重丢失;再使用Bagging-C4.5算法对样本数据训练,在保证模型总预测率的基础上,大幅提高了财务危机样本的预测准确率。实验结果表明:该方法预测效果良好,在此领域有一定的实践意义。  相似文献   

18.
传统的基于支持向量机的单类分类器因计算复杂度高而无法满足大规模数据实时处理的需求,在线学习方法为解决该问题提供了一种有效途径.本文在挖掘样本数据在特征空间分布性状的基础上,提出了一种基于凸壳的在线单类学习机(One-class Online Classifier based on Convex Hull,OOCCH).该方法首先使用凸壳的定义选择能代表特征空间中数据分布的凸壳向量对应的原始样本作为训练样本来缩减训练集的规模;其次在分类器在线更新阶段利用凸壳向量动态地调整分类器的训练样本.理论分析证明了OOCCH的有效性,与现有的在线单类分类器的实验比较,OOCCH在训练时间和分类性能方面有显著优势.  相似文献   

19.
针对BP网络的过拟合问题,提出了一种基于验证误差的学习算法,该算法主要从构建最佳网络结构及获得最适训练次数两个角度进行了考虑.在学习过程中,通过不断检验验证误差及误差变化量,自动调整隐层节点数目,并适时停止网络训练.针对给定问题,该算法不仅能自动构建最佳网络结构和相应权系数,而且同时对网络的泛化能力进行了检验,从而有效避免了网络的过拟合.最后通过实验证明了算法的有效性.  相似文献   

20.
针对BP网络的过拟合问题,提出了一种基于验证误差的学习算法,该算法主要从构建最佳网络结构及获得最适训练次数两个角度进行了考虑.在学习过程中,通过不断检验验证误差及误差变化量,自动调整隐层节点数目,并适时停止网络训练.针对给定问题,该算法不仅能自动构建最佳网络结构和相应权系数,而且同时对网络的泛化能力进行了检验,从而有效避免了网络的过拟合.最后通过实验证明了算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号