首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
基于数据挖掘可视化技术,构造了一个决策树可视化系统模型,对数据挖掘中决策树可视化模型进行了分析与研究,其中主要实现了数据可视化、属性约简和决策树可视化模块。针对传统的决策树ID3算法偏向取值较多属性的缺点提出了一个算法,将多类问题转换成2类问题,避免了ID3算法形成的决策树过细,分类不够准确等问题。该算法产生的规则比ID3算法更加简捷,更加概括化,避免了规则中包含不关键的属性。  相似文献   

2.
目的 针对ID3算法计算复杂度高这一问题,改进决策树生成算法DTA(Decision Tree Algorithm)。方法 提出了用影响度作为属性选择的标准,为了使算法具有良好的可伸缩性,引入了基于类别的属性表的新的数据结构。结果 表明算法能生成正确的决策树,并且计算复杂度明显优于传统算法。结论 可以在计算机硬件配置较低、资源消耗较少的条件下来快速生成正确的决策树,得到相应的决策规则。  相似文献   

3.
对学生成绩属性的特征进行分类是运用数据挖掘中的决策树方法。利用决策树技术分析影响学生成绩的因素。采用基于CLS算法思想和ID3算法思想的改进算法建立决策树。重视并推广决策树技术在教学中的应用,振兴教育事业。  相似文献   

4.
应用粗糙集与决策树相结合的数据挖掘方法评价吉林省某地的土壤地力等级.研究数据共有161条记录,16个属性,使用粗糙集对土壤属性进行约简,去除了5个土壤冗余属性,得到属性约简集;使用决策树方法对土壤数据建立决策树模型,得到了土壤评价的决策树模型,并提取了分类规则.实验表明:将粗糙理论与决策树相结合的数据挖掘方法能去除冗余属性,同时保留了原始数据的内部特点,相对于单-使用决策树方法,决策树规模减小,规则集较精简,提高了分类的效率.  相似文献   

5.
聚类、粗糙集与决策树的组合算法在地力评价中的应用   总被引:4,自引:1,他引:3  
陈桂芬  马丽  董玮  辛敏刚 《中国农业科学》2011,44(23):4833-4840
 【目的】地力评价方法大多数有一定的主观性,较少考虑土壤各属性间的依赖关系。论文旨在采用数据挖掘方法,寻求地力等级划分的新方法。【方法】结合农安县耕地调查数据,应用K-means聚类方法、Johnson粗糙集属性约简算法与C4.5决策树算法相结合的优化算法评价地力等级。【结果】使用K-means聚类方法,得到最佳学习样本数;使用粗糙集属性约简和决策树相结合的方法,去掉了冗余属性7个,决策树模型共有节点317个,其中叶节点个数为159个,生成规则159条,模型准确率为82.08%。与未聚类和未约简的方法相比,决策树结点个数减少41.62%。【结论】使用该组合算法,在保证模型准确率的同时,降低了算法的时间和空间复杂性,提高了挖掘效率。  相似文献   

6.
针对目前上下文规则生成方法通常是依靠人工定义的,提出一种修正的ID3算法用于虚拟环境上下文规则的自动生成.该算法先构建上下文决策树,然后再将此树自动转换成规则集.实验结果验证该算法在生成规则的有效性与计算效率上具有良好性能.  相似文献   

7.
决策树是一类常见的机器学习方法,具有属性结构和较好的分类预测能力,可以根据既定规则完成基本的决策任务。本文阐述了决策树算法的基本思想,并以某银行信贷问题为例,分析了决策树算法在应用中遇到的一些问题,最后给出了性能调优方案。  相似文献   

8.
C4.5算法是决策树分类方法中的经典算法,以高校图书馆为例,运用面向属性归纳和决策树C4.5算法对整个读者流通数据库进行挖掘,并对挖掘的结果及其含义进行评价,为加强图书馆个性化服务提供依据。  相似文献   

9.
为解决市场上鲍鱼产品缺乏科学分类方法的问题,利用近红外光谱分析技术结合机器学习方法对鲍鱼快速分类进行研究,使用MicroNIRTM1700便携式近红外光谱仪采集3种鲍鱼,即绿盘鲍(25只)、红壳鲍(31只)、皱纹盘鲍(35只)的光谱数据,采用CART算法建立鲍鱼分类决策树模型,以模型对测试集样本的预测准确率衡量决策树模型优劣,分裂策略为在每个节点处选择Gini不纯度最大的方式进行分裂,通过交叉验证控制决策树深度。结果表明,对训练集180条光谱建立模型,采用5折交叉验证,模型准确率为90.00%,对测试集93条光谱的预测准确率为90.32%。本研究方法可以很好地区分绿盘鲍、红壳鲍和皱纹盘鲍,满足鲍鱼现场快速分类的需求。  相似文献   

10.
决策树在耕地地力等级评价中的应用   总被引:1,自引:0,他引:1  
司巧梅  宋丽 《安徽农业科学》2011,39(12):7328-7329,7417
在介绍数据挖掘技术的基本概念、决策树方法的基础上,结合牡丹江市地力等级数据样本,采用决策树ID3分类算法建立了耕地地力等级决策树分级图。通过该分级图可以预测各地区耕地地力等级,为该领域的数据挖掘提供了合理的挖掘方式。  相似文献   

11.
林分蓄积是衡量小班林分生产力的重要指标。以广西高峰林场速生桉为研究对象,以年龄、密度两个林分因子和坡向、坡位、坡度、土壤等立地因子作为自变量,公顷蓄积作为因变量,利用非集成、集成学习方法构建9个决策树模型,选择最优决策树模型预估不同年龄的桉树蓄积。结果表明:①集成学习决策树模型精度高于非集成模型,串行集成类模型boosting精度高于并行集成类模型bagging,其中串行集成模型中XGboost模型评价指标最优,训练集R2为081,RMSE为044;测试集RMSE为048,MAE为034。② 最优模型XGboost自变量重要性占比大于1%,依次为年龄(78%)、海拔(49%)、土层厚度(38%)以及密度(32%),其中年龄重要性远高于其他变量,纵向海拔高度影响大于空间位置上的横向坡度,造林密度影响程度低于土壤因素。③模型结果在广西其他地区同树种泛化测试精度R2为0785,P值为22E-16,符合检验标准,说明该模型针对广西部分地区速生桉树种生产力预估结果较好,可以为林场造林收获预估提供依据。  相似文献   

12.
Extracting information about saline soils from remote sensing data is useful, particularly given the environmental significance and changing nature of these areas in arid environments. One interesting ease study to consider is the delta oasis of the Weigan and Kuqa rivers, China, which was studied using a Landsat Enhanced Thematic Mapper Plus (ETM+) image collected in August 2001. In recent years, decision tree classifiers have been successfully used for land cover classification from remote sensing data. Principal component analysis (PCA) is a popular data reduction technique used to help build a decision tree; it reduces complexity and can help the classification precision of a decision tree to be improved. A decision tree approach was used to determine the key variables to be used for classification and ultimately extract salinized soil from other cover and soil types within the study area. According to the research, the third principal component (PC3) is an effective variable in the decision tree classification for salinized soil information extraction. The research demonstrated that the PC3 was the best band to identify areas of severely salinized soil; the blue spectral band from the ETM+ sensor (TM1) was the best band to identify salinized soil with the salt-tolerant vegetation of tamarisk (Tamarix chinensis Lour); and areas comprising mixed water bodies and vegetation can be identified using the spectral indices MNDWI (modified normalized difference water index) and NDVI (normalized difference vegetation index). Based upon this analysis, a decision tree classifier was applied to classify landeover types with different levels of soil saline. The results were checked using a statistical accuracy assessment. The overall accuracy of the classification was 94.80%,which suggested that the decision tree model is a simple and effective method with relatively high precision.  相似文献   

13.
森林类型识别技术是遥感分类中的重点和难点,采用面向对象的遥感影像分类方法是实现森林类型分类的新方法。资源3号遥感影像可为森林类型提取提供新方向。以资源3号遥感影像作为基础研究数据,采用面向对象的分类方法,选择分形网络演化法进行多尺度分层分割,并结合典型地物的光谱特征、纹理特征、几何特征以及植被指数,构建了适用于森林类型提取的决策树模型,并与分割尺度不同的支持向量机分类方法进行比较分析。结果表明:多层分割的决策树分类方法分类精度高于单层分割的支持向量机分类方法,分类精度分别提高了6.1%和12.5%。说明建立多层分割的决策树分类方法适用于森林类型的分类研究。  相似文献   

14.
  目的  获取更高效、准确的土地利用自动分类方法,为后续的高原山区土地利用分类研究提供理论支撑。  方法  选取中国典型的高原山区云南省大理市为研究区域,以Sentinel-2A影像为对象,提出一种面向对象特征的决策树分类方法,并将此方法分类结果与传统的ISODATA法和最大似然法土地利用分类结果进行对比。  结果  ①面向对象特征的决策树方法分类结果在空间分布和各地类的面积统计方面都优于ISODATA法和最大似然法,与研究区实际土地利用面积数据更为接近;②在大理市,最大似然法在水体和林地的提取上适用性较好,而面向对象特征的决策树分类方法在农田、草地、建设用地和其他这些地类的区分上适用性更强,且在冰川积雪的提取上也有更好的提取效果;③相比与传统的ISODATA法和最大似然法分类结果精度,面向对象特征的决策树分类方法可进一步提高分类精度,总体分类精度可达90.20%,Kappa系数为87.95%。  结论  相较于传统的分类方法,先粗分类再进一步细分类的分类思想,可避免区域之间的混淆问题。面向对象特征与决策树相结合的组合分类方法在高原山区有着更好的适用性,可以有效提高高原山区分类精度。图3表7参26  相似文献   

15.
基于决策树的农业气象灾害等级预测模型   总被引:3,自引:1,他引:2  
司巧梅 《安徽农业科学》2010,38(9):4925-4927
在讨论数据挖掘技术的基本概念、决策树方法的基础上,结合牡丹江地区部分县区风雹灾害数据样本,采用决策树C4.5分类算法,建立了农业气象灾害等级决策树预测模型。通过该预测模型可预测各地直接经济损失程度,为该领域的数据挖掘提供了合理的挖掘模式,并得出了有效的分析结论。  相似文献   

16.
为确定在大别山地区采集到的一个Callosciurus属松鼠样本的物种归属及分类地位,利用分子遗传学手段的对所采样本进行研究。采用Cyt b基因结合PCR技术、测序技术及BLAST技术分析样本的遗传信息,再通过MEGA建树确定样本的分类地位。BLAST分析结果显示该物种的遗传信息与赤腹松鼠序列相似程度最高,而建树结果显示与赤腹松鼠聚为同一支,从而确定该物种应为赤腹松鼠,属哺乳纲、啮齿目、松鼠科、丽松鼠属。  相似文献   

17.
作物物候期识别是农情遥感监测的重要内容,及时准确识别作物物候期,对有效评估作物生长趋势、提高农情信息化管理水平有重要意义。提出了基于时间序列全极化合成孔径雷达(polarimetric synthetic aperture radar, PolSAR)数据结合决策树模型的油菜物候期识别方法。首先,采用3种极化分解方法提取PolSAR极化参数,并分析各极化参数对油菜物候期的动态响应规律;其次,基于各极化分解方法提取的参数建立决策树模型,并对油菜物候期进行分类识别;最后,采用基于混淆矩阵的方法对油菜物候期识别结果进行精度评价。采用5期Radarsat-2 PolSAR数据和地面物候观测数据进行实验验证。结果表明:提取的PolSAR参数中对物候期变化较为敏感的参数有H/A/alpha分解中的散射角(Alpha)、特征值(L2、L3)、伪熵(P2)、目标方位角(Beta1)参数,Freeman-Durden分解中的地面散射(Ground)和奇次散射(Odd)参数,Yamaguchi分解中的奇次散射(Odd_Y)和螺旋体散射(Helix)参数;决策树模型对油菜物候期识别结果较为准确,识别结果中组合3种极化分解方法提取参数建立的原始决策树模型分类总体精度最高,达94%。总体上,PolSAR极化分解参数对油菜物候期变化比较敏感,决策树模型能有效识别油菜物候期。  相似文献   

18.
精准农业观测卫星-高分六号卫星(GF6)增加了4个特殊波段,更加有效地反映了植被特有的光谱特性,为植被应用研究提供更为详细的地物光谱信息。为了分析GF6数据在植被识别能力上的优越性,比较了GF6号新增波段(红边1、红边2、黄边、紫边波段)和高分数据传统波段对有林地识别精度的影响。结果表明:GF6新增波段对有林地快速识别的精度达到97.67%,Kappa系数为0.95,比GF数据4波段对有林地的识别精度提高了3.35%,Kappa系数提高了0.08。CART自适应特征和阈值选择决策树算法比人工决策树分类算法对有林地识别精度有显著增加,精度由88.81%提高到97.67%,Kappa系数由0.78提高到0.95。GF6数据新增特殊波段结合CART自适应特征和阈值决策树算法对有林地具有快速优越的识别能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号