首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
应用粗糙集与决策树相结合的数据挖掘方法评价吉林省某地的土壤地力等级.研究数据共有161条记录,16个属性,使用粗糙集对土壤属性进行约简,去除了5个土壤冗余属性,得到属性约简集;使用决策树方法对土壤数据建立决策树模型,得到了土壤评价的决策树模型,并提取了分类规则.实验表明:将粗糙理论与决策树相结合的数据挖掘方法能去除冗余属性,同时保留了原始数据的内部特点,相对于单-使用决策树方法,决策树规模减小,规则集较精简,提高了分类的效率.  相似文献   

2.
聚类、粗糙集与决策树的组合算法在地力评价中的应用   总被引:4,自引:1,他引:3  
陈桂芬  马丽  董玮  辛敏刚 《中国农业科学》2011,44(23):4833-4840
 【目的】地力评价方法大多数有一定的主观性,较少考虑土壤各属性间的依赖关系。论文旨在采用数据挖掘方法,寻求地力等级划分的新方法。【方法】结合农安县耕地调查数据,应用K-means聚类方法、Johnson粗糙集属性约简算法与C4.5决策树算法相结合的优化算法评价地力等级。【结果】使用K-means聚类方法,得到最佳学习样本数;使用粗糙集属性约简和决策树相结合的方法,去掉了冗余属性7个,决策树模型共有节点317个,其中叶节点个数为159个,生成规则159条,模型准确率为82.08%。与未聚类和未约简的方法相比,决策树结点个数减少41.62%。【结论】使用该组合算法,在保证模型准确率的同时,降低了算法的时间和空间复杂性,提高了挖掘效率。  相似文献   

3.
基于数据挖掘可视化技术,构造了一个决策树可视化系统模型,对数据挖掘中决策树可视化模型进行了分析与研究,其中主要实现了数据可视化、属性约简和决策树可视化模块。针对传统的决策树ID3算法偏向取值较多属性的缺点提出了一个算法,将多类问题转换成2类问题,避免了ID3算法形成的决策树过细,分类不够准确等问题。该算法产生的规则比ID3算法更加简捷,更加概括化,避免了规则中包含不关键的属性。  相似文献   

4.
一种基于粗糙集理论的特征选择方法   总被引:3,自引:3,他引:0  
目的 特征集中特征质量的好坏能够影响到文本分类的精度,所以选择一种好的特征选择方法对于文本分类的效果起着重要的作用.方法 粗糙集理论为研究不精确数据的分析、推理,挖掘数据间的关系、发现潜在的知识提供了有效的工具.提出了一种基于粗糙集的特征选择方法.结果 通过实验结果表明该方法利用粗糙集的约简理论降低了特征维数,同时保证了分类性能.使用该方法进行特征选择时比目前常用的特征选择方法获得较好的分类效果.结论 粗糙集的属性约简理论可以用在规则提取和特征选择上,利用粗糙集的属性约简理论进行特征选择时能够获得较理想的分类效果.  相似文献   

5.
数据挖掘是从数据库中抽取隐含的具有潜在应用价值得信息,进行数据挖掘的方法很多,其中基于粗糙集的数据挖掘方法简单可行。粗糙集是一种处理模糊和不确定性数据的工具,本文结合银行申请信用卡的实例利用粗糙集进行数据挖掘,消去冗余属性,抽取决策规则。  相似文献   

6.
【目的】基于水资源可再生的特点,将粗糙集理论引入到水资源可再生性评价中,建立区域水资源可再生性评价的准确方法。【方法】针对水资源系统信息的不确定性和不一致性以及水资源中经常遇到的群决策问题,将粗糙集理论和群决策特征根法相结合应用于水资源评价,即将粗糙集作为数据的预处理工具,先构造决策表,再用粗糙集进行属性约简,对约简后的指标集用多属性群决策的定量评价方法进行了评价。【结果】实例计算表明,因粗糙集能较好地处理不确定、不完备、不一致信息,故能得到更为准确、详细的评价结果。【结论】将粗糙集和群决策特征根法相结合用于水资源可再生性评价是可行的。  相似文献   

7.
针对粗糙集对于连续域属性决策表的处理能力差以及不容易获得模糊集之间关系等问题,提出一种把模糊集和粗糙集结合起来的连续型条件属性模糊规则约简算法。该算法首先引入三角隶属度函数将连续属性值转化为模糊值,并使用离散模糊神经网络方法获得数据集之间关系。实例验证表明,采用该算法,用户可以根据实际决策需要和领域知识更改阈值,从而获得满意的模糊规则结果。  相似文献   

8.
神经网络用于分割图像时需要大量的训练数据,由于数据量大,计算速度相当慢,不适合实时数据处理.基于此,将粗糙集理论与神经网络相结合,提出基于粗糙集的神经网络图像分割方法.利用粗糙集理论中的约简的计算方法,从图像属性中获取精简的规则,根据这些规则构造神经网络各层的神经元个数,并根据粗糙集理论中的属性重要性来修正神经网络的权值.实验结果表明,该方法抗噪能力强,提高了精度,在大大缩短网络训练时间的同时改善了分割效果,满足图像处理的实时性要求.  相似文献   

9.
【目的】使用数据挖掘算法实现多因子共同影响下的林地质量综合评价,探索林地质量与环境因子之间的非线性关系,为提高森林经营信息化水平提供技术支持。【方法】使用辽宁省抚顺市胡桃楸(Juglans mandshurica Maxim)森林资源小班数据,采用粗糙集算法筛选出与林地质量相关的重要因子,然后建立C5.0决策树,得出环境因子与林地质量间的非线性关系。【结果】影响胡桃楸林地质量的主要因子有坡度、坡向、坡位、海拔、下木种类、下木盖度、地被物种类、地被物盖度和土壤质地;以粗糙集方法选取的因子为输入变量的决策树模型规模小、复杂度低、决策规则简单,预测准确率达91.20%。【结论】本研究提出的林地质量等级预测和评价方法,能在保证模型准确率的同时降低算法的时间和空间复杂性,提高数据挖掘效率,并能克服一般林地质量评价中靠专家打分的局限性与主观性。  相似文献   

10.
分析了近似质量在提取非确定性规则方面的不足,并基于粗糙熵的预测成功度概念,结合时序数据特点,提出一种属性约简及规则提取策略.该策略在对时序数据进行属性约简时,采用粗糙熵与时间距离相结合的方法,使得最终得到的约简在时序方面是较优的,最后使用UCI数据库进行仿真实验,效果良好.该策略在工程领域处理时序数据方面有一定的应用价值.  相似文献   

11.
针对建设工程投标报价中标高金的确定这一多因素决策问题,提出了粗糙集理论(RS)与自适应模糊神经网络(ANFIS)集成的标高金决策方法.首先利用自组神经织网络(SOM)对决策系统中的连续属性值离散化后,通过粗糙集理论约简属性,去除冗余信息,计算出标高金决策系统的约简;根据这一约简,经过减法聚类获得模糊推理规则数目,确定ANFIS的初始结构,最后应用ANFIS对文章中30个典型国际工程案例的标高金进行计算和预测.研究结果表明,与一般BP神经网络相比,该方法网络规模大大减小,网络结构透明,学习速度更快,而且保持了较高的预测精度.  相似文献   

12.
基于粗糙集理论的板栗病害诊断研究   总被引:1,自引:0,他引:1  
粗糙集理论可以处理不确定性数据,特别在处理农业领域的不完备数据方面具有优势.论述了采用粗糙集方法获取板栗病害的诊断规则以及进行诊断推理的详细过程和方法,主要包括数.据预处理、属性约简、规则获取和诊断推理等.通过实验验证,该方法可以用于板栗的病害诊断,并且能够得到准确的诊断推理结果.  相似文献   

13.
针对水质预警指标复杂冗余问题,提出基于关联属性重要度的水质指标属性约简算法。以属性依赖度和属性重要性为基础,根据每个条件属性对决策属性影响程度,引入属性关联重要性概念进行约简操作。通过计算属性关联重要性,挖掘水质指标之间的相互影响程度,进一步判别决策属性对条件属性的分类强度,并以鲈养殖水质为实例进行算法解析,以UCI数据集进行实验验证,结果表明此算法在冗余属性约简方面是有效可行的。  相似文献   

14.
一种基于决策树算法的耕地地力等级评价   总被引:3,自引:0,他引:3  
以吉林省德惠市的图斑数据作为实验数据,选择有机质、全氮、速效磷、速效钾4个方面作为耕地地力等级的评价指标,利用数据挖掘中的决策树分类技术建立耕地地力等级评价模型.通过实验分析,得到的分级结果与实际情况基本一致,表明该方法对耕地地力等级评价具有有效性和可行性.  相似文献   

15.
粗糙集理论在土壤肥力评价指标权重确定中的应用   总被引:5,自引:0,他引:5  
【目的】土壤肥力是土壤诸多基本特性的综合反映,科学、合理、实用地评价土地肥力将为指导农业生产、土地利用规划和管理提供理论依据。其评价过程是一个无决策属性的多属性决策过程,而解决多属性决策问题的重要前提是各属性权重分配问题。【方法】确定指标权重的方法主要有主观赋权法和客观赋权法,然而,主观赋权法往往需要大量的先验知识,评价结果有一定的主观随意性,而且较少考虑评价指标之间的依赖关系;客观赋权法没有充分考虑到各参评因素对评价的重要度不同,统计数据有相关性也并不意味着两个事件具有因果联系。综合考虑主、客观赋权法各自的优缺点,利用粗糙集理论中知识约简和相对正域理论在消除冗余信息和处理不确定性信息等方面的优势,探究土壤肥力评价过程中一种主观和客观相结合的权重确定方法,并利用作物产量对评价结果进行验证。【结果】粗糙集理论在土壤肥力评价中的具体赋权思路包括:数据的离散化、土壤肥力综合等级的初步确定、属性值约简、等价类划分、属性重要度的计算和指标权重计算等步骤。以北京大兴区农田土壤样点的肥力评价对上述赋权思路进行实例分析,对比传统特尔斐法和粗糙集理论赋权结果发现,特尔斐法确定的土壤有机质、全氮、有效磷和速效钾等指标的权重分别为0.300、0.250、0.250和0.200,利用其评价得到的土壤综合肥力指数(IFI)与产量显著线性相关,R2为0.77,均方根误差(RMSE)为1.25;而粗糙集理论确定的土壤有机质、全氮、有效磷和速效钾等指标的权重依次为0.455、0.111、0.111和0.333,利用其评价得到的IFI与产量也显著线性相关,R2达0.83,RMSE为1.09,精度均较特尔斐法有了提高,其中RMSE相对精度提高值达12.80%。【结论】粗糙集理论在土壤肥力评价中的具体赋权思路基本是可行的,且相对于特尔斐法其确定出各指标权重更为合理、准确,可为土壤肥力评价及相关领域的评价提供一个有益的思路。  相似文献   

16.
[目的]探求粗糙集理论在遥感影像特别是农作物生长上的分类精度。[方法]采用数据挖掘和知识发现方法,重点分析了包括粗糙集理论在内的4种数据分类方法(粗糙集、代数集、自身集以及聚集),建立了分类模型流程。通过程序改化,对比了未经处理的TM影像分类精度和经过2次不同改化后的分类精度。[结果]在影像基本信息不变的基础下,采用改化后的粗糙集分类方法,可以得到分类精度更为细致的结果,尤其在地区地表起伏较大的且待分农作物种类小于5种的情况下效果更加明显。[结论]该研究为进一步利用数据挖掘技术来监测农作物生长提供理论依据。  相似文献   

17.
目的运用粗糙集理论对学生的成绩分析及数据挖掘,找出影响学生学习的因素.方法通过运用粗糙集理论对采集到的大学生学习过程中的大量数据进行属性重要度分析,对不必要的数据进行属性约简,从中得到影响学习效果的关键因素.结果通过研究粗糙集理论得出性格兴趣因素以及学校的软硬件条件对学生的学习有较大的影响;家庭经济因素、基础知识、教师水平等基本无影响或影响不大.结论该研究有利于在教学过程中有的放矢,改进与改善教学质量,提高教学效果.  相似文献   

18.
吴朗  胡红武 《安徽农业科学》2006,34(14):3487-3487,3537
利用粗糙集理论对不完备信息系统进行数据挖掘,构建了公务员素质的不完备信息系统下的粗糙集模型,提取了知识约简和决策规则。应用粗糙集理论能有效地刻划不完整、不确定、不精确和不一致等各种信息系统,从中发现隐含知识和潜在规律。  相似文献   

19.
粗糙集方法在金融及投资领域发挥着越来越大的作用,然而经典粗糙集理论不能发现偏好多属性决策表中与偏好属性相关的不相容性。本文基于优势粗糙集理论的知识约简算法,提出了基于优势关系的属性重要度约简算法,并构建了基于优势粗糙集的证券投资分析模型,针对中国上市公司财务数据为连续值、分布未知、含有偏好信息等特征,对证券样本进行综合排序,得到最终的综合排序和评价,并对算法进行有效性分析。  相似文献   

20.
基于数据挖掘的决策树算法应用研究   总被引:1,自引:0,他引:1  
数据挖掘是一种发现大量数据中潜在信息的数据分析方法和技术,已经成为关注的热点。决策树方法因其简单、直观、准确率高等特点,在数据挖掘及数据分析中得到了广泛的应用。本文使用数据挖掘的C4.5算法对UCI数据库中的蘑菇数据构建决策树模型,给出了蘑菇可食用或有毒的决策。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号