首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
研究基于大型销售数据库的关联规则挖掘问题,分析和讨论了挖掘关联规则中Apriori算法,对其实现思想进行描述,并针对该算法的缺点提出了2种改进算法。  相似文献   

2.
已有的关联规则算法研究的对象通常是基于单一类型属性的关系表,算法的实际应用范围受到挖掘对象属性类型的限制。在对基于熵值离散法的量化关联规则进行改进的基础上,提出了面向混合属性关系表的关联规则挖掘思想,并对其应用于股票信息的关联规则分析做出了阐述。试验证明改进后的算法是可行的、有效的。今后还可对不同时间段、不同置信度、不同支持条件下的股票信息中蕴涵的关联规则进行研究,并进行相应的验证与修改。  相似文献   

3.
推荐系统已经被广泛应用于日常生活的各个领域,粒关联规则适用于推荐系统的冷启动问题,但粒关联规则存在规则集冗余而干扰推荐的问题。为解决该问题,从粒的性质出发,结合极大频繁项集可以紧凑地表示频繁项集的特点,提出基于极大频繁项集的粒关联规则方法 (MGR算法)来改进粒关联规则算法。利用MovieLens数据集,在不同阈值条件下,对比改进算法与传统粒关联规则算法的规则数量、运行时间和推荐准确率之间的关系。试验表明,改进的算法规则数量减少约1/2,运行时间减少约2/3,在不同阈值和不同划分比例的条件下,改进算法的推荐准确率均高于传统算法。  相似文献   

4.
关联规则挖掘在课程相关分析中的应用   总被引:1,自引:0,他引:1  
本研究介绍了关联规则挖掘的基本概念,分析了经典的Apriori算法,提出一种改进的关联规则挖掘算法,解决了挖掘课程相关性关联规则的问题。改进算法的基本思想:①采用位图数据格式;②系统中会永久保留支持度为0的候选1项集和候选2项集,当系统需要运行时,首先采用数据库的过滤技术,可以很快得到频繁2项集。突破了这一瓶颈,系统运行速度将得到较大的提升。将该算法应用于课程相关性分析,实验结果表明改进的算法性能优于Apriori算法。  相似文献   

5.
入侵检测系统中的数据漏报和误报一直是困扰网络安全的问题,只有解决了这个问题才能真正提高网络安全性。通过研究加权关联规则挖掘算法,将关联规则算法应用到入侵检测系统的海量数据挖掘,研究一种基于改进加权关联规则算法的入侵检测系统,并给出了该系统的模型和流程结构,通过测试证实该模型可满足当前网络安全各项入侵检测系统的要求。  相似文献   

6.
关联规则是数据挖掘中一种简单但很实用的规则,文章简要介绍了关联规则的概念及其分类,以及当前关联规则的挖掘算法研究情况,重点介绍了经典的基于Apriori类的候选生成方法和基于FP-tree的方法,并针对当前改进的挖掘算法进行简要说明,最后提出关联规则将来的发展方向。  相似文献   

7.
在油气长输管道完整性管理领域引入数据挖掘中的关联规则技术,发现完整性数据中潜在的关联关系,充分发挥数据价值。通过对管道完整性数据关联规则挖掘流程进行研究,对经典Apriori算法中频繁项集生成效率进行优化,结合中国石油某管道开展完整性管理积累的外检测与内检测数据进行了关联规则挖掘,并对挖掘结果进行分析和解释。挖掘结果表明:通过关联规则技术可以发现管道本体缺陷与周边环境、本体属性数据之间潜在的关联关系。关联规则挖掘方法应用于管道完整性数据分析能够有效减少无兴趣规则的数量,发现潜在的管理重点,为长输管道完整性管理提供科学、准确的决策依据。(表1,参10)  相似文献   

8.
对地面多传感器的探测特性和工作原理进行了描述,再与数据融合算法中的理论相结合,分析研究了广泛使用的目标身份的识别算法贝叶斯推理与D-S证据理论,就地面传感器固有的特性进行比较,另外对地面目标跟着经常使用的模糊数据关联的算法、动态多因子方法以及联合概率数据的关联算法、最近邻域法于理论上进行了简单的分析。再与地面传感器检测特征结合对此类算法进行了比较,分析其优缺点。于普遍使用算法的基础上,改进了模糊数据关联的算法。  相似文献   

9.
农业灾害严重破坏了生物的多样性,对生态环境有巨大的影响。基于此,通过对关联规则以及采用关联规则对生物灾害的各因素进行分析,通过对频集算法的改进,找出农业灾害应急管理系统中的项集,为构建农业灾害应急管理系统提供数据支持。  相似文献   

10.
数据挖掘技术在高等学校决策支持中的应用   总被引:10,自引:0,他引:10       下载免费PDF全文
为有效利用高等学校教学管理工作多年来积累的大量数据,利用数据挖掘技术,对北京地区高等学校1996—2001年毕业生数据库(Beijing Graduation Database,BGD)进行了数据挖掘研究。采用多种数据预处理方法对原始BGD数据进行了处理,提出并利用附方法进行了属性构造;对关联规划挖掘常用的Apriori算法进行了改进,以此为基础根据实际需要设计并实现了关联规则挖掘系统;利用所实现的系统对GBD数据库进行挖掘分析,得到了有益于高等学校教学管理决策及毕业生就业指导的挖掘结果。  相似文献   

11.
土地评价中关联规则与C4.5规则的应用比较   总被引:3,自引:0,他引:3  
关联规则和C4.5规则能提高土地评价知识表达的可解释性和土地评价的有效性,克服传统土地评价方法中人为因素多的缺点。为对比关联规则和C4.5规则在应用中的差异,文章基于广东省土地评价数据库,在相同实验条件下进行了关联规则和C4.5规则的挖掘,并结合模糊判决算法分别建立了基于这2种分类规则的模糊分类器进行测试。结果表明,2种算法各有优缺点。其中关联规则具有更好的可支持排序标准、更客观的冗余规则去除算法以及更高的准确率;但其对数据属性要求比较高,挖掘速度也远不如C4.5规则;C4.5规则准确率略低,但其计算成本低、速度快。  相似文献   

12.
加权关联因子CF修正山羊疾病计算机诊断方法研究   总被引:2,自引:0,他引:2  
为改进计算机诊断方法的诊疗效率,以山羊为例,分析了疾病临床的关联性.在可信度知识规则表示方法中引入关联因子机制,用低值预测、高值预测、加权预测等算法预测了重权关联因子的可信度.结果表明:重权关联因子预测显著地改进了推理规则激活率,大大降低了漏诊率.  相似文献   

13.
探讨了空间关联规则,利用移动计算中基于Apriori算法的空间关联规则提取的例子,详细介绍了经典算法Apriori算法在空间关联规则中的应用,并对空间数据挖掘的发展进行了展望。  相似文献   

14.
数字化图书馆中包含数目庞大的藏书,其包含的数据量也是非常巨大的,如何有效地利用数字图书馆中的资源,增强图书馆的服务体验是一项急需解决的问题.分析了数据挖掘算法中的关联规则算法,并对数据挖掘中的Apriori算法进行了矩阵挖掘技术改进.  相似文献   

15.
一种新的关联规则抽样算法   总被引:1,自引:0,他引:1  
针对目前经典的关联规则挖掘Apriori算法需对数据库多次扫描费时多计算量大,而抽样扫描会造成挖掘精确度下降等问题,采用控制样本频繁项目集的方法,利用频繁1项集进行抽样处理,对关联规则挖掘的抽样操作和精度控制进行研究,提出了基于抽样操作的关联规则挖掘算法——HAC算法。理论分析及性能试验结果表明:HAC算法能够有效缩减数据库规模,至少少扫描数据库1次,提高了关联规则挖掘的效率,同时其计算精度不受影响。  相似文献   

16.
关联分析是数据挖掘的本质体现,关联规则挖掘就是寻找给定的大量数据项集之间存在的某种规律的过程。Apriori算法是关联规则中最重要的一种挖掘频繁项集的算法,但是它也存在一定的不足。目的为了提高挖掘效率。方法采用实验的方法,在经典Apriori算法的基础上进行改进。结果证明改进的Apriori算法性能优于经典的Apriori算法,尤其是在交易事务条数比较多的情况下,效果更加明显。结论是改进的算法在计算支持度个数时,每次不需要扫描全部数据库,只需要在精简的数据库表中扫描各项所在的行就可以了,大大节省了时间;支持度计数的统计也比较容易,也不会产生过多的冗余,可以在很大程度上降低挖掘的复杂度,提高挖掘算法的效率。  相似文献   

17.
针对传统关联规则挖掘算法没有考虑空间数据的"空间自相关性"和空间关联规则挖掘的自身特点,提出了新的基于频度的空间关联规则挖掘算法,提高了空间关联规则挖掘的效率,并以广州市南沙地区的遥感图像分类结果为例进行关联规则挖掘实验,结果证明新的算法可行性.  相似文献   

18.
校园大数据分析是目前大数据研究的重要领域,针对快速积累的高校学生考勤数据,传统的数据库技术以及数据分析手段已经不再适用,串行的计算方法很难在短时间内对大量的考勤数据给出分析结果,本文提出了一种基于Spark平台及相关技术进行考勤数据分析的方法。文中详细描述了数据并行处理的流程以及采用FPGrowth算法进行关联规则分析的方法,分析得到了学生课堂出勤率与课程安排的关联规则。并且比较了传统数据库技术与并行数据处理方式进行学生考勤数据分析的效率,该方法取得了较好的效果。  相似文献   

19.
提出了一种改进性的关联规则算法,对原有数据源进行预处理,清洗掉不满足经验型规则所要求的最少项目数的记录,得到源数据库的一个子集库;根据权重函数和可信度再次删除支持度较低的记录,从而降低了系统数据库的时间和空间复杂度;并将改进后的关联规则算法应用于文本聚类中,使数据库中问题更加准确地分类,使用户提出的问题更加快速定位,提高答疑速率。试验结果表明,该方案具有智能性、自我更新性能和提高答疑效率等优点。  相似文献   

20.
数据挖掘中的关联规则应用广泛,而频繁项集的产生又是关联规则挖掘最重要的一步。讨论了关系数据库中利用Apriori算法实现频繁项集挖掘的问题,并借助AprioriTid算法思想,提出了一种改进的基于SOL的频繁项集挖掘算法。试验证明,在事务数据量和支持度变化的情况下,此算法性能稳定且执行效率较好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号