首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 125 毫秒
1.
数据挖掘中的关联规则应用广泛,而频繁项集的产生又是关联规则挖掘最重要的一步。讨论了关系数据库中利用Apriori算法实现频繁项集挖掘的问题,并借助AprioriTid算法思想,提出了一种改进的基于SOL的频繁项集挖掘算法。试验证明,在事务数据量和支持度变化的情况下,此算法性能稳定且执行效率较好。  相似文献   

2.
关联分析是数据挖掘的本质体现,关联规则挖掘就是寻找给定的大量数据项集之间存在的某种规律的过程。Apriori算法是关联规则中最重要的一种挖掘频繁项集的算法,但是它也存在一定的不足。目的为了提高挖掘效率。方法采用实验的方法,在经典Apriori算法的基础上进行改进。结果证明改进的Apriori算法性能优于经典的Apriori算法,尤其是在交易事务条数比较多的情况下,效果更加明显。结论是改进的算法在计算支持度个数时,每次不需要扫描全部数据库,只需要在精简的数据库表中扫描各项所在的行就可以了,大大节省了时间;支持度计数的统计也比较容易,也不会产生过多的冗余,可以在很大程度上降低挖掘的复杂度,提高挖掘算法的效率。  相似文献   

3.
关联规则挖掘技术是一种新兴的数据处理技术,其算法及应用在图书馆中起着非常重要的作用。Apriori算法是关联规则挖掘的经典算法,在分析Apriori算法的基础上,提出利用FP-tree生成树技术来减少候选集的数量,克服Apriori算法的弱点,以提高图书馆个性化服务的效率。  相似文献   

4.
关联规则是数据挖掘中一种简单但很实用的规则,文章简要介绍了关联规则的概念及其分类,以及当前关联规则的挖掘算法研究情况,重点介绍了经典的基于Apriori类的候选生成方法和基于FP-tree的方法,并针对当前改进的挖掘算法进行简要说明,最后提出关联规则将来的发展方向。  相似文献   

5.
关联规则中的Apriori挖掘算法改进   总被引:3,自引:0,他引:3  
关联规则挖掘是数据挖掘研究的一项重要内容。然而基于候选集的Apriori算法效率低下。针对此缺陷,提出了一种NApriori算法,该算法利用频繁1项集重新组织事务数据库来挖掘关联规则。此方法仅需扫描数据库2次,且避免了Apriori算法繁琐的连接和删除步骤,从而提高了挖掘效率。  相似文献   

6.
为了解决负关联规则挖掘中海量项集问题和一级剪枝策略效率不高的问题,本文在研究关联规则相关性和兴趣度的基础之上,提出了一种计算项集兴趣度的数学模型,引入了有趣2项集的概念,设计了基于兴趣度的项集剪枝和关联规则剪枝的二级剪枝策略及实现二级剪枝的正负关联规则挖掘算法。  相似文献   

7.
一种新的关联规则抽样算法   总被引:1,自引:0,他引:1  
针对目前经典的关联规则挖掘Apriori算法需对数据库多次扫描费时多计算量大,而抽样扫描会造成挖掘精确度下降等问题,采用控制样本频繁项目集的方法,利用频繁1项集进行抽样处理,对关联规则挖掘的抽样操作和精度控制进行研究,提出了基于抽样操作的关联规则挖掘算法——HAC算法。理论分析及性能试验结果表明:HAC算法能够有效缩减数据库规模,至少少扫描数据库1次,提高了关联规则挖掘的效率,同时其计算精度不受影响。  相似文献   

8.
研究基于大型销售数据库的关联规则挖掘问题,分析和讨论了挖掘关联规则中Apriori算法,对其实现思想进行描述,并针对该算法的缺点提出了2种改进算法。  相似文献   

9.
由于大数据具有多样性的特点,在数据挖掘过程中采用单一最小支持度会出现较多冗余规则,造成挖掘效率不高等问题,该文提出一种基于多最小支持度关联规则改进算法.通过给每一项目设置单独的支持度阈值,构建多最小支持度模式树,利用最小频繁项目作为节点筛选标准,进行冗余节点删除;在挖掘频繁项集的过程中利用排序向下闭合的性质,删除冗余的候选项集,同时能够自动停止向下挖掘,从而快速直接地得到所有频繁项集,并且不需要多次扫描数据库.实验结果表明,改进算法能够提高挖掘效率,节省计算时间.  相似文献   

10.
本文以笔者所在院校的学生数据为依据,对教学质量评价系统中的数据进行挖掘,分析了关联规则算法中Apriori算法,并针对传统算法的弊端,在已有改进算法的基础上,提出了一种基于最小关联规则集的改进算法,以此方法对教师的基本信息、教学方法与教学评估结果的关联关系进行分析。  相似文献   

11.
探讨了空间关联规则,利用移动计算中基于Apriori算法的空间关联规则提取的例子,详细介绍了经典算法Apriori算法在空间关联规则中的应用,并对空间数据挖掘的发展进行了展望。  相似文献   

12.
一个不需要产生候选集频繁集挖掘算法的研究   总被引:2,自引:0,他引:2  
FP-growth算法是一个频繁集产生算法,与一般的类似于Apriori的频繁集产生算法相比。FP-growth的优点在于它不需要产生大量的候选集,因而在时间和空间上都有很好的效率。从不同角度对FP-growth算法进行了详细的研究,并与经典算法Apriori在性能上作了分析对比。  相似文献   

13.
朱玉梅 《农学学报》2016,6(11):23-26
为了快速准确地掌握棉花虫害发生趋势,提高虫情测报的时效性和准确性,采用Apriori算法数据挖掘关联规则,对棉花上的3种害虫棉铃虫、棉叶螨、棉蚜的发生趋势进行综合分析。通过Apriori算法寻找出了气候因素与棉花三大害虫的发生发展有密切的关系,尤其气温变化直接影响到棉花害虫的发生种类、发生期及发生量。联规则数据挖掘技术,在处理大量农业信息数据中起着非常重要的作用,Apriori算法在棉花病虫测报工作中将是一项新的技术,具有非常广泛的应用前景。  相似文献   

14.
为了方便读者能在海量的图书资源中快速有效的找到需要的书籍,利用Map Reduce框架分块处理,结合关联分析Apriori算法,将数据挖掘技术应用到图书管理系统中。但需要多次扫描数据库和产生大量候选集,对Hadoop平台处理速度带来了巨大挑战,因此,针对传统的Apriori算法,提出基于内存计算、弹性分布式数据集处理的Spark平台为读者推荐书籍,指引读者的借阅行为。  相似文献   

15.
时态数据库周期规律与关联规则的挖掘   总被引:6,自引:0,他引:6  
提出了一种简单有效、抗干扰的周期规律挖掘算法;研究了关联规则提取过程中的连续属性离散化,并用Apriori算法发现有效的规则。对电信话务量时态数据库的挖掘测试结果表明,该算法实现较简单,执行效率较高,具有实用性和有效性。  相似文献   

16.
为了提高入侵的检测效率,提出了一种基于数据挖掘的改进的Snort系统.该系统充分利用数据挖掘的入侵检测优点,采用改进的Apriori算法,在Snort原系统基础上增加一个数据异常检测模块,改进了Snort存在的缺点,提高了检测率.通过模拟实验验证和实际网络环境应用分析,得出该系统比原Snort系统具有更高的检测性能,能检测未知的网络入侵,提高计算机系统的安全性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号