共查询到18条相似文献,搜索用时 78 毫秒
1.
频繁项集挖掘是关联规则挖掘的核心部分,目前大多数关于关联规则挖掘的研究都集中于如何提高频繁项集挖掘的效率,然而在实际应用中,决策者面对的是最终从频繁项集中生成的规则集,因此优化规则的生成过程及生成规则同样值得重视。本文提出频繁项集的子集树这一模式来生成关联规则,不仅简化规则的生成过程还可缩小决策者面对的规则集,更便于规则的增量更新。 相似文献
2.
本文利用模式矩阵对Apriori算法进行改进,提出一种基于模式矩阵匹配的新算法。它使扫描数据库的次数降为一次,同时小产生候选项目集而直接产生频繁项目集,并且存放辅助信息所需要的空间也少,从而使算法的时间复杂度和空间复杂度大大降低。试验结果表明算法正确高效。 相似文献
3.
针对传统关联规则挖掘算法没有考虑空间数据的"空间自相关性"和空间关联规则挖掘的自身特点,提出了新的基于频度的空间关联规则挖掘算法,提高了空间关联规则挖掘的效率,并以广州市南沙地区的遥感图像分类结果为例进行关联规则挖掘实验,结果证明新的算法可行性. 相似文献
4.
研究基于大型销售数据库的关联规则挖掘问题,分析和讨论了挖掘关联规则中Apriori算法,对其实现思想进行描述,并针对该算法的缺点提出了2种改进算法。 相似文献
5.
关联规则中的Apriori挖掘算法改进 总被引:3,自引:0,他引:3
关联规则挖掘是数据挖掘研究的一项重要内容。然而基于候选集的Apriori算法效率低下。针对此缺陷,提出了一种NApriori算法,该算法利用频繁1项集重新组织事务数据库来挖掘关联规则。此方法仅需扫描数据库2次,且避免了Apriori算法繁琐的连接和删除步骤,从而提高了挖掘效率。 相似文献
6.
郑斌 《吉林农业科技学院学报》2008,17(3):43-45
关联规则是数据挖掘中一种简单但很实用的规则,文章简要介绍了关联规则的概念及其分类,以及当前关联规则的挖掘算法研究情况,重点介绍了经典的基于Apriori类的候选生成方法和基于FP-tree的方法,并针对当前改进的挖掘算法进行简要说明,最后提出关联规则将来的发展方向。 相似文献
7.
分析研究关联规则挖掘经典算法Apriori和FP-Growth算法,发现其不足之处在于构建和遍历各自数据结构的时间长、内存消耗巨大,降低了算法在时间和空间方面的效率.针对2种算法的缺陷,提出了LK-Growth算法,该算法不再构建FP-Tree,而是构建单向线性链表组结构,能有效地缩短发现频繁模式的时间和节省内存空间开支.研究结果表明,LK-Growth算法的实用性强且挖掘效率更高. 相似文献
8.
关联规则挖掘算法Apriori在学生成绩分析中的应用 总被引:1,自引:0,他引:1
崔学文 《河北北方学院学报(自然科学版)》2011,27(1):44-47
课程自身、课程与课程之间及课程设置与课程成绩之间存在着一定的联系,通过比较分析可以发现学生成绩背后所隐藏的有价值信息.详细介绍了关联规则挖掘算法Apriori在学生成绩分析中的具体应用,给出了挖掘实施的流程图,以实例的方式深入探讨了数据挖掘技术的实现过程.通过关联规则的算法理论,最终得出有实际价值的规则及结论,从而实现... 相似文献
9.
提出一种基于矩阵加权关联规则的空间粒度聚类算法。该算法核心思想是根据文档特征向量矩阵提取文档的相似度,再在该关联规则算法上进行聚类来寻找相似关系的频繁项集。通过引入核函数,样本点被非线性变换映射到高维特征空间进行聚类,提高聚类性能。通过矩阵加权关联规则算法进行聚类。通过实验表明,在处理中小型文档时,该算法的精确度优于传统Apriori算法和K-mean算法;在处理大型文档时,该算法的时间复杂度小于传统的K-mean算法。 相似文献
10.
一个不需要产生候选集频繁集挖掘算法的研究 总被引:2,自引:0,他引:2
FP-growth算法是一个频繁集产生算法,与一般的类似于Apriori的频繁集产生算法相比。FP-growth的优点在于它不需要产生大量的候选集,因而在时间和空间上都有很好的效率。从不同角度对FP-growth算法进行了详细的研究,并与经典算法Apriori在性能上作了分析对比。 相似文献
11.
【目的】揭示隐含在奶牛营养分析结果数据中影响奶牛瘤胃乙酸/丙酸的关联关系和因素,为奶牛营养研究和奶牛养殖提供参考。【方法】选用奶牛营养分析结果的100条数据,应用改进的关联挖掘算法DMApriori算法,对奶牛营养分析结果中瘤胃乙酸/丙酸低于或高于正常值的情况进行了关联分析。【结果】饲喂一般牧草黑白花牛的瘤胃乙酸/丙酸低于正常值的可信度为70%;当前体质量在598~698 kg的奶牛多为黑白花牛,可信度为75%;日产奶量在10~20 kg的奶牛多为黑白花牛,可信度为70%;乳脂率在3%~4%的奶牛大多为黑白花牛,可信度为88%。【结论】通过对奶牛营养分析中的大量数据进行关联规则挖掘,提取蕴含在这些大量数据中有意义、有价值的信息,可以为奶牛营养研究和养殖的规划调整提供科学依据。 相似文献
12.
一种新的关联规则抽样算法 总被引:1,自引:0,他引:1
针对目前经典的关联规则挖掘Apriori算法需对数据库多次扫描费时多计算量大,而抽样扫描会造成挖掘精确度下降等问题,采用控制样本频繁项目集的方法,利用频繁1项集进行抽样处理,对关联规则挖掘的抽样操作和精度控制进行研究,提出了基于抽样操作的关联规则挖掘算法——HAC算法。理论分析及性能试验结果表明:HAC算法能够有效缩减数据库规模,至少少扫描数据库1次,提高了关联规则挖掘的效率,同时其计算精度不受影响。 相似文献
13.
目的 整理总结治疗化疗副作用手足综合征中药外用方剂的用药规律,对手足综合征中药辨证进行分析。方法 筛选基于PubMed数据库、万方数据知识服务平台、维普网、中国期刊全文数据库(CNKI)、中国生物医学文献数据库(CBM)收录的中药外治法治疗手足综合征的临床研究文献,对符合纳入标准的中药处方进行统计,采用频次分析、关联规则分析等数据挖掘方法进行用药规律分析。结果 共筛选55个外用中药治疗手足综合征的处方,涉及中药105味,总共出现频次497次。频数最高的药物为红花和桂枝(34次);药物功效使用频率最高的前5类为活血调经药、发散风寒药、清热凉血药、补气药、补血药;关联分析显示:二连规则前3名为:桂枝→白芍,桂枝→鸡血藤,红花→桃仁;三连规则常用的药物组合为当归、黄芪、桂枝,四连规则支持度最高为当归→黄芪+桂枝+红花。结论 本病病机为气血虚弱、营卫失和,日久可发展为淤血痹阻、热毒内蕴,外治法中药多用活血通络、温阳解表、清热凉血兼补益气血为主。 相似文献
14.
随着数字化程度的发展以及读者需求不断提高,迫切要求高校图书馆增强对信息的分析处理能力以及向读者提供更加个性化的信息服务。详细讨论了数据挖掘中关联分析技术在图书管理工作中的具体应用方法和实现过程,试图为管理者和读者提供一定的科学决策依据。 相似文献
15.
目的 总结刘丽芳教授诊疗乳腺增生症的临床用药经验并归纳探讨其遣方用药规律。方法 收集并整理刘丽芳教授临床辨证论治乳腺增生症处方,进行勘误后建立乳腺增生症遣方用药数据库,于数据库基础上运用软件集成数据挖掘方法,对所选处方进行用药频次统计、用药模式及配伍关联规则分析。结果 共纳入门诊病历处方197份,总用药频次为3349次,共使用61味药,17味核心药物,其中药物出现频次以理气药及活血药为主,处方中所出现药物归经分布多为肝、脾、心、肾等经,按出现频数四气分布依次为温、凉、寒、平,五味分布依次为苦、辛、甘;确定药物之间关联规则,进行统计分析后获得用药规律(模式)24条(其中对药模式19条、3味药模式5条),并得到新处方3个。结论 刘丽芳教授治疗乳腺增生症以辨证论治为基础,所采用药物以理气活血药、化痰散结药、养血健脾药为主,兼顾患者体质,注重整体审察,并辅之行气活血、化痰散结、养血健脾等治法,将病证结合贯穿于治疗的全过程。 相似文献
16.
通过访问农业专家在线系统网站的用户行为,运用Web挖掘理论和方法对农业网站日志进行关联规则和链接分析,将关联规则算法用于农业网站日志分析中,用户在同一次访问中访问不同栏目的相关性、用户在一段时间内频繁访问页面及访问栏目间的最短访问路径,提高了咨询服务效果,保证了农业专家在线系统信息资源的有效利用。 相似文献
17.
关联规则挖掘在课程相关分析中的应用 总被引:1,自引:0,他引:1
本研究介绍了关联规则挖掘的基本概念,分析了经典的Apriori算法,提出一种改进的关联规则挖掘算法,解决了挖掘课程相关性关联规则的问题。改进算法的基本思想:①采用位图数据格式;②系统中会永久保留支持度为0的候选1项集和候选2项集,当系统需要运行时,首先采用数据库的过滤技术,可以很快得到频繁2项集。突破了这一瓶颈,系统运行速度将得到较大的提升。将该算法应用于课程相关性分析,实验结果表明改进的算法性能优于Apriori算法。 相似文献
18.
廖梅娟 《农业图书情报学刊》2012,24(4):30-33
目前数据挖掘技术研究发展迅速,其实质是在海量数据中找出人们感兴趣的数据并以我们需要的某种形式呈现出来。高校图书馆特色数据库建设发展迅速,带来了极大便利。但是数据库信息量巨大,所以,运用数据挖掘技术对特色数据库数据集进行挖掘处理,将基于确信度的关联规则算法引入到特色数据库的建设中,从大量的数据中提取关键信息。 相似文献