共查询到18条相似文献,搜索用时 62 毫秒
1.
关联分析是数据挖掘的本质体现,关联规则挖掘就是寻找给定的大量数据项集之间存在的某种规律的过程。Apriori算法是关联规则中最重要的一种挖掘频繁项集的算法,但是它也存在一定的不足。目的为了提高挖掘效率。方法采用实验的方法,在经典Apriori算法的基础上进行改进。结果证明改进的Apriori算法性能优于经典的Apriori算法,尤其是在交易事务条数比较多的情况下,效果更加明显。结论是改进的算法在计算支持度个数时,每次不需要扫描全部数据库,只需要在精简的数据库表中扫描各项所在的行就可以了,大大节省了时间;支持度计数的统计也比较容易,也不会产生过多的冗余,可以在很大程度上降低挖掘的复杂度,提高挖掘算法的效率。 相似文献
2.
在关联规则挖掘中,通常使用的是支持度-置信度框架来挖掘有趣知识。对支持度、置信度阈值进行分析和研究,发现此框架挖掘的关联规则不能够得到有效的强关联规则,导致挖掘效率降低。为此提出一种有效的信息熵-依赖度框架作为关联规则的衡量准则,实验表明此方法更准确、有效。 相似文献
3.
关联规则中的Apriori挖掘算法改进 总被引:3,自引:0,他引:3
关联规则挖掘是数据挖掘研究的一项重要内容。然而基于候选集的Apriori算法效率低下。针对此缺陷,提出了一种NApriori算法,该算法利用频繁1项集重新组织事务数据库来挖掘关联规则。此方法仅需扫描数据库2次,且避免了Apriori算法繁琐的连接和删除步骤,从而提高了挖掘效率。 相似文献
4.
关联规则挖掘算法Apriori在学生成绩分析中的应用 总被引:1,自引:0,他引:1
崔学文 《河北北方学院学报(自然科学版)》2011,27(1):44-47
课程自身、课程与课程之间及课程设置与课程成绩之间存在着一定的联系,通过比较分析可以发现学生成绩背后所隐藏的有价值信息.详细介绍了关联规则挖掘算法Apriori在学生成绩分析中的具体应用,给出了挖掘实施的流程图,以实例的方式深入探讨了数据挖掘技术的实现过程.通过关联规则的算法理论,最终得出有实际价值的规则及结论,从而实现... 相似文献
5.
6.
由于大数据具有多样性的特点,在数据挖掘过程中采用单一最小支持度会出现较多冗余规则,造成挖掘效率不高等问题,该文提出一种基于多最小支持度关联规则改进算法.通过给每一项目设置单独的支持度阈值,构建多最小支持度模式树,利用最小频繁项目作为节点筛选标准,进行冗余节点删除;在挖掘频繁项集的过程中利用排序向下闭合的性质,删除冗余的候选项集,同时能够自动停止向下挖掘,从而快速直接地得到所有频繁项集,并且不需要多次扫描数据库.实验结果表明,改进算法能够提高挖掘效率,节省计算时间. 相似文献
7.
应用数据挖掘中关联规则的Apriori算法对玉米产量信息进行数据分析。利用最小支持度和最小置信度挖掘出频繁项集,从而寻找其中存在的关系和规则。挖掘的信息为:玉米生育期内降水量高,平均气温高,则产量高;反之,平均气温偏低,总降水量偏低,则产量低,十分可信。 相似文献
8.
《仲恺农业工程学院学报》2017,(4)
针对Apriori算法的性能瓶颈问题,提出了一种双压缩Apriori(Apriori double compression,Apriori_DC)算法.该算法通过不断压缩事务数据库,减少事务记录数和数据项,并通过缩减频繁项集从而减少下一步候选频繁项集的数量,最终实现提高算法效率.试验验证表明:在支持度相同而数据量不同,以及数据量相同而支持度不同时,Apriori_DC算法均优于Apriori算法,且在Apriori_DC算法执行过程中,事务数据库的数据量不断缩小. 相似文献
9.
10.
研究基于大型销售数据库的关联规则挖掘问题,分析和讨论了挖掘关联规则中Apriori算法,对其实现思想进行描述,并针对该算法的缺点提出了2种改进算法。 相似文献
11.
在关联规则挖掘研究中,为了在产生候选频繁项时减少算法存在的重复计算和冗余候选项,为了在计算支持数时减少扫描事务数据库的次数,提出了一种基于序列数的关联规则挖掘算法,其关联规则适合挖掘任何长度.该算法用事务属性的布尔约简法,将传统事务数据转换成二进制数,然后用数字的递增和递减两种方式双向搜索候选频繁项;算法通过序列数的度来计算支持数,实现一次扫描数据库,有效地提高了算法的效率. 相似文献
12.
数据挖掘中关联规则的小生境遗传算法 总被引:1,自引:0,他引:1
根据关联规则挖掘的要求与特点,提出了一种新的基于小生境遗传算法的关联规则挖掘方法,该算法可以有效解决传统遗传算法搜索过早收敛的缺陷,实验结果显示,该方法能高效地解决关联规则挖掘问题。 相似文献
13.
量化分析课程之间的内在联系对于正确评价教学效果、指导学生如何学习以及在制定相应的预警规则方面有重要意义。以学生往年课程成绩数据为研究对象,应用自组织映射方法对其进行离散化,并应用Apriori算法测度在不同支持度和置信度下的各课程之间的关联关系,建立课程的关联关系模型。结果表明,基于SOM和Ariori算法的关联规则方法在挖掘多门课程之间的内在关联模式方面发现有较好的应用价值,为创建学生成绩预警因子提供参考。 相似文献
14.
15.
提出在设计快速有效的多层关联规则算法时,首先由专家给出每个抽象层次的最小支持度阈值,然后通过记录用户反馈来调整不同层次的最小支持度阈值的方法.该方法在一定程度上克服了固定阈值对提取有趣关联模式的主观影响,使阈值的设定趋于客观和合理,体现了个性化推荐的特点. 相似文献
16.
[目的/意义]数字社区已经成为企业高效管理用户的一种方式,用户行为信息以及用户的客户生命周期价值对数字社区的用户偏好挖掘具有重要意义。且现有的数字社区研究缺乏对用户价值和未来偏好挖掘的研究。[方法/过程]针对数字社区的用户群体,本文提出基于客户生命周期价值CLV (Customer Lifetime Value,CLV)的偏好挖掘模型CLV-PM(CLV-Preference Mining,CLV-PM)。首先,为反映用户真实偏好,基于用户行为信息,借助RFM模型和K-Means++算法挖掘用户群体特征,生成用户价值类别标签;其次,为考虑用户时序性和差异性以及增强模型对偏好的认知,利用用户CLV构建用户-评分矩阵,并借助协同过滤算法挖掘用户预测偏好;最后,绘制数字社区目标用户的用户偏好画像。[结果/结论]“微信社群”管理平台的用户数据集中,可划分为重要价值用户、低价值用户、回流用户和重要挽留用户4种用户价值类别;目标用户16254为重要价值用户,采取“留存和维持”为主的运营策略;历史偏好为欢乐跳一跳、秒杀等活动,预测偏好为飞行棋大作战、猜码图等活动,目标用户偏好画像为数字社区运营和维护... 相似文献
17.
周芳 《河北北方学院学报(自然科学版)》2015,(1):15-18
物联网的出现为人们带来了诸多有利之处,人们在利用物联网的过程中会产生海量的数据,这些数据的不断增多加大了用户从中获取有用信息的难度,因此,物联网海量数据挖掘一直是研究的热点,面对物联网海量业务数据如何能够快速进行分析、处理、存储、挖掘,以实现有价值信息的快速提取,并服务于物联网商业决策,这是亟待解决的主要问题。将基于关联规则Apriori算法设计物联网海量数据挖掘系统。 相似文献
18.
在考虑现实生活中用户对交通信息认识程度不一致的基础上,研究了双参数下的随机用户平衡分配问题,给出了等价的数学规划模型,证明了模型解的等价性与惟一性,设计了求解算法,并用算例进行了计算分析。 相似文献