共查询到10条相似文献,搜索用时 31 毫秒
1.
郑斌 《吉林农业科技学院学报》2008,17(3):43-45
关联规则是数据挖掘中一种简单但很实用的规则,文章简要介绍了关联规则的概念及其分类,以及当前关联规则的挖掘算法研究情况,重点介绍了经典的基于Apriori类的候选生成方法和基于FP-tree的方法,并针对当前改进的挖掘算法进行简要说明,最后提出关联规则将来的发展方向。 相似文献
2.
研究挖掘关联规则的一个重要工作就是找出所有的频繁项集.基于FP-tree的最大频繁项集挖掘算法要多次生成大量的FP-tree,并且需要对其多次遍历,消耗了大量的时间.针对以上缺点,提出一种基于FP-tree并利用数组和矩阵技术进行优化的最大频繁项集挖掘算法(Mining Maximal Frequent Itemset,简称MMFI),它既减少创建FP-tree的数量,又节省遍历FP-tree的时间,实验证明本算法是有效的. 相似文献
3.
4.
苏坤 《农业图书情报学刊》2010,22(6):246-249
关联规则挖掘技术是一种新兴的数据处理技术,其算法及应用在图书馆中起着非常重要的作用。Apriori算法是关联规则挖掘的经典算法,在分析Apriori算法的基础上,提出利用FP-tree生成树技术来减少候选集的数量,克服Apriori算法的弱点,以提高图书馆个性化服务的效率。 相似文献
5.
6.
在匿名隐私保护系统中增量式匿名化隐私保护数据具有容量大和分散性强的特点,导致挖掘的聚类性不好。提出一种基于互信熵特征提取的增量式匿名化隐私保护数据的挖掘算法,在云计算平台下分析增量式匿名化隐私保护数据的存储结构模型,结合闭频繁项集特征重组方法进行增量式匿名化隐私保护数据的离散化特征重构,在重构的Hadoop云计算平台中进行增量式匿名化隐私保护数据的关联特征提取,采用增量式支持向量机算法对提取的数据特征进行分类识别,根据分类结果实现增量式匿名化的隐私保护数据挖掘。仿真结果表明,采用该方法进行匿名化的隐私保护数据挖掘的准确性较高,特征提取精度较好,收敛性较强。 相似文献
7.
研究基于大型销售数据库的关联规则挖掘问题,分析和讨论了挖掘关联规则中Apriori算法,对其实现思想进行描述,并针对该算法的缺点提出了2种改进算法。 相似文献
8.
针对传统关联规则挖掘算法没有考虑空间数据的"空间自相关性"和空间关联规则挖掘的自身特点,提出了新的基于频度的空间关联规则挖掘算法,提高了空间关联规则挖掘的效率,并以广州市南沙地区的遥感图像分类结果为例进行关联规则挖掘实验,结果证明新的算法可行性. 相似文献
9.
周建华 《河北北方学院学报(自然科学版)》2014,(6):19-24
为解决在海量数据中实时、精准挖掘网络舆情热点话题的问题,提出一种基于Hadoop的网络舆情数据分析模型。对于话题发现核心模块,给出一种WCGFMR网络舆情热点话题挖掘算法,采用Map(映射)和Reduce(规约)规则进行舆情文本特征分组加权策略。实验结果表明,采用基于Hadoop架构的WCGFMR算法进行热点话题挖掘,热点话题的平均召回率达到85.32%,平均话题类纯度达到95.36%。随舆情数据集增大到2GB后,在Map数一定的条件下,多任务数Reduce执行时间相比少任务数Reduce大大缩短,数据中热点话题挖掘速度显著提高。 相似文献
10.
一种新的关联规则抽样算法 总被引:1,自引:0,他引:1
针对目前经典的关联规则挖掘Apriori算法需对数据库多次扫描费时多计算量大,而抽样扫描会造成挖掘精确度下降等问题,采用控制样本频繁项目集的方法,利用频繁1项集进行抽样处理,对关联规则挖掘的抽样操作和精度控制进行研究,提出了基于抽样操作的关联规则挖掘算法——HAC算法。理论分析及性能试验结果表明:HAC算法能够有效缩减数据库规模,至少少扫描数据库1次,提高了关联规则挖掘的效率,同时其计算精度不受影响。 相似文献