期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

郑斌《吉林农业科技学院学报》2008,17(3):43-45

关联规则是数据挖掘中一种简单但很实用的规则,文章简要介绍了关联规则的概念及其分类,以及当前关联规则的挖掘算法研究情况,重点介绍了经典的基于Apriori类的候选生成方法和基于FP-tree的方法,并针对当前改进的挖掘算法进行简要说明,最后提出关联规则将来的发展方向。相似文献

2.

基于FP—tree的最大频繁项集挖掘新算法

彭慧伶舒云星武新《湖南农业大学学报(自然科学版)》2009,(2)

研究挖掘关联规则的一个重要工作就是找出所有的频繁项集.基于FP-tree的最大频繁项集挖掘算法要多次生成大量的FP-tree,并且需要对其多次遍历,消耗了大量的时间.针对以上缺点,提出一种基于FP-tree并利用数组和矩阵技术进行优化的最大频繁项集挖掘算法(Mining Maximal Frequent Itemset,简称MMFI),它既减少创建FP-tree的数量,又节省遍历FP-tree的时间,实验证明本算法是有效的. 相似文献

3.

基于云计算的柑橘市场信息预测平台构建研究

《中国农业信息》2016,(14)

文章设计了一种基于Hadoop的柑橘市场信息预测平台,根据往年的柑橘产量、柑橘消费量、进出口量、库存量等,通过Apriori算法在云计算平台Hadoop下实现对影响柑橘价格的各类影响因素和柑橘市场信息之间的关联分析,根据得出的关联性和置信度预测柑橘价格和产量,以此构建柑橘市场信息预测平台,对柑橘价格和产量进行预测。相似文献

4.

基于关联规则的图书馆个性化服务研究

苏坤《农业图书情报学刊》2010,22(6):246-249

关联规则挖掘技术是一种新兴的数据处理技术,其算法及应用在图书馆中起着非常重要的作用。Apriori算法是关联规则挖掘的经典算法,在分析Apriori算法的基础上,提出利用FP-tree生成树技术来减少候选集的数量,克服Apriori算法的弱点,以提高图书馆个性化服务的效率。相似文献

5.

一种改进的基于SQL的频繁项集挖掘算法

周张兰詹泽梅邱林《长江大学学报》2008,5(4)

数据挖掘中的关联规则应用广泛,而频繁项集的产生又是关联规则挖掘最重要的一步。讨论了关系数据库中利用Apriori算法实现频繁项集挖掘的问题,并借助AprioriTid算法思想,提出了一种改进的基于SOL的频繁项集挖掘算法。试验证明,在事务数据量和支持度变化的情况下,此算法性能稳定且执行效率较好。相似文献

6.

增量式匿名化的隐私保护数据挖掘算法

欧立奇王红英罗小东李盼刘瀚《山东农业大学学报(自然科学版)》2019,(2)

在匿名隐私保护系统中增量式匿名化隐私保护数据具有容量大和分散性强的特点,导致挖掘的聚类性不好。提出一种基于互信熵特征提取的增量式匿名化隐私保护数据的挖掘算法,在云计算平台下分析增量式匿名化隐私保护数据的存储结构模型,结合闭频繁项集特征重组方法进行增量式匿名化隐私保护数据的离散化特征重构,在重构的Hadoop云计算平台中进行增量式匿名化隐私保护数据的关联特征提取,采用增量式支持向量机算法对提取的数据特征进行分类识别,根据分类结果实现增量式匿名化的隐私保护数据挖掘。仿真结果表明,采用该方法进行匿名化的隐私保护数据挖掘的准确性较高,特征提取精度较好,收敛性较强。相似文献

7.

关联规则中Apriori算法改进的研究

卢露丁才昌《长江大学学报》2009,(2):241-243

研究基于大型销售数据库的关联规则挖掘问题,分析和讨论了挖掘关联规则中Apriori算法,对其实现思想进行描述,并针对该算法的缺点提出了2种改进算法。相似文献

8.

一种基于频度的空间关联规则挖掘算法

简友光李岩《仲恺农业技术学院学报》2008,21(1):38-41

针对传统关联规则挖掘算法没有考虑空间数据的"空间自相关性"和空间关联规则挖掘的自身特点,提出了新的基于频度的空间关联规则挖掘算法,提高了空间关联规则挖掘的效率,并以广州市南沙地区的遥感图像分类结果为例进行关联规则挖掘实验,结果证明新的算法可行性. 相似文献

9.

一种基于Hadoop架构的网络舆情热点话题挖掘方法

周建华《河北北方学院学报(自然科学版)》2014,(6):19-24

为解决在海量数据中实时、精准挖掘网络舆情热点话题的问题,提出一种基于Hadoop的网络舆情数据分析模型。对于话题发现核心模块,给出一种WCGFMR网络舆情热点话题挖掘算法,采用Map(映射)和Reduce(规约)规则进行舆情文本特征分组加权策略。实验结果表明,采用基于Hadoop架构的WCGFMR算法进行热点话题挖掘,热点话题的平均召回率达到85.32%,平均话题类纯度达到95.36%。随舆情数据集增大到2GB后,在Map数一定的条件下,多任务数Reduce执行时间相比少任务数Reduce大大缩短,数据中热点话题挖掘速度显著提高。相似文献

10.

一种新的关联规则抽样算法 总被引：1，自引：0，他引：1

秦如新陈静冯一宁《中国农业大学学报》2007,12(3):85-88

针对目前经典的关联规则挖掘Apriori算法需对数据库多次扫描费时多计算量大,而抽样扫描会造成挖掘精确度下降等问题,采用控制样本频繁项目集的方法,利用频繁1项集进行抽样处理,对关联规则挖掘的抽样操作和精度控制进行研究,提出了基于抽样操作的关联规则挖掘算法——HAC算法。理论分析及性能试验结果表明:HAC算法能够有效缩减数据库规模,至少少扫描数据库1次,提高了关联规则挖掘的效率,同时其计算精度不受影响。相似文献