共查询到20条相似文献,搜索用时 15 毫秒
1.
研究基于访问日志挖掘的高校综合信息门户页面推荐。从高校综合信息门户服务器日志中获取用户日志数据,对日志数据中的“脏”数据进行预处理,通过改进的K-means聚类算法将用户浏览兴趣度数据集划分为多个具有相近兴趣度的用户集合,凭此为用户提供个性化的页面推荐。实验结果表明,在高校综合信息门户页面推荐方面具有不错的效果。 相似文献
2.
通过Web 日志挖掘与内容挖掘的有机结合,给出了一种个性化远程教学系统的模型,通过分析学生的兴趣给出相应的导航推荐,为学生提供个性化的教学服务,使得整个教学活动成为丰富有机的整体. 相似文献
3.
4.
5.
叶良艳 《河北北方学院学报(自然科学版)》2014,(5):18-20
采用基于粗糙集的WEB日志挖掘技术,对web日志数据进行预处理,然后利用粗糙集理论分析和处理该数据,最终发现其潜在的规律,发掘用户行为,为个性化网站设置提供依据。粗糙集的核心是属性约简,这里采用遗传算法约简。 相似文献
6.
在农业网站日志挖掘知识的基础上,重点对运行8年的东北农业大学农业专家在线网站进行Web日志挖掘研究,对运行以来积累的海量Web日志数据进行有效的预处理,并采用SAS数据挖掘模块对日志数据进行关联规则挖掘、链接分析,利用挖掘的结果对网站信息构建合理性进行评估及改造,逐渐在个性化服务、改进系统性能、站点内容修改、商业智能等方面提供科学的理论基础,使之成为中国最大的农业免费咨询类网站,而且可以利用结论对其他农业信息系统的构建及运行等方面提供一定的借鉴作用,从而推动我国农业信息化进程。 相似文献
7.
8.
Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面,而数据预处理在Web日志挖掘过程中起着至关重要的作用。深入探讨了数据预处理的4个阶段(数据清理、识别用户、识别用户会话、识别片断)的主要任务,并介绍这个过程中一些特殊情况的处理方法。 相似文献
9.
目的 随着大数据技术和人工智能的快速发展,针对当前水稻产量预测模型精度低、预测区域范围过大、模型优化时间过长等问题,本文提出一种基于Spark的鲸鱼优化算法-反向传播神经网络(Whale optimization algorithm-backpropagation,WOA-BP)水稻产量预测方法。方法 本文以广东省西部地区的县/市/区水稻产量及气象数据作为研究对象,采用WOA对BP网络的权值和偏置值进行优化,并构建水稻产量预测模型,提升预测精度;此外,在Spark框架下,实现WOA-BP算法并行化,减少算法时间开销。结果 模型精度方面,通过对预测结果进行反归一化后比较,经WOA优化后的BP神经网络模型,平均绝对百分比误差 (Mean absolute percentage error) 从8.354%降至7.068%,平均绝对误差 (Mean absolute error) 从31.320 kg降至26.982 kg,均方根误差 (Root mean square error) 从41.008 kg降至33.546 kg;运行时间方面,3节点Spark集群比非Spark模式减少了11 742 s,减少44%的时间开销。结论 基于Spark的WOA-BP水稻产量预测方法,能够较好地预测出广东西部县/市/区的水稻产量,同时可以很好地反映气象因素对广东省西部地区水稻产量的影响情况,对研究广东西部县/市/区乃至整个广东的水稻产量情况具有一定的参考价值。 相似文献
10.
Oracle基于事务日志的数据恢复 总被引:1,自引:0,他引:1
本文从事务处理和事务日志的角度阐述了数据恢复的基本方法。并结合O rac le数据库系统给出1个利用归档日志进行完全恢复的范例,来说明利用归档日志,可以实现数据的完全恢复的方法。 相似文献
11.
基于OPAC日志的读者需求分析 总被引:5,自引:1,他引:5
林绮屏 《农业图书情报学刊》2006,18(1):46-49
OPAC日志中详细记录了读者的访问活动,通过对OPAC日志的深入分析,可挖掘出读者的各种需求信息。为了更好地了解读者的需求。实现对图书馆决策的支持,本文以汇文的OPAC系统为例深入研究了OPAC日志分析的方法和过程。并给出了具体的实现方法、分析实例和结果。 相似文献
12.
基于日志的数据恢复及其在SQL SERVER中的实现 总被引:2,自引:0,他引:2
在信息化快速发展的阶段,在信息系统的管理及应用中,数据库出现故障后,进行恢复是一项艰巨而复杂的工程,本文分别阐述了事务处理及事务日志的数据恢复的机理,尤其是进行完全数据恢复的技术管理和策略,剖析了一个在SQLSERVER中数据恢复的实例.事实证明,合理利用事务日志,我们可以保证做到没有一点数据丢失的恢复,更好的保障了数据的可用性,在重要的业务系统中具有极高的应用价值. 相似文献
13.
为了方便读者能在海量的图书资源中快速有效的找到需要的书籍,利用Map Reduce框架分块处理,结合关联分析Apriori算法,将数据挖掘技术应用到图书管理系统中。但需要多次扫描数据库和产生大量候选集,对Hadoop平台处理速度带来了巨大挑战,因此,针对传统的Apriori算法,提出基于内存计算、弹性分布式数据集处理的Spark平台为读者推荐书籍,指引读者的借阅行为。 相似文献
14.
Web数据挖掘是目前信息技术中的研究热点,它是现代科学技术相互渗透与融合的必然结果。文章详细研究了Web文本挖掘的定义及类型,重点分析了Web文本挖掘算法,总结了文本挖掘的应用,最后指出了网络信息挖掘的应用前景。 相似文献
15.
为了提高小麦病害图像分类的效率,提出了一种基于Spark的并行式支持向量机算法。首先对小麦病害图像进行滤波去噪、灰度压缩等处理,利用灰度共生矩阵、不变矩阵等从颜色、纹理和形状3个方面提取49个特征向量;然后通过数据集的切分和并行框架的支持,将大数据并行处理技术Spark与支持向量机结合,运用Scala语言实现了串行支持向量机算法的并行化,并将其应用于小麦病害图像识别。针对小麦锈病和白粉病的图像分类测试结果表明,当测试图像分别是2 600、3 900、5 120张时,该算法对锈病的分类精度依次是76.03%、81.18%、77.82%,对白粉病的分类精度依次是83.27%、85.91%、83.14%,比串行支持向量机分类精度有所提升。分类时间依次是13 928.0、18 506.1、24 897.2 ms,明显低于串行支持向量机的分类时间。改进的算法实现了小麦病害分类精度的小幅度提升,明显提高了处理速度,具有较快的学习收敛速率。 相似文献
16.
针对用户个性差异向用户推荐适合于他们的内容已经成为Web技术的研究热点。Web挖掘是实现Web个性化推荐的关键技术之一。结合Web使用挖掘与Web内容挖掘技术,研究了网页的特征化表示和用户兴趣模型的表示,提出了一种基于Web挖掘的推荐算法,能够有效发现用户兴趣,提高推荐页面的准确率。 相似文献
17.
行为相似性度量及评价方法是业务流相关研究领域的热点问题,同时也是很多数据挖掘任务如分块、聚类算法的核心内容,构成了一些业务流程模型优化与重建的基础。已有的研究成果大都将相似性度量转换为集合的交集运算,但是忽视了信息流的其他因素。利用网络用户的Cookies日志,考虑用户行为以及行为所持续的时间长度等因素,提出了用户行为相似度计算方法 SCMBATA,并在此基础上通过事件隶属度的概念,提出了基于行为属性的用户聚类算法CBOSMA。最后,利用自动程序采集到的Web用户事件日志,对所提出的SCMBATA和CBOSMA算法进行分析验证。与传统SPSS聚类进行比较的结果表明,含时间因素的用户行为相似度与传统不含时间因素的用户行为相似度有明显区别,时间因素对于网络用户行为有重要的影响。 相似文献
18.
19.
[目的/意义]从海量微博舆情用户评论文本中快速挖掘用户关注内容,能够帮助舆情管控主体更高效得对微博舆情演进和发展态势进行管理。[方法/过程]本文以新浪微博为例,基于主题图谱理论和文本挖掘方法构建微博舆情用户评论主题图谱,使用CiteSpace进行可视化分析,通过应用不同文本相似度算法、网络优化算法和文本聚类算法构建二维主题图谱并分析图谱的结构特征。[结果/结论]构建的微博舆情主题图谱能够帮助舆情管理者快速准确识别用户关注内容,同时对社交媒体上用户发布文本管理,预测舆情演化趋势,防止不良舆情滋生和扩散都具有重要作用。 相似文献
20.
针对农业种植生产基地的特殊性、差异性,构建了以征信主体、生产经营、监督检查、质量检测、风险防控、公众反馈为准则,涵盖30余项具体指标的农业种植生产基地信用评价指标体系,并提出了基于层次分析法和模糊综合评价法相结合的农业种植生产基地信用评价模型。首先,利用层次分析法确定准则权重,并通过一致性检验确定所有指标的权重;然后,采用模糊综合评价法建立评价等级,确定隶属度函数,构造模糊关系矩阵,对各项指标进行模糊评价分析;最后,确定生产基地的信用评级和信用状况。为验证模型的有效性,选取2017年度北京市农业农村信息化示范基地的种植生产基地进行征信评价。结果表明:利用该模型得出的评价结果与专家的评价结果趋于一致。该模型可有效地对农业种植生产基地进行征信评价,也可对农业种植生产基地规范化管理、改造和决策提供技术支撑。 相似文献