首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 703 毫秒
1.
Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面,而数据预处理在Web日志挖掘过程中起着至关重要的作用。深入探讨了数据预处理的4个阶段(数据清理、识别用户、识别用户会话、识别片断)的主要任务,并介绍这个过程中一些特殊情况的处理方法。  相似文献   

2.
Web日志挖掘是Web数据挖掘的重要分支,已成为研究人员关注的焦点。分析和探讨Web日志挖掘过程的数据预处理和模式发现,从用户浏览网站的数据中抽取感兴趣的模式,理解用户的浏览兴趣行为,从而进一步改善网站结构设计或为用户提供个性化服务。  相似文献   

3.
研究基于访问日志挖掘的高校综合信息门户页面推荐。从高校综合信息门户服务器日志中获取用户日志数据,对日志数据中的“脏”数据进行预处理,通过改进的K-means聚类算法将用户浏览兴趣度数据集划分为多个具有相近兴趣度的用户集合,凭此为用户提供个性化的页面推荐。实验结果表明,在高校综合信息门户页面推荐方面具有不错的效果。  相似文献   

4.
针对用户个性差异向用户推荐适合于他们的内容已经成为Web技术的研究热点。Web挖掘是实现Web个性化推荐的关键技术之一。结合Web使用挖掘与Web内容挖掘技术,研究了网页的特征化表示和用户兴趣模型的表示,提出了一种基于Web挖掘的推荐算法,能够有效发现用户兴趣,提高推荐页面的准确率。  相似文献   

5.
通过Web 日志挖掘与内容挖掘的有机结合,给出了一种个性化远程教学系统的模型,通过分析学生的兴趣给出相应的导航推荐,为学生提供个性化的教学服务,使得整个教学活动成为丰富有机的整体.  相似文献   

6.
在农业网站日志挖掘知识的基础上,重点对运行8年的东北农业大学农业专家在线网站进行Web日志挖掘研究,对运行以来积累的海量Web日志数据进行有效的预处理,并采用SAS数据挖掘模块对日志数据进行关联规则挖掘、链接分析,利用挖掘的结果对网站信息构建合理性进行评估及改造,逐渐在个性化服务、改进系统性能、站点内容修改、商业智能等方面提供科学的理论基础,使之成为中国最大的农业免费咨询类网站,而且可以利用结论对其他农业信息系统的构建及运行等方面提供一定的借鉴作用,从而推动我国农业信息化进程。  相似文献   

7.
通过研究序列模式挖掘算法,将序列模式挖掘技术与数字图书馆有机结合。可以从3个方面入手,一是对Web环境下的读者访问日志序列进行挖掘可以为每个读者提供个性化服务;二是依据挖掘得到的被拒集及频繁借阅集可阶段性补充图书馆特色资源;三是利用挖掘技术分析资源利用情况可指引图书馆电子文献资源的采购,实现图书馆智能化服务。  相似文献   

8.
通过访问农业专家在线系统网站的用户行为,运用Web挖掘理论和方法对农业网站日志进行关联规则和链接分析,将关联规则算法用于农业网站日志分析中,用户在同一次访问中访问不同栏目的相关性、用户在一段时间内频繁访问页面及访问栏目间的最短访问路径,提高了咨询服务效果,保证了农业专家在线系统信息资源的有效利用。  相似文献   

9.
采用基于粗糙集的WEB日志挖掘技术,对web日志数据进行预处理,然后利用粗糙集理论分析和处理该数据,最终发现其潜在的规律,发掘用户行为,为个性化网站设置提供依据。粗糙集的核心是属性约简,这里采用遗传算法约简。  相似文献   

10.
宁小红 《安徽农业科学》2007,35(13):4071-4073
提出结合站点的拓扑结构和Web页面内容的改进算法.改进算法根据Web页面的内容链接过滤非内容页,利用页组的组内链接度提高挖掘结果中频繁访问页组的机率,以提高客户访问率,进而能提高电子商务的效益.  相似文献   

11.
提取图书馆读者历史借阅数据并经过预处理流程获得读者借阅事务集,建立了基于SPSSClementine的聚类模型,利用聚类分析的方法对读者群体进行细分。以青岛农业大学图书馆读者为例,验证了聚类模型的有效性。聚类结果能够清晰地揭示读者群体的需求结构,了解读者利用文献活跃度,为更好地进行资源优化配置,有针对性地为读者提供个性化服务,实现图书馆的科学化管理提供依据。  相似文献   

12.
由于大数据具有多样性的特点,在数据挖掘过程中采用单一最小支持度会出现较多冗余规则,造成挖掘效率不高等问题,该文提出一种基于多最小支持度关联规则改进算法.通过给每一项目设置单独的支持度阈值,构建多最小支持度模式树,利用最小频繁项目作为节点筛选标准,进行冗余节点删除;在挖掘频繁项集的过程中利用排序向下闭合的性质,删除冗余的候选项集,同时能够自动停止向下挖掘,从而快速直接地得到所有频繁项集,并且不需要多次扫描数据库.实验结果表明,改进算法能够提高挖掘效率,节省计算时间.  相似文献   

13.
本文将数据挖掘技术应用到变电站设备及缺陷管理系统中,设计出设备缺陷数据挖掘系统,此系统包括数据预处理模块,数据挖掘模块和数据挖掘结果显示模块。文中根据变电站缺陷数据的特点,提出了采用多元线形回归模型进行数据挖掘的方法,并具体得以实现。实例表明该数据挖掘系统能够对缺陷的发生进行有效的预测。  相似文献   

14.
数据挖掘中的数据预处理与维度优化   总被引:3,自引:0,他引:3  
介绍了数据挖掘的研究发展现状,以及数据预处理与维度问题在数据挖掘过程中的重要性,并对数据的预处理和维度优化方面提出了一些问题及其解决方法。最后提出了在数据挖掘过程中所面临的挑战。  相似文献   

15.
分布式数据存储与集成是数据安全管理的重要途径,在森林资源监测及流通管理领域具有良好的应用前景。在林业管理中,资源监测与电子办证涉及地域广,研究数据挖掘技术在运输证管理中的应用具有重要意义,分布式数据集成是对分布存储于异地的海量数据进行数据挖掘的基础。探讨了分布式存储的木材运输证数据集成模拟系统的建立过程,包括基础实验数据的建立,数据仓库逻辑模型的设计,数据集成前的数据预处理,木材运输证数据仓库的数据集成等。图1参10  相似文献   

16.
从系统论的角度总结了个人信用评分发展的前沿问题,从数据预处理、指标体系筛选、以及模型设计三个方面对个人信用评分关键技术的最新研究成果进行了细致分类和综合比较,从而指出个人信用评分研究中存在的难点以及未来发展方向。  相似文献   

17.
本文将数据挖掘技术应用到B2C电子商务,设计了B2C电子商务管理系统。B2C电子商务系统具有数据量大、数据质量差和数据种类多的特点。文中根据B2C电子商务系统数据的特点,在B2C电子商务管理系统中设计了数据挖掘管理模块,采取数据挖掘技术对其数据进行预处理、数据挖掘和挖掘结果显示。并采用J2EE的B/S架构将其实现。  相似文献   

18.
以数据挖掘技术为手段,通过对高考历史数据的全面分析构建招考志愿填报的辅助决策支持系统,诣在为考生填报志愿提供辅助决策支持。系统运用数据仓库的数据预处理技术和多维建模技术构建以录取数据分析为主题的数据仓库。运用联机分析技术对数据进行多维分析,以及数据挖掘技术中的分类方法实现志愿填报的辅助决策。  相似文献   

19.
为了识别用户浏览模式,实现利用关联规则挖掘算法Apriori对Web应用挖掘过程中预处理阶段所产生的用户会话文件进行挖掘的模块,该模块针对用户选定的若干页面产生满足最小支持度和最小置信度的页面之间的强关联规则。关联规则挖掘结果对网站管理员重新调整网站结构、通过预测用户浏览模式提供推送服务来提高用户的访问效率和网站资源的利用率有一定的指导作用。  相似文献   

20.
针对在线旅游快速增长的态势,本文研究基于协同过滤的旅游景点推荐算法。通过提取在线旅游网站上游客对桂林旅游景点的评价数据,使用协同过滤算法进行旅游景点推荐。实验结果表明:协同过滤算法完全可用于旅游景点推荐。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号