首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于Web的文本数据挖掘的研究
引用本文:徐龙玺,吴文武.基于Web的文本数据挖掘的研究[J].山东省农业管理干部学院学报,2005,21(4):144-145.
作者姓名:徐龙玺  吴文武
作者单位:济南大学信息科学与工程学院,山东,济南,250002
摘    要:Web挖掘指使用数据挖掘技术在WWW数据中发现潜在的、有用的模式或信息。Web挖掘是从数据挖掘发展而来,因此其定义和传统数据挖掘相类似。但是,Web挖掘又有许多独特之处。现有的KDD方法和DM技术不能直接用于Web挖掘?首先,Web在逻辑上是由文档节点和超链接构成的图。因此Web挖掘得到的模式可以是关于Web内容的,也可以是关于Web结构的。其次,Web文档本身是结构化或无结构的,且缺乏机器可理解的语义,而数据挖掘的对象局限于数据库中的结构化数据,并利用关系表格存储结构来发现知识。

关 键 词:Web挖掘  WWW数据  数据库  结构化数据  关系表格存储结构
文章编号:1008-7540(2005)04-0144-02
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号