基于Web的文本数据挖掘的研究 |
| |
引用本文: | 徐龙玺,吴文武.基于Web的文本数据挖掘的研究[J].山东省农业管理干部学院学报,2005,21(4):144-145. |
| |
作者姓名: | 徐龙玺 吴文武 |
| |
作者单位: | 济南大学信息科学与工程学院,山东,济南,250002 |
| |
摘 要: | Web挖掘指使用数据挖掘技术在WWW数据中发现潜在的、有用的模式或信息。Web挖掘是从数据挖掘发展而来,因此其定义和传统数据挖掘相类似。但是,Web挖掘又有许多独特之处。现有的KDD方法和DM技术不能直接用于Web挖掘?首先,Web在逻辑上是由文档节点和超链接构成的图。因此Web挖掘得到的模式可以是关于Web内容的,也可以是关于Web结构的。其次,Web文档本身是结构化或无结构的,且缺乏机器可理解的语义,而数据挖掘的对象局限于数据库中的结构化数据,并利用关系表格存储结构来发现知识。
|
关 键 词: | Web挖掘 WWW数据 数据库 结构化数据 关系表格存储结构 |
文章编号: | 1008-7540(2005)04-0144-02 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |