基于Web的文本数据挖掘的研究期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于Web的文本数据挖掘的研究

引用本文：	徐龙玺,吴文武.基于Web的文本数据挖掘的研究[J].山东省农业管理干部学院学报,2005,21(4):144-145.

作者姓名：	徐龙玺吴文武

作者单位：	济南大学信息科学与工程学院,山东,济南,250002

摘要：	Web挖掘指使用数据挖掘技术在WWW数据中发现潜在的、有用的模式或信息。Web挖掘是从数据挖掘发展而来，因此其定义和传统数据挖掘相类似。但是，Web挖掘又有许多独特之处。现有的KDD方法和DM技术不能直接用于Web挖掘?首先，Web在逻辑上是由文档节点和超链接构成的图。因此Web挖掘得到的模式可以是关于Web内容的，也可以是关于Web结构的。其次，Web文档本身是结构化或无结构的，且缺乏机器可理解的语义，而数据挖掘的对象局限于数据库中的结构化数据，并利用关系表格存储结构来发现知识。
关键词：	Web挖掘 WWW数据数据库结构化数据关系表格存储结构
文章编号：	1008-7540(2005)04-0144-02
本文献已被 CNKI 维普万方数据等数据库收录！