一种用于Web信息抽取的页面信息本体自动学习方法 |
| |
引用本文: | 柳佳刚,龙军,李泽军.一种用于Web信息抽取的页面信息本体自动学习方法[J].湖南农业大学学报(自然科学版),2011(1):119-123. |
| |
作者姓名: | 柳佳刚 龙军 李泽军 |
| |
作者单位: | (1.湖南工学院 计算机与信息科学系,湖南 衡阳421002;2.中南大学 信息科学与工程学院,湖南 长沙410083) |
| |
摘 要: | 针对基于Web页面信息本体的信息抽取中,需人工根据待抽信息项的概念和对应的实例值来建立本体的缺点,设计一个页面信息本体的自动学习方法。论文利用前期在基于DOM的页面相似路径归纳学习算法和基于PAT-tree的自动关键词识别算法上的研究成果,使用改进的TF·IDF统计方法和复合事件的关联规则算法完成概念和概念间关系的学习,建立页面信息本体,减少建立本体的人工工作量。
|
关 键 词: | 本体学习 信息抽取 PATtree 关联规则 |
An Automatic Ontology Learning Approach Based on Web Information Items for Web Information Extraction |
| |
Abstract: | |
| |
Keywords: | |
|
| 点击此处可从《湖南农业大学学报(自然科学版)》浏览原始摘要信息 |
| 点击此处可从《湖南农业大学学报(自然科学版)》下载免费的PDF全文 |