首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种用于Web信息抽取的页面信息本体自动学习方法
引用本文:柳佳刚,龙军,李泽军.一种用于Web信息抽取的页面信息本体自动学习方法[J].湖南农业大学学报(自然科学版),2011(1):119-123.
作者姓名:柳佳刚  龙军  李泽军
作者单位:(1.湖南工学院 计算机与信息科学系,湖南 衡阳421002;2.中南大学 信息科学与工程学院,湖南 长沙410083)
摘    要:针对基于Web页面信息本体的信息抽取中,需人工根据待抽信息项的概念和对应的实例值来建立本体的缺点,设计一个页面信息本体的自动学习方法。论文利用前期在基于DOM的页面相似路径归纳学习算法和基于PAT-tree的自动关键词识别算法上的研究成果,使用改进的TF·IDF统计方法和复合事件的关联规则算法完成概念和概念间关系的学习,建立页面信息本体,减少建立本体的人工工作量。

关 键 词:本体学习  信息抽取  PATtree  关联规则

An Automatic Ontology Learning Approach Based on Web Information Items for Web Information Extraction
Abstract:
Keywords:
点击此处可从《湖南农业大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《湖南农业大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号