首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
如何从互联网Web页面中快速、准确获得用户感兴趣的数据内容成为信息抽取领域的研究热点.本文总结现有Web信息抽取分类方法,并提出按用户参与程度对Web信息抽取系统进行分类的方法,分为人工创建系统、用户监督系统和无人监督系统,并从7个方面对Web信息抽取系统进行分析、比较.  相似文献   

2.
针对基于Web页面信息本体的信息抽取中,需人工根据待抽信息项的概念和对应的实例值来建立本体的缺点,设计一个页面信息本体的自动学习方法。论文利用前期在基于DOM的页面相似路径归纳学习算法和基于PAT-tree的自动关键词识别算法上的研究成果,使用改进的TF·IDF统计方法和复合事件的关联规则算法完成概念和概念间关系的学习,建立页面信息本体,减少建立本体的人工工作量。  相似文献   

3.
传统基于本体的Web页面信息抽取以单个信息项为最小抽取单位,抽取出的实体语义关联性较差和抽取准确率不理想。针对上述问题,以微博领域本体为基础,提出了一种两层次匹配的用户信息抽取方法:将微博中具有语义关联的不同层次的用户信息划分成对应信息块,以信息块作为最小抽取单位分别抽取其中包含的用户各属性信息(包含个人信息、关注的好友信息和所发文本微博信息)。试验结果证明,与传统信息抽取方法相比,设计的抽取规则算法能够有效地提高信息的准确率和召回率,对微博页面结构复杂以及信息量大的Web网页有良好的抽取效果。  相似文献   

4.
事件抽取是信息抽取领域的重要研究方向,针对目前网页文档中文事件抽取的关键问题,提出利用开源的通用文本处理框架(GATE)进行中文事件抽取的方法,设计GATE中文事件处理流程,开发GATE插件,解决中文分词与词性标注、领域词典、中文抽取规则设计等关键技术,实现了中文事件的类型识别和元素抽取。并以四类政治事件为例,进行中文事件抽取实验。实验结果表明,基于GATE的中文事件抽取具有良好的通用性,能够取得了较好的抽取效果。  相似文献   

5.
互联网有着浩瀚的信息.如何高效、准确获取想要的信息是一个重要的问题,本文将信息获取技术分两个部分来进行,即资源发现模块和信息抽取模块,并基于此构建了一个信息自动获取平台.对于资源发现模块,主要在如何能够从广度和深度两个方面去发现资源提出了一种新的搜索算法,同时利用了多Agent技术实现了分布式的资源发现.对于信息抽取模块,提出了一种新的抽取规则表示方法,提高了在信息抽取过程中规则的适应性.  相似文献   

6.
对只能获得部分标记的训练文本,将主动学习方法应用到文本信息抽取中,提出了一种基于主动学习隐马尔可夫模型的文本信息抽取方法.在该方法中,通过主动学习,仅将对隐马尔可夫模型的训练最有价值的训练文本挑选出来进行标记.实验表明,通过选择模型信任值的最佳门槛值,该方法在保证文本信息抽取性能的前提下,大大减少了用户标记训练文本的工作量.  相似文献   

7.
[目的/意义]随着国家公共文化服务体系建设的不断推进与大数据等新型信息技术在公共文化领域的成功应用,各公共文化服务机构结合地方特色产生了很多智慧化的应用,如何全面地掌握公共文化智慧化发展现状,实时监控行业发展最新动态,是当前领域需要解决的一个重要问题.[方法/过程]通过爬虫获取国内省级与副省级城市图书馆、博物馆官网页面...  相似文献   

8.
问答系统是一种综合运用各种自然语言处理技术的新型信息检索系统,是目前自然语言处理领域的一项研究热点.本文简要介绍了问答系统的国内外研究现状,并提出了基于Web的农业知识问答系统的体系结构,主要包括四个组成部分:问句分析、信息检索、答案抽取及基于本体的农业知识库.  相似文献   

9.
介绍了数字正射影像(DOM)质量检查内容及方法,基于ArcEngine和C#.Net平台,设计了一种DOM质量检查平台,并通过实验操作,验证了该平台的实用性.  相似文献   

10.

 

探讨了基于Web的科研信息发布系统的设计,主要包括系统目标、功能设计、

系统结构、关键技术、数据库设计、运行环境等。该系统可实现科研信息发布并提供远程查

询,使高等院校科研信息管理实现现代化、规范化、信息化和高效化。

  相似文献   

11.
基于知识规则的马尾松林遥感信息提取技术研究   总被引:1,自引:0,他引:1  
由于遥感信息提取精度的限制,使得遥感技术在林业领域的应用受到了制约.为了提高林业遥感信息提取精度,该文对遥感信息提取的3个关键技术环节即训练样区的选取、分类特征波段的选择及分类器的训练进行了研究,建立了基于知识规则的信息提取方法和流程. 应用该方法,以浙江省富阳市为研究区,进行了马尾松林信息提取,精度达到了80.5%,比最大似然法提高了近20%. 实例研究表明,该信息提取方法较为有效,尤其是在树种信息提取方面具有一定的研究和应用潜力,同时也为浙江地区应用遥感技术研究虫害提供了一定的技术支持.   相似文献   

12.
不同IHS变换公式在植被信息提取中的比较研究   总被引:3,自引:0,他引:3  
多源遥感图像融合对于植被信息提取具有重要意义,该文对常用的球体、柱体、三角形和单六角锥4种IHS变换融合方法进行了比较研究,分别从融和图像的信息量、标准差等统计特征、植被光谱特征曲线、类别可分性、植被指数4方面做了分析.研究结果表明,球体变换融和图像的信息量、标准差和光谱扭曲值等统计指标从整体上优于其他变换.球体变换可将不同类型的灰度平均值间的距离进行拉伸.类别可分性指标的分析表明,球体变换可将难以区分的阔叶林与针叶林、阔叶林与草地间的距离加大,增强了类别间的可分性  相似文献   

13.
随着信息技术的快速发展和Internet的普及应用,Internet已经成为包含各种信息形式,如文本、图像、视频、音频等的巨大信息资源库。然而由于Web图像从主题、格式,到功能和来源都多种多样,很难用一个统一的标准进行分类。本研究首先从Web页面上图像的功能角度对图像进行初步分类,将其分为链接类、装饰类、广告类和内容类。初步分类可提高Web图像处理的效率和性能,并为它基于Web的应用与研究提供帮助。  相似文献   

14.
利用校园网平台建设基于Web的高校后勤信息服务系统。该系统是一个建立在Internet上的后勤信息发布和信息反馈系统,采用HTML ASP VBScript以及Frontpage开发网页,后台数据库采用SQL Server7,前后台连接采用IIS。系统所具有的特点主要有实时性好;使用和管理方便;共用校园网原有设备,节省人力、财力;提供多入口,便于查找,具有较强的实用价值。  相似文献   

15.
利用校园网平台建设基于Web的高校后勤信息服务系统。该系统是一个建立在Internet上的后勤信息发布和信息反馈系统,采用HTML ASP VBScript以及Frontpage开发网页,后台数据库采用SQL Server7,前后台连接采用IIS。系统所具有的特点主要有实时性好;使用和管理方便;共用校园网原有设备,节省人力、财力;提供多入口,便于查找,具有较强的实用价值。  相似文献   

16.
在植被生长预测研究中,需要从大量生长回归方程中选取出合适的方程并计算其结果.在动态计算和建模方面,Script组件是一个比较好的选择.本文在利用Scropt组件解释数学计算模型的基础上,结合C 语言的高效灵活性,采用Script组件递归加载方法,构建出一个窗口交互式回归模型解释器.  相似文献   

17.
为了提高地物识别的正确性,探讨荒漠化土地类型自动分类的有效途径,克服异物同谱和同物异谱现象。以陕西省榆林市榆阳区为例,利用Landsat 5卫星的TM数据,探讨了荒漠化土地覆盖信息的提取方法。在对不同土地覆被类型光谱特征进行系统分析的基础上,根据归一化指数(NDVI)和差值指数(TM5-TM4)及TM3、TM5、TM7波段的光谱值,提出了分层信息提取方案,利用该方案分步提取地表覆被信息。结果表明,此方法简单、实用,是地物遥感信息提取的有效途径。  相似文献   

18.
采用动态网页技术,结合SQL Server数据库技术建立基于Web自然资源信息采集编辑系统,以实现自然资源相关信息的输入、编辑、审核与查询.系统能对用户进行权限分配,将每一用户的操作自动生成日志,具有数据导出等功能.从实际运行效果看,系统较好地满足了多人不同地点同时进行自然资源信息的收集与审校工作.  相似文献   

19.
SPOT5遥感影像土地利用信息提取方法研究   总被引:3,自引:0,他引:3       下载免费PDF全文
【目的】探讨高分辨率遥感影像土地利用信息提取方法的优劣,为研究土地利用/覆盖动态变化提供参考。【方法】以结合纹理特征的支持向量机(Support vector machine,SVM)分类和多尺度分割的面向对象分类为主要技术,对陕西佛坪长角坝乡遥感影像的土地利用信息进行提取,并将分类结果与基于传统像元的最大似然法分类结果进行比较分析。【结果】面向对象分类法的总精度达到90.67%,较结合纹理特征的SVM法提高了8.34%,而与最大似然分类法相比提高了近20.32%,克服了其他分类方法存在的同谱异物现象及分类结果中地物破碎等缺点,取得了较好的分类结果。【结论】利用面向对象分类法不仅达到了提取土地利用信息的目的,而且精度高、速度快。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号