首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 359 毫秒
1.
针对传统基于关键词匹配的中医药信息检索存在查全率和查准率低下的缺陷,将本体与潜在语义索引相结合,提出一种基于中医药领域本体的语义信息检索模型。该模型基于本体概念扩展树构建相应的查询扩展方法和语义向量空间模型,将用户查询和文档集映射到同一潜在语义空间,通过计算查询向量与文档之间的相似度返回检索结果。着重阐述了该模型的体系结构、实现过程和关键技术,并对其实用性进行论证。  相似文献   

2.
张颖 《安徽农业科学》2012,(5):2968-2969
分析了传统农业商务门户Web信息检索技术存在的问题与不足,结合物联网信息的特点,提出基于本体的语义检索模型,提供面向农业的专业化检索服务。基于本体的智能信息检索方式灵活多样,能够对用户提供语义制导,有较强的推理能力,实现了基于知识的语义检索,并在此基础上实现了数据的高效率和高精度挖掘,根据挖掘结果进行决策分析,为用户提供基于RSS聚合的个性化服务。  相似文献   

3.
针对目前图像检索系统较难实现语义检索的问题,提出一种新的以本体为核心的图像检索模型.将通用本体和空间本体相结合描述图像语义,并且基于本体中"Is-A"关系设计相似性度量算法实现语义扩展.初步试验证明了在图像语义检索中此检索模型的可行性和优越性.  相似文献   

4.
针对网络信息空间出现的大量短文本具有长度短、信息量少、特征稀疏、语法不规则等特点,传统信息检索技术无法有效地对其进行处理的问题,本研究以语义关联度为出发点,基于当前主流的语义知识源Wikipedia来研究短文本检索技术。根据Wikipedia页面中包含的分类结构信息,提出一种显式语义特征选择及关联度计算方法。在此基础上,提出一种低维显式语义空间下的短文本检索方法,并通过实验测试验证了该方法的可行性和有效性。研究结果表明,本研究与当前基于图论的方法和基于链接的方法相比,分别在评估指标MAP上提高了6%和4. 1%,在P@30上提高了10. 4%和5. 8%,在R-Prec上提高了6. 1%和3%。  相似文献   

5.
基于SDD算法的中文农业搜索引擎设计与实现   总被引:1,自引:0,他引:1  
信息检索是当今社会的热点话题,但是一般的搜索引擎涵盖面太广,个性化、专业化程度不够.利用潜在语义索引(LSO的最新技术SDD(半离散矩阵分解)算法来解决大规模网页索引计算的问题,利用SDD算法建立起语义索引,成功构建了一个中文农业搜索引擎.  相似文献   

6.
信息检索是当今社会的热点话题,但是一般的搜索引擎涵盖面太广,个性化、专业化程度不够.本文利用潜在语义索引(LSI)的最新技术SDD(半离散矩阵分解)算法来解决大规模网页索引计算的问题,利用SDD算法建立起语义索引,成功构建了一个中文农业搜索引擎,本文介绍了"农搜"系统的结构、功能、关键算法和应用情况.  相似文献   

7.
在农业领域中,农业知识问答系统以其能接受自然语言检索和直接返回精确答案而成为一种新的信息检索技术。针对农业领域,提出了一种多重信息融合的句子相似度算法。该算法结合了句子的结构信息、词法信息和语义信息,同时考虑农业知识问答系统中问句的特征,使其更适合应用在农业特定领域中,并通过实验验证了算法的可行性和准确性。  相似文献   

8.
农业信息化建设的飞速发展,使得互联网上农业信息迅速增长,但由于使用通用搜索引擎检索出的信息庞杂无序,农业主题信息的获取仍十分困难。因此,搜索引擎有向专业化、领域化方向发展的趋势。本文设立了一种基于特征词匹配算法的垂直搜索引擎设计方案,该方案通过建立农业信息特征词词典,采用向量空间模型来对网页主题进行识别,从而提高信息检索的准确率。并采用基于超级链接分析的方法,使主题相关的URL优先得到访问,提高了搜索引擎的效率。  相似文献   

9.
讨论了农业网络信息的特点及现有信息检索的局限性,结合用户模型的机器学习方法和基于Agent的信息检索的基本原理,提出了一个智能Agent信息检索模型,并给出其检索策略。  相似文献   

10.
传统的信息检索是利用关键词匹配查询,对用户问句缺乏语义理解,检索效果不是令人非常满意。为解决此问题,提出了一种基于本体的分类检索系统,利用本体中丰富的语义关系,对用户提问进行分类语义查询,从而提高信息检索的查准率和查全率。  相似文献   

11.
针对农业垂直搜索中中文分词要求的特殊性,提出-5基于词典和全切分的中文分词算法。该算法首先对经过预处理的网页进行基于词典的机械式切分,对未识别的字串再进行基于贝叶斯(Bayes)方法的全切分概率计算,通过计算字串的最大切分可信度确定最合理的切分,并更新词典。实验从120万张农业中文网页中随机抽取14组生成测试集,测试结果表明,该算法与正向最大匹配算法(FMM)和逆向最大匹配算法(RMM)相比具有更高的召回率,F1测度平均达到88%。  相似文献   

12.
随着农业信息化、智能化的不断发展,农业信息量呈现井喷式增长,为广大农业从业者和农业科研人员提供便捷有效的信息检索方法是目前农业搜索引擎亟需解决的问题.为此,本文提出了基于Heritrix+Solr的农业信息垂直搜索引擎框架,并设计了适用于农业信息垂直搜索引擎的隐马尔科夫Web信息抽取模块和基于词典的mmseg4j中文分词模块,同时改进了页面排序算法,对进一步提升农业垂直搜索引擎的用户体验和工作效率具有一定的参考价值.  相似文献   

13.
汪斌  张云伟  刘健  陈晶 《安徽农业科学》2009,37(20):9699-9700
针对用户在进行农业信息主题或相关领域的网络查询时,通用搜索引擎返回的信息过多且主题相关性不强等不足,提出了一种面向农业信息的主题爬虫的设计方案,详细讨论了该主题爬虫的爬行策略、结构设计、原理及实现。初步试验结果表明,基于该设计方案的主题爬虫在抓取农业信息主题网页时的准确率、全面率及成功率明显优于普通爬虫。  相似文献   

14.
搜索引擎能够帮助人们从网上迅速获取所需要的信息或资源,但由于网络信息爆炸式的增长,每一次搜索所获取的结果中能满足用户要求的信息与大量的无用信息混杂在一起,需要用户手工挑选,严重的影响了工作效率。因此,开发出一种针对特定用户或特定行业的搜索引擎具有现实意义,本文介绍了一种基于ROBOT的农业信息搜索引擎的设计方法。  相似文献   

15.
针对农业网站中大量存在的不含实际信息的导航页面,提出了将网页文本特征与非文本特征综合考虑来构建农业网站导航页面识别模型的方法。对农业网站导航网页两类特征:文本特征与非文本特征,利用HTML-Parser网页解析器、庖丁解牛分词器、卡方检验算法,结合最小二乘多元线性回归方法,进行了实验分析对比。经过对5 000张训练样本与1 400张测试样本的网页实测表明,将农业导航页面文本特征与非文本特征集结合构建的分类器,对农业导航网页有很好的识别效果.当特征词数目达到200以上,准确率可达94%左右且趋于稳定。  相似文献   

16.
朱学芳  冯曦曦 《安徽农业科学》2011,39(35):22183-22186
以农业网站作为抓取对象,在其特点分析基础上,基于J2EE设计并实现了面向农业主题搜索引擎,主要实现了网页信息抓取、处理、检索模块,完成农业信息网站内容的有效抓取,并实现数据输入、处理和输出的分离。在实现快速、分类、高级搜索等功能时,给出网页评分和信息分类,较好地表示搜索结果。系统的快速精确检索、开发周期短、维护成本低等性能特点不仅对农业信息主题检索有帮助,对其他领域信息检索以及对信息检索技术本身的应用研究也具有较好的参考价值。  相似文献   

17.
刘珊慧  万韵  杨乐 《安徽农业科学》2009,37(23):11332-11333
针对语义检索的现实意义,研究本体(Ontology)定义和在语义检索中的作用,并以农业领域Ontology已经构建保存为研究基础,分析基于本体的农业信息资源的检索过程,最终将检索包装成针对本体的查询语言RDQL。  相似文献   

18.
分析大陆和台湾的在农业方面的语言差异、简繁体的编码问题和两岸文字的语义差别,在此基础上提出两岸文字转化的规则。研究中文分词、多目标字词消歧和人工辅助转换等主要转换技术,重点研究语境模糊匹配消歧,即设立语境库并通过语境模糊匹配算法,来减少单字转换时出现的歧义现象。采用双数组Trie树的索引结构和逆向最大匹配的分词算法、KMP模式匹配算法等,提出面向两岸农产品物流信息的汉字转换系统设计方案,并在基于物联网的海峡两岸农产品物流商务平台中予以实现,取得较好效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号