首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于Heritrix+Solr的农业信息垂直搜索引擎研究与设计
引用本文:郭承坤,陈国松,阮怀军,等.基于Heritrix+Solr的农业信息垂直搜索引擎研究与设计[J].广东农业科学,2015,42(5):139-144.
作者姓名:郭承坤  陈国松  阮怀军  
作者单位:1. 中国农业大学信息与电气工程学院,北京100083;农业部农业信息获取技术重点实验室,北京100083
2. 山东水利职业学院,山东日照,276826
3. 山东省农科院科技信息研究所,山东济南,250100
摘    要:随着农业信息化、智能化的不断发展,农业信息量呈现井喷式增长,为广大农业从业者和农业科研人员提供便捷有效的信息检索方法是目前农业搜索引擎亟需解决的问题.为此,本文提出了基于Heritrix+Solr的农业信息垂直搜索引擎框架,并设计了适用于农业信息垂直搜索引擎的隐马尔科夫Web信息抽取模块和基于词典的mmseg4j中文分词模块,同时改进了页面排序算法,对进一步提升农业垂直搜索引擎的用户体验和工作效率具有一定的参考价值.

关 键 词:农业垂直搜索引擎  Heritrix  Solr  中文分词  页面排序

Research and design of agricultural information vertical search engine based on Heritrix+Solr
GUO Cheng-kun,CHEN Guo-song,RUAN Huai-jun,CHEN Ying-yi,TU Xing-yue.Research and design of agricultural information vertical search engine based on Heritrix+Solr[J].Guangdong Agricultural Sciences,2015,42(5):139-144.
Authors:GUO Cheng-kun  CHEN Guo-song  RUAN Huai-jun  CHEN Ying-yi  TU Xing-yue
Abstract:The agricultural information blooms rapidly with the development of agriculture in information and intelligence, therefore, a convenient and effective agricultural information search method and search engine for agricultural researchers, producers and managers is in need. A search engine framework based on Heritrix and Solr was put forward, in which Hidden Markvo Model based web information extraction and mmseg4j agricultural dictionary based Chinese word segmentation were involved, moreover, the page ranking algorithm was improved according to the characteristics of agricultural information search. Finally, this paper provided suggestions for improving the user experience and efficiency of agricultural vertical search engine.
Keywords:agricultural vertical search engine  Heritrix  Solr  Chinese word segmentation  page ranking
本文献已被 万方数据 等数据库收录!
点击此处可从《广东农业科学》浏览原始摘要信息
点击此处可从《广东农业科学》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号