首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 140 毫秒
1.
农业信息化建设的飞速发展,使得互联网上农业信息迅速增长,但由于使用通用搜索引擎检索出的信息庞杂无序,农业主题信息的获取仍十分困难。因此,搜索引擎有向专业化、领域化方向发展的趋势。本文设立了一种基于特征词匹配算法的垂直搜索引擎设计方案,该方案通过建立农业信息特征词词典,采用向量空间模型来对网页主题进行识别,从而提高信息检索的准确率。并采用基于超级链接分析的方法,使主题相关的URL优先得到访问,提高了搜索引擎的效率。  相似文献   

2.
本文设计并实现了一个食品安全新闻的爬虫。为了提高爬虫爬取食品安全新闻数据的准确率,建立了本体模型,并用向量空间模型去除主题相关度小的新闻。结果表明该食品安全爬虫爬取有关食品安全新闻的准确率较高,达到了预期要求。  相似文献   

3.
随着农业新闻数据日益膨胀,以农业为主题的增量爬虫成为爬取农业信息的重要手段。增量爬虫可以依据农业新闻数据的更新爬取数据相关更新的内容,剔除已经爬取的重复内容。本文结合农业新闻数据信息的特点,提出了一种适用于农业新闻信息的基于Redis的布隆过滤器的增量去重方法,摆脱超大的持久化文件撑爆内存的问题。试验证明随着抓取相关农业信息的增加,该方法在保证内存不被撑爆的同时能有效提高增量爬取农业信息的效率,在增量信息爬取过程中具有很好的应用价值。  相似文献   

4.
随着农业新闻数据日益膨胀,保证以农业为主题的增量爬虫成为爬取农业信息的相关手段,增量爬虫的原理可以依据农业新闻数据的更新爬取数据相关更新的内容,剔除出已经爬取的重复内容[[]]。文章结合农业新闻数据信息的特点,提出了一种适用于农业新闻信息的基于Redis的布隆过滤器的增量去重方法,摆脱超大的持久化文件撑爆内存的问题。通过实验证明随着抓取相关农业信息的增加,该方法在保证内存不被撑爆同时能有效提高增量爬取农业信息的效率,在增量信息爬取的过程中具有很好的应用价值[[]]。  相似文献   

5.
聚焦爬虫是主题搜索引擎的核心部件。针对目前聚焦爬虫搜索策略的不足,提出基于主题相关度和页面重要性相结合的综合相关度来判别页面主题相关性,并采用自适应免疫进化算法这种搜索策略指导聚焦爬虫的爬行,实验结果证明,该算法下载的主题相关网页数所占比例明显高于最佳搜索和广度优先搜索算法的比例,具有更高的搜索效率。  相似文献   

6.
农产品价格主题搜索引擎的研究与实现   总被引:1,自引:0,他引:1  
当前农业垂直搜索引擎无法预测农产品价格趋势,难以满足农业生产者行情分析需要。文章设计农产品价格主题搜索引擎。首先网络爬虫从农业综合网站搜集网页,对网页进行转码、去重、提取内容等处理;使用主题相关度算法计算网页的主题相关度,用分类器对网页分类,将与主题相关的网页解析、存储;最后提取农产品价格及其影响因素信息。结果表明,系统可搜集农产品价格信息及影响农产品价格因素信息,为后续农产品价格预测提供数据支持。  相似文献   

7.
朱学芳  冯曦曦 《安徽农业科学》2011,39(35):22183-22186
以农业网站作为抓取对象,在其特点分析基础上,基于J2EE设计并实现了面向农业主题搜索引擎,主要实现了网页信息抓取、处理、检索模块,完成农业信息网站内容的有效抓取,并实现数据输入、处理和输出的分离。在实现快速、分类、高级搜索等功能时,给出网页评分和信息分类,较好地表示搜索结果。系统的快速精确检索、开发周期短、维护成本低等性能特点不仅对农业信息主题检索有帮助,对其他领域信息检索以及对信息检索技术本身的应用研究也具有较好的参考价值。  相似文献   

8.
随着信息技术的发展,农业信息化成为现代农业发展的必然需求。针对目前农业信息化服务信息整合度低、实时性信息不够等问题,提出了基于聚焦爬虫的农业信息服务平台。聚焦爬虫按照既定需求,实时提取各类相关网页信息,通过信息服务平台进行整合,以友好的方式展示给用户。平台的建设使得用户能够在庞杂的信息中获取全面、适用和及时的农业信息,提高了农业信息服务水平。  相似文献   

9.
为了解决养殖投入品的质量信息匮乏、监管效率低下等问题,结合网络舆情信息发布与获取的特点,引入了信息抽取和行政监管并存的理念,构建了基于B/S架构的养殖投入品质量的信息发布与舆情监管系统。采用主题爬虫算法作为抓取网络舆情的信息关键步骤,避免下载大量与主题不相关的网页,提高了信息抓取的效率和准确率。并利用向量空间模型对主题爬虫算法中的内容相似度进行计算与评价,提高了该算法爬行的准确性,并在实际系统中得到了验证。同时该系统还提供了用户信息管理、质量安全信息管理、养殖投入品供求信息管理等功能。系统测试和应用结果表明,该系统具有功能丰富、运行稳定、信息抓取准确、可扩展性强等优点,能较好地满足不同角色对养殖投入品质量信息的需求。  相似文献   

10.
应用网络爬虫技术、Bomb后端云和移动应用开发技术设计了一套移动农业信息服务系统。从农业数据获取、农业数据存储和农业数据显示3个方面分析了移动农业信息服务系统中数据传输处理的过程,得到了通过网络爬虫技术获取农业数据,借助Bmob移动云平台存储农业数据和通过移动终端将农业数据可视化具有一定优势的结论。  相似文献   

11.
孙素芬  罗长寿  张峻峰  于峰  张树亮 《安徽农业科学》2007,35(22):6993-6994,6997
应用中间件、元搜索及网络爬虫等技术与思想构建农业信息资源整合系统,以期对已有的农业信息资源进行整合,从而为用户提供方便服务。  相似文献   

12.
山地履带拖拉机纵向坡地越障性能仿真分析及试验验证   总被引:1,自引:1,他引:0  
山地履带拖拉机作为一种农用动力机械,工作在地形复杂、条件恶劣的丘陵山区,因此,要求其不仅具有一般履带拖拉机的基本特点,而且应具有良好的坡地越障性能。利用Pro/E三维软件绘制山地履带拖拉机车体几何模型,并在多体动力学软件Recur Dyn中完成履带行走机构的选配及整机动力学模型的建立,同时利用Recur Dyn自带的地面Ground模块建立地面模型,基于以上3种模型对该机进行多体动力学仿真,分析速度、坡度角及拖拉机质心位置对其纵向坡地越障性能相关参数的影响。仿真结果表明,在车速与坡度角一定的情况下,质心位置越靠车体前端且越接近地面,越有利于纵向越障性能。相关的坡地实测试验所测得结果与仿真结果基本保持一致,验证了仿真模型的正确性,为山地履带拖拉机进一步的改进设计提供理论参考依据。  相似文献   

13.
在对Web信息采集技术做了深入研究的基础上,提出了一个基于Agent的用户个性化信息采集与处理系统.对该系统的体系结构、工作原理以及功能部件进行了详尽的介绍,重点分析了个性化信息采集模型.从初步试验得出的结果来看,该系统具有很好的采集处理效果.  相似文献   

14.
开放式农业知识共享平台是一个以传播知识、信息服务、增值服务为主导的专门用于收集、传递与保存农业领域数字化研究成果的网络化服务平台。重点介绍了开放式农业知识共享平台的设计原理及其主要功能模块,为广大用户群体获取农业知识服务提供了一种快捷方便的有效途径。  相似文献   

15.
为了提高农业管理的网络化和智能化水平,降低农田管理工作量,完成了基于ZigBee无线传感器网络的农田信息采集传输系统的设计,着重讲解了系统总体结构、硬件设计和部分软件设计。该系统能够快速、可靠地对农田信息进行远程采集和传输,对精细农业的发展具有重要意义。  相似文献   

16.
基于品牌效应的在线评论对稻米销量影响的实证研究   总被引:2,自引:2,他引:0  
为探索品牌、在线评论与农产品销量之间的关系以及二者如何对农产品销量产生影响。利用网络爬虫技术和统计方法,基于品牌效应视角,扩展了采纳信息模型,并依据网络中采集的真实在线评论内容,从产品特征和评论特征两个角度出发对稻米农产品进行研究,构建了稻米销量的影响因素模型并运用实际数据分析得到验证。结果表明:评论数量与稻米销量显著相关,品牌强度、评论效价和评论时效度对于稻米销售具有显著的正向影响。此外,评论效价和评论时效度能够削弱品牌强度的作用,对弱势品牌稻米销量具有更为显著的影响。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号