共查询到17条相似文献,搜索用时 171 毫秒
1.
农产品价格主题搜索引擎的研究与实现 总被引:1,自引:0,他引:1
当前农业垂直搜索引擎无法预测农产品价格趋势,难以满足农业生产者行情分析需要。文章设计农产品价格主题搜索引擎。首先网络爬虫从农业综合网站搜集网页,对网页进行转码、去重、提取内容等处理;使用主题相关度算法计算网页的主题相关度,用分类器对网页分类,将与主题相关的网页解析、存储;最后提取农产品价格及其影响因素信息。结果表明,系统可搜集农产品价格信息及影响农产品价格因素信息,为后续农产品价格预测提供数据支持。 相似文献
2.
3.
4.
5.
《浙江农林大学学报》2017,(4)
针对如何在互联网上准确获取森林经营知识的问题,提出研建森林经营知识采集系统来解决这一问题。在分析森林经营知识采集问题的基础上,设计系统流程、系统模块、数据库,改进网络爬虫规则并加以限定,论述爬虫工作流程和算法。该系统总结分析了森林经营主题网页的特点,通过建立森林经营特征向量对采集内容进行识别,并对森林经营知识去噪处理,智能匹配规则提取知识,使用欧氏距离识别指纹去除重复的森林经营知识。实验结果表明,该系统采集的森林经营知识具有高主题相关度、高准确率、低重复度的特点,满足服务于森林经营决策支持系统的要求。 相似文献
6.
7.
8.
采用聚焦爬虫可以提高搜索引擎的检索效率,聚焦爬虫经常使用正则表达式来进行有效的信息检索,着重分析了网页检索中常用的正则表达式,为搜索引擎的构建提供帮助。 相似文献
9.
详细阐述了基于扩展SKOS模型的简单农业本体系统建设方法.应用主题相关度计算和改进Pagerank算法,设计开发了在线服务的搜索引擎系统,实现了带语义查询扩展.测试结果表明,应用该方法建立的搜索引擎获得了较好的网页相关度排名. 相似文献
10.
《江苏农业科学》2017,(8)
为了解决养殖投入品的质量信息匮乏、监管效率低下等问题,结合网络舆情信息发布与获取的特点,引入了信息抽取和行政监管并存的理念,构建了基于B/S架构的养殖投入品质量的信息发布与舆情监管系统。采用主题爬虫算法作为抓取网络舆情的信息关键步骤,避免下载大量与主题不相关的网页,提高了信息抓取的效率和准确率。并利用向量空间模型对主题爬虫算法中的内容相似度进行计算与评价,提高了该算法爬行的准确性,并在实际系统中得到了验证。同时该系统还提供了用户信息管理、质量安全信息管理、养殖投入品供求信息管理等功能。系统测试和应用结果表明,该系统具有功能丰富、运行稳定、信息抓取准确、可扩展性强等优点,能较好地满足不同角色对养殖投入品质量信息的需求。 相似文献
11.
12.
大数据是当前企业界、政府部门研究的热点,学术界也对其在科学研究中的应用开展了大量研究。尤其是,随着经济的发展和科技的进步,海量的医疗信息数据为医疗信息化带来了新的挑战。以上海市为例,基于区域卫生信息平台建设过程中存在的主要问题,探究在大数据模式下,完成结构化、半结构化和非结构化数据的医学信息数据爬虫、可扩展的海量存储、基于健康搜索引擎的高性能检索应用服务,满足高效率、高并发的健康信息检索服务新模式,完善现有信息体系,实现跨部门、跨专业的信息协同。 相似文献
13.
14.
张戬慧 《东北农业大学学报》2009,40(9)
系统主要研究智能搜索系统在动物医学领域中的应用。该系统包括3个模块,分别是数据采集模块、数据预处理模块、数据应用模块。在数据处理的不同阶段,采用不同的处理技术和算法,有向量空间模型算法、SDD改进算法、网页自动分类技术、中文分词技术、数据压缩和搜索技术。 相似文献
15.
16.
目的改进标准遗传算法以提高蛋白质结构的预测效率。方法在标准遗传算法的基础上引入蒙特卡罗局部优化策略、克隆体过滤策略、多胎竞争选择策略等,在均匀变异的基础上,引入一系列结构突变算子。利用改进的遗传算法对标准蛋白质序列进行二维折叠模拟。结果与其他算法相比,利用改进的遗传算法搜索到了HP60和HP64序列能量更低的构型。结论引入的遗传策略和突变算子增强了遗传算法的寻优能力。改进的遗传算法是个极具潜力的蛋白质结构预测方法。 相似文献
17.
本文首先介绍Win Help主题文件的控制编码即分页符、控制符、下划线和隐藏文字的含义及其使用的方法。然后,以生物统计分析平台为例说明Win Help主题文件的撰写技巧及其存在的问题。图1参3 相似文献