首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 218 毫秒
1.
目前,获取林业文本关键信息存在2个问题:关键信息获取主要从关键词角度考虑,忽略了词语的信息类型;网络上的林业文本没有统一的记述结构,词语信息类型提取困难。为此,本文提出了基于改进TextRank和簇过滤的林业文本关键信息抽取方法,以"关键词+信息类型"两部分表示文本关键信息。首先,抽取关键词并进行Word2Vec向量化,然后通过构建融合词语特征值、边权值的图模型对TextRank进行改进,对经迭代收敛得到的稳定图进行归并聚类形成簇;然后,设计簇品质评价公式进行簇过滤,再次应用TextRank形成最终簇集合;最后,对簇进行信息类型标注。对于测试文本,通过比较关键词向量和簇心向量的距离获得词语的信息类型,将信息类型与关键词结合得到文本的关键信息。基于2 000篇与林业政策新闻相关的林业文本进行实验,最终簇集合的紧密度为0. 968 0,间隔度为0. 057 2,综合评价指标为0. 887 1;对其中400篇文本进行关键词人工标注,将本文关键词抽取方法与TextRank、TF-IDF等6种算法进行比较,结果表明,本文方法在MRR、Bpref、准确率和综合评价指标上均获得了较好的效果,说明本文方法在提取林业文本关键词方面具有优势。  相似文献   

2.
基于卷积模型的农业问答语性特征抽取分析   总被引:1,自引:0,他引:1  
互联网农技推广社区每秒增衍问答数据近万组,这些海量数据具有隐性的词性、情感和冗余向量特征,实现数据聚合与数据块消减是该领域的难题。提出了一种基于卷积神经网络的农业问答情感极性特征抽取分析模型,结合农业分词字典,对数据集进行分词后使用Skip-gram模型转换为256维的词向量,利用批规范后的卷积神经网络对数据集进行训练,从而得到用于识别农技推广社区问答词性情感相似性的神经网络模型参数。试验结果表明,该方法能够准确识别测试样例集中的冗余队列,与其他5种文本分类方法进行比较,各项指标优势明显,针对测试集的语性特征抽取准确率达到82.7%。  相似文献   

3.
屠珺  苑进  苗中华  刘成良 《农业机械学报》2011,42(Z1):128-132,127
为了能够根据当前场景内容在线提取优势推理特征,使得提取后的优势特征集能更好地区分当前场景的地形类别,满足农业机器人室外导航环境要求,提出一种基于迭代式RELIEF算法的农业机器人地形标记方法。该方法通过超像素分割产生训练样本,由迭代式RELIEF算法输出一个特征权重向量,向量每个元素的值代表其所对应的候选特征对地形标记的影响程度,通过对特征权重设定阈值来剔除大量无关特征。地形标记试验结果表明,该方法不但能够将地面标记准确率与障碍标记召回率分别提高1%与0.8%,还能将SVM地形分类器的计算复杂度降低40%左右。在导航试验中,该方法能够使农业机器人的导航效率提高15%左右。  相似文献   

4.
玉米病虫害诊治本体构建技术研究   总被引:2,自引:0,他引:2  
针对现有农业病虫害专家系统领域知识共享和重用困难、症状输入严重影响准确率等问题,研究了基于领域知识、推理知识和任务知识的本体构建技术。同时,提出了基于分词、改进的词义消歧算法、同位词消歧及BNF范式形式化等自然语言处理步骤将症状描述训练集转化为本体形式,从而使专家系统引入本体技术,并利用其优势极大地改进了系统的健壮性及准确率。  相似文献   

5.
针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectional encoder representation from transformers)预训练语言模型进行文本向量化表示;通过双向长短时记忆网络(Bidirectional long short-term memory network, BiLSTM)获取上下文语义特征;由条件随机场(Conditional random field, CRF)输出全局最优标签序列。基于此,在CRF层后加入畜禽疫病领域词典进行分词匹配修正,减少在分词过程中出现的疫病名称及短语等造成的歧义切分,进一步提高了分词准确率。实验结果表明,结合词典匹配的BERT-BiLSTM-CRF模型在羊常见疫病文本数据集上的F1值为96.38%,与jieba分词器、BiLSTM-Softmax模型、BiLSTM-CRF模型、未结合词典匹配的本文模型相比,分别提升11.01、1...  相似文献   

6.
为了提高引黄灌区灌溉用水效率,针对引黄灌区属性值和属性权重均未知的多属性灌溉用水效率评价问题,提出了一种基于四参数区间数的评价方法,并选取工程、环境和管理三方面进行评价。通过改进熵值法和群决策相对熵集结模型计算组合权重,通过VIKOR算法计算待评价对象的排名,然后将算法应用到三义寨灌区引黄灌区灌溉用水效率的评价中,通过评价结果发现在不能人为的影响环境指标的情况下,为了提高引黄灌区灌溉用水效率,应尽量提高管理的投入。  相似文献   

7.
针对农业机器人在完成采摘、质量检测、信息采集等作业中路径规划低效问题,采用粒子群(PSO)和改进蚁群(EACO)融合算法对路径规划进行改进。该融合算法先通过带有惯性权重的粒子群算法找到初始路径,然后将该种群看作蚁群算法的初始信息素来分布,从而进行精密搜索,避免盲目搜索带来的低效,提高搜索速度。结果表明:融合后的PSOEACO算法得出的路径长度比改进的EACO算法缩短2.5%,完成任务用时缩短5.1%。本算法能够规划出最优行走路径,提高农业机器人的工作效率。  相似文献   

8.
基于改进凸壳理论的遮挡油茶果定位检测算法   总被引:3,自引:0,他引:3  
李立君  阳涵疆 《农业机械学报》2016,47(12):285-292,346
针对传统凸壳理论进行遮挡果实定位检测时由于过多剔除有效轮廓,造成目标果实定位误差较大,甚至无法识别目标果实的问题,提出了一种基于改进凸壳理论的遮挡油茶果定位检测算法。首先利用基于颜色特征的阈值分割法对油茶果遮挡图像进行目标分割,并通过预处理操作剔除图像中的背景噪声,获得目标果实的二值图像;然后采用凹点搜寻算法检测重叠目标的凹点,并根据凹点对重叠目标进行分离,获得相互独立的目标图像;再构建各独立目标的凸包,并提取凸壳,利用轮廓提取算法确定各独立目标凸壳上的有效轮廓;最后根据提取的有效轮廓求解目标果实形心坐标和半径,完成遮挡果实的定位检测。试验结果表明,改进算法平均耗时为0.491 s,比传统凸壳方法增加了24.07%,但其仅占油茶果采摘机器人单个果实采摘周期的2.46%,对于图像中的遮挡油茶果目标,改进方法的识别率达到93.21%,相比传统凸壳方法提升了7.47个百分点,改进算法的平均定位检测误差和平均重合度分别为5.53%和93.43%,比传统凸壳算法平均定位误差降低了6.22个百分点,平均重合度提高了6.79个百分点,表明文中所提出的方法能够较好地识别和定位自然环境中的遮挡油茶果。  相似文献   

9.
设计了一套面向移动终端的农业知识文语转换系统,该系统借鉴语义检索技术中对于关键词的语义处理方式,用语义检索技术处理文本切分过程中所遇到的歧义字段,可将农业文本知识转换为自然流畅的语音,并结合呼叫中心技术、借助移动终端推广农业知识。首先对文语转换中的文本分析流程进行分析,明确歧义字段处理为文语转换的关键点。在明确关键点的基础上,设计出用于进行分词的词典,进而基于词典匹配和统计分析模型对歧义字段进行提取,再基于语义检索对歧义字段进行处理,从而实现歧义字段的切分,最终采用Cool Edit Pro 2.0软件实现语音合成和韵律处理功能,开发出面向移动终端的农业知识文语转换系统,可有效解决歧义字段的处理问题。由测试结果可以看出,本文算法的查准率为94.03%,较最大匹配法和三元语法的查准率分别提高了5.72个百分点和0.97个百分点;本文算法的查全率为95.32%,较最大匹配法和三元语法的查全率分别提高了0.23个百分点和1.95个百分点;本文算法的F-1测度为0.93,较最大匹配法提高了0.01,与三元语法相同,说明本文算法具有较好的性能。  相似文献   

10.
热词提取对于监控和分析农业舆情具有重要意义,目前已有一定研究基础,但仍存在针对性差等问题,无法满足农业领域不同产业用户群的个性化需求,为此,提出一种基于农业网络信息分类的热词自动提取方法。首先采用多标记分类算法对文本语料进行分类,按分类类别构建语料库,然后采用基于信息熵的方法对每个类别分别提取热词候选词,最后采用基于时间变化的方法进行候选词热度计算,根据候选词热度排序结果得到热词。本文抽取农业网站上的15 354条文本进行实验,结果表明,热词提取准确率达到0.9以上,能够较高质量地提取农业热词,为不同农业用户群体发现和分析产业热点提供帮助。  相似文献   

11.
为解决文本特征提取不准确和因网络层次加深而导致模型分类性能变差等问题,提出基于深度卷积神经网络的水稻知识文本分类方法.针对水稻知识文本的特点,采用Word2Vec方法进行文本向量化处理,并与One-Hot、TF-IDF和Hashing方法进行对比分析,得出Word2Vec方法具有较高的分类精度,正确率为86.44%,能...  相似文献   

12.
利用Hash表在查找效率上的优势,提出了基于Hash机制的词典查找、更新、删除和添加等操作算法。该算法根据汉字GB码的特点,将保存首字GB码,提高了存储空间利用率;在词典中建立农业专业词汇和方言词汇一对多的对应关系,在满足系统需求的同时,提高了分词的准确性。   相似文献   

13.
基于深度学习与复合字典的马铃薯病害识别方法   总被引:4,自引:0,他引:4  
为解决自然环境下小样本病害叶片识别率低、鲁棒性不强的问题,以马铃薯病害叶片为研究对象,提出一种基于深度卷积神经网络与复合特征字典结合的病害叶片识别方法。首先,利用迁移学习技术对Faster R-CNN模型进行训练,检测出病害叶片的斑块区域;然后,采用高密度采样方法对整个斑块区域提取颜色特征和SIFT特征,建立颜色特征和SIFT特征词汇表,再由K-均值聚类算法对两类表观特征词汇表进行聚类,构造出复合特征字典;最后,将病害区域提取的特征在复合特征字典中映射后获得特征直方图,利用支持向量机训练出病害的识别模型。试验结果表明,复合特征字典中视觉单词数为50时,病害识别的鲁棒性和实时性最佳,平均识别准确率为90.83%,单帧图像耗时1.68 s;在颜色特征和SIFT特征组合下,本文方法在自然光照条件下对病害的平均识别准确率最高,达到84.16%;在相同数据集下,与传统词袋法相比,本文方法的平均识别准确率提高了25.45个百分点。  相似文献   

14.
基于支持向量机的中文农业文本分类技术研究   总被引:1,自引:0,他引:1  
高效地组织、分类信息,是提供个性化农业信息推荐服务的基础。根据农业文本信息特点,提出了一种基于线性支持向量机(Support vector machine,SVM)的中文农业文本分类模型,首先构建农业行业分类关键词库,通过特征词选择和权重计算,构建分类器模型,实现信息的自动分类。实验选取了1 071个测试文档,并按照种植业、林业、畜牧业、渔业进行分类。结果表明,分类准确率为96.5%,召回率为96.4%。实验结果高于贝叶斯、决策树、KNN、SMO等分类算法,将该模型应用于农业物联网行业信息综合服务平台,运行结果表明,该方法能够实现中文农业文本信息的自动分类,响应时间满足系统要求。  相似文献   

15.
针对果园道路无明显边界且道路边缘存在阴影、土壤和沙石干扰等问题,提出一种基于特征融合的果园非结构化道路识别方法。通过相机标定获取畸变参数对采集到的图像进行畸变矫正,并提出一种基于滤波与梯度统计相结合的动态感兴趣区域(ROI)提取方法对HSV颜色空间S分量进行ROI选取,采用最大值法将颜色特征与S分量多方向纹理特征掩膜相融合并进行二值化与降噪处理。根据道路边缘突变特征寻找特征点,并提出一种基于距离与位置双重约束的两级伪特征点剔除方法。为更好贴合非结构化道路不规则边缘,引入分段三次样条插值法拟合道路边缘,以此实现道路识别。试验结果表明,在晴天、阴天、顺光、逆光、冬季晴天和雨雪天气6种工况条件下,S分量、纹理图像和融合图像的平均纵向偏差均值分别为2.43、39.71、1.36像素,平均偏差率均值分别为0.99%、18.02%和0.54%,相较于S分量与纹理图像而言,使用本文方法构建的融合图像其平均纵向偏差与平均偏差率均得到有效减少。最小二乘法、随机采样一致性法(RANSAC)与分段三次样条插值法拟合边缘的平均偏差均值分别为2.64、3.16、0.66像素,平均偏差率均值分别为1.02%、1....  相似文献   

16.
为解决自然光照环境下复杂背景葡萄叶片图像的自动分割问题,使用一种DeepLab v 3+语义分割算法,完成对葡萄叶片分割.该算法采用ResNet 101作为主干网络进行特征抽取;采用空洞卷积和编码模块进行多尺度特征融合,将ResNet的中间信息和编码模块的特征组合作为解码输入;采用上采样的方式进行尺度还原,得到语义分割...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号