首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
为高效、准确、全面获取食品安全相关信息,以食品安全文本为研究对象,采用Lucene全文检索架构和长短期记忆神经网络(Long short-term memory,LSTM)构建了食品安全自动问答系统。依托于从互联网爬取的文本作为非结构化数据集,利用检索架构扩充人工标注的问题答案对规模,并以此训练了可以判断问题和答案候选句匹配程度的LSTM模型。基于Lucene检索机制进行答案候选集提取和基于LSTM模型进行答案提取,构建了一个可根据食品安全相关问题给出答案所在句子的问答系统,并对比了基于Lucene直接检索的答案抽取和基于LSTM的答案抽取这两种方法。结果表明,当候选文档数量增加时,基于LSTM模型的问题答案匹配方法,其平均准确度始终高于基于Lucene检索方法的平均准确度;而候选句子数量较小时,基于LSTM模型的问题答案匹配方法的平均准确度也高于基于Lucene检索方法的平均准确度。  相似文献   

2.
鉴于市面上搜索引擎的搜索结果繁杂且针对专业领域的问答结果很少的情况,提出了一种基于优化后Att-BiLSTM-CRF深度学习模型的问答系统的构建方法.将机械专业的问答数据与智能问答技术结合起来,实现了导入问答文档进行自然语言处理后自动生成对应齿轮传动知识图谱的功能.在用户输入问题后,系统会通过文本相似度算法和Viter...  相似文献   

3.
基于BiGRU_ MulCNN的农业问答问句分类技术研究   总被引:4,自引:0,他引:4  
"中国农技推广"问答社区每天新增提问数据近万条,对提问的有效分类是实现智能问答的关键技术环节。海量提问数据具有特征稀疏性强、噪声大、规范性差的特点,制约了文本分类效果。为了改善农业问答问句短文本分类性能,提出了BiGRU_MulCNN分类模型,运用TF-IDF算法拓展文本特征,并加权表示文本词向量,利用双向门控循环单元神经网络获取输入词向量的上下文特征信息,构建多尺度并行卷积神经网络,进行多粒度的特征提取。试验结果表明,基于混合神经网络的短文本分类模型可以优化文本表示和文本特征提取,能够准确地对用户提问进行自动分类,正确率达95. 9%,与其他9种文本分类方法相比,分类性能优势明显。  相似文献   

4.
5.
针对农业领域问答系统面临的实体识别困难的问题,提出一种基于改进Bi-LSTM-CRF的实体识别方法。首先通过BERT预训练模型的预处理,生成基于上下文信息的词向量,然后将训练出的词向量输入Bi-LSTM-CRF做进一步的训练处理,最后,利用Python的Django框架设计农业领域的实体识别、实体查询、农知问答等子系统。经过试验对比,所提出的改进的Bi-LSTM-CRF在农业信息领域具有更好的实体识别能力,在农业信息语料库上的精确率、召回率和F1值分别为93.23%、91.08%和92.16%。实现农业领域实体识别和农业信息问答的知识图谱网站演示,对农业信息化的发展具有重要意义。  相似文献   

6.
跟踪过程中发生的尺度变化、形变、遮挡是导致模型漂移的重要原因。为了克服模型漂移对鲁棒跟踪的影响,本文提出了一种利用多判别式模型和候选区域的跟踪算法。首先,该算法采用候选区域替代传统的滑动采样,适应跟踪过程中目标的位移和尺度变化。接下来,为了提高目标的表征能力,先用预训练网络提取整幅图片的深度特征,再通过感兴趣区域采样层(ROI pooling layer)快速提取每一个候选区域的深度特征,进一步提高跟踪算法的鲁棒性。最后,运用多模型选择机制进行回撤过去错误的模型更新,并通过调整搜索区域实现对目标的重检测,有效抑制了模型漂移对鲁棒跟踪的影响。实验中,本文算法与相关算法在OTB 2013数据库和UAV 20L数据库上进行了对比。结果表明,本文算法在精确度与成功率上均取得了最优性能,并能有效抑制模型漂移对鲁棒跟踪的影响。  相似文献   

7.
随着信息化技术的快速发展,农户通过线上智能农业问答系统解决线下农业病虫害问题已成为趋势。问句分类在问答系统中发挥着至关重要的作用,其准确性直接决定了最终返回答案的正确性。传统的单标签文本分类模型难以直接准确捕捉到农业病虫害问句的确切意图,而且由于缺乏大规模公开的农业病虫害问句语料,使得现有研究具有一定的难度。为此,本文基于树状结构构建了一个农业病虫害问句层级分类体系,由问句模糊性向精确性逐层细化分类,旨在克服农业问句的语义复杂性;此外,引入对抗训练方法,通过构建对抗样本并将其与原始样本一同用于大规模语言模型的训练,以提高模型泛化能力,同时缓解了因语料不足而产生的问题。通过对真实问答语料库的实验验证,本文提出的方法能够提升农业病虫害问句的分类性能,可为农业病虫害自动问答系统提供有效的问句意图识别。  相似文献   

8.
面向食品安全事件新闻文本的实体关系抽取研究   总被引:1,自引:0,他引:1  
为解决从大规模网络文本中快速、准确识别食品安全事件并进行实体关系抽取受中文复杂语法特性限制的问题,提出一种基于依存分析的面向食品安全事件新闻文本的实体关系抽取方法 FSE_ERE (Entity relation extraction of food safety events,FSE_ERE)。该方法结合句子的依存分析结果和实体关系抽取模型,对非结构化中文文本进行无监督的实体关系抽取,并引入一种将文本相似度结合到PU学习(Positive and unlabeled learning)的半监督分类方法,利用改进的特征加权处理方法提高分类精度,使得FSE_ERE方法能够在高质量的食品安全事件新闻文本中完成实体关系抽取工作。实验结果表明,FSE_ERE方法在食品安全事件新闻文本数据集和多类型混合新闻文本数据集上的实体关系抽取均达到了先进的性能,F值分别达到了71.21%和67.42%,证明了FSE_ERE方法的有效性和可移植性。  相似文献   

9.
如今的搜索引擎还无法真正满足需求。基于此,研究一种智能的问答系统,系统可以对用户提出的问题进行准确而细致的理解,然后直接给用户反馈最直接和准确的答案。文章以智能问答系统为根本研究对象,从设计智能问答系统的核心技术着手,以成功的智能问答系统的例子来说明智能问答系统需要普及的现实意义~([1])。  相似文献   

10.
郑丽敏  乔振铎  田立军  杨璐 《农业机械学报》2021,52(7):244-250,158
在食品安全法规问答系统中,食品安全法规问题的单标签文本分类不能完全概括问题所包含的有效信息,为了改进单标签文本分类效果,根据问题所涉及食品安全角度和层次的不同,提出一种基于BERT-LEAM(Bidirectional encoder representational from transformers-label embedding attentive model)的多标签文本分类方法。采用多角度、分层次的多标签标注方法将单个问题文本赋予多个标签,并引入BERT预训练语言模型表示上下文特征信息, 通过Attention机制学习标签与文本的依赖关系,进行Word embedding的聚合,将标签应用到文本分类过程中。实验表明,在粗粒度多标签数据集上的分类效果明显优于细粒度多标签数据集上的分类效果,BERT进行文本特征表示的方法优于Word2Vec方法,采用BERT-LEAM模型的分类方法在粗粒度多标签数据集与细粒度多标签数据集的F1-W值分别为93.35%和79.81%,其分类效果优于其他分类模型。  相似文献   

11.
基于卷积模型的农业问答语性特征抽取分析   总被引:1,自引:0,他引:1  
互联网农技推广社区每秒增衍问答数据近万组,这些海量数据具有隐性的词性、情感和冗余向量特征,实现数据聚合与数据块消减是该领域的难题。提出了一种基于卷积神经网络的农业问答情感极性特征抽取分析模型,结合农业分词字典,对数据集进行分词后使用Skip-gram模型转换为256维的词向量,利用批规范后的卷积神经网络对数据集进行训练,从而得到用于识别农技推广社区问答词性情感相似性的神经网络模型参数。试验结果表明,该方法能够准确识别测试样例集中的冗余队列,与其他5种文本分类方法进行比较,各项指标优势明显,针对测试集的语性特征抽取准确率达到82.7%。  相似文献   

12.
为解决文本特征提取不准确和因网络层次加深而导致模型分类性能变差等问题,提出基于深度卷积神经网络的水稻知识文本分类方法。针对水稻知识文本的特点,采用Word2Vec方法进行文本向量化处理,并与OneHot、TF-IDF和Hashing方法进行对比分析,得出Word2Vec方法具有较高的分类精度,正确率为86.44%,能够有效解决文本向量表示稀疏和信息不完整等问题。通过调整残差网络(Residual network,Res Net)结构,分析残差模块结构和网络层次对分类网络的影响,构建了9种分类网络结构,测试结果表明,具有4层残差模块结构的网络具有较好的特征提取精度,Top-1准确率为99.79%。采用优选出的4层残差模块结构作为基本结构,使用胶囊网络(Capsule network,Caps Net)替代其池化层,设计了水稻知识文本分类模型。与Fast Text、Bi LSTM、Atten-Bi GRU、RCNN、DPCNN和Text CNN等6种文本分类模型的对比分析表明,本文设计的文本分类模型能够较好地对不同样本量和不同复杂程度的水稻知识文本进行精准分类,模型的精准率、召回率和F1值分别不小于95.17%、95.83%和95.50%,正确率为98.62%。本文模型能够实现准确、高效的水稻知识文本分类,满足实际应用需求。  相似文献   

13.
通过对植物叶特征的分析,可以确定植物的种类和生长状态,对于植物研究、指导生产等具有重要意义.传统的叶特征提取方法都是通过人的手工操作完成的,效率较低,而当前可以借助于图像处理技术对叶特征进行自动提取.为此,对基于图像处理的叶特征提取研究现状进行了综述,并对其做了展望.  相似文献   

14.
植物领域知识图谱构建中本体非分类关系提取方法   总被引:3,自引:0,他引:3  
采用本体学习的方法,以百度百科植物类词条内容的非结构和半结构化中文文本信息作为语料进行处理。使用一种有指导的基于依存句法分析的词汇-语法模式来获取植物领域的概念、分类和非分类关系,并分别利用基于词表过滤的方法和给模式添加限制的方法,较大程度地提高了关系抽取的精确度,完成在轻量级本体的基础上自动构建重量级本体。该方法建立了一个特定领域语料的概念层次,提高了最具代表性的分类和非分类关系的发现,并使用OWL语言形式化表达抽取结果。实验表明,该方法在非分类关系抽取上取得了较好的结果,为该领域知识图谱构建奠定了基础。  相似文献   

15.
针对紧固套缺陷检测中人工检测效率低等问题,设计了基于机器视觉的紧固套缺陷检测方法.首先根据紧固套的特点搭建了图像采集平台,突出缺陷特征;然后基于Halcon设计了相应的缺陷检测方法:先通过模板匹配的方法对检测区域定位;再使用基于频域图像差分的方法抑制干扰,突显缺陷特征;然后使用改进的动态阈值法得到缺陷备选图;最后使用面...  相似文献   

16.
热词提取对于监控和分析农业舆情具有重要意义,目前已有一定研究基础,但仍存在针对性差等问题,无法满足农业领域不同产业用户群的个性化需求,为此,提出一种基于农业网络信息分类的热词自动提取方法。首先采用多标记分类算法对文本语料进行分类,按分类类别构建语料库,然后采用基于信息熵的方法对每个类别分别提取热词候选词,最后采用基于时间变化的方法进行候选词热度计算,根据候选词热度排序结果得到热词。本文抽取农业网站上的15 354条文本进行实验,结果表明,热词提取准确率达到0.9以上,能够较高质量地提取农业热词,为不同农业用户群体发现和分析产业热点提供帮助。  相似文献   

17.
为了满足智能农业车辆安全正常作业,提出了基于全景视觉的运动障碍目标检测。与传统的单目和双目视觉相比,全景视觉具有360°无盲区检测的优点。首先系统使用多线程技术采集多目视觉图像,并用改进RANSAC-SIFT算法进行特征点提取与匹配,进而拼接全景视觉图像;其次采用改进的CLG光流法处理全景图像,检测运动障碍目标。试验表明:基于多线程技术和改进RANSAC-SIFT的全景拼接算法,与传统SIFT算法相比,平均提高特征点匹配准确度25.6%,加快运算速度25.0%;采用改进CLG光流法进行运动障碍检测,平均检测时间为1.55 s,检测成功率为95.0%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号