首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
为解决因外来海洋生物领域实体复杂且实体间存在嵌套导致命名实体识别效果较差等问题, 提出基于融合注意力机制的卷积神经网络 (CNN) -双向门控循环单元网络 (BiGRU) -条件随机场 ( CRF) 网络模型进行外来海洋生物命名实体识别, 并构造词向量、词性特征向量等特征作为网络模型的联合输入, 以提升网络模型识别效果...  相似文献   

2.
针对油气领域知识图谱构建过程中命名实体识别使用传统方法存在实体特征信息提取不准确、识别效率低的问题,提出了一种基于BERT-BiLSTM-CRF模型的命名实体识别研究方法。该方法首先利用BERT(bidirectional encoder representations from transformers)预训练模型得到输入序列语义的词向量;然后将训练后的词向量输入双向长短期记忆网络(bi-directional long short-term memory, BiLSTM)模型进一步获取上下文特征;最后根据条件随机场(conditional random fields, CRF)的标注规则和序列解码能力输出最大概率序列标注结果,构建油气领域命名实体识别模型框架。将BERT-BiLSTM-CRF模型与其他2种命名实体识别模型(BiLSTM-CRF、BiLSTM-Attention-CRF)在包括3万多条文本语料数据、4类实体的自建数据集上进行了对比实验。实验结果表明,BERT-BiLSTM-CRF模型的准确率(P)、召回率(R)和F1值分别达到91.3%、94.5...  相似文献   

3.
命名实体识别是构建知识图谱的关键,在农业病虫害领域存在病虫害数据匮乏、实体结构复杂、实体类型识别困难等问题。针对于病虫害数据匮乏,本文采用网络爬虫技术以及扫描文本数据的方法,构建了玉米、小麦、水稻病虫害实体语料库。传统的命名实体识别方法无法解决农业病害实体结构复杂、实体类型识别困难等问题。本文提出一种基于GPT规则修正的LEBERT-BilSTM-CRF模型,LEBERT模型构建了字典树和Lexicon-Adapter结构,将原始字符进行扩充增加数据的丰富性,将经过BiLSTM-CRF的输出和GPT结果进行实体标签修正以此来提高准确率。在公开数据集训练得到合适的参数后,在自建文本语料库进行训练,通过条件随机场和GPT修正生成全局最优序列取得很好的识别效果,准确率为94.23%,召回率为92.34%,F1值为93.28%。  相似文献   

4.
命名实体识别是从农产品信息文本数据中有效抽取信息的关键一步,旨在从非结构化文本中确定与农产品特性相关的命名实体。农业领域的命名实体识别研究大多集中在农业病虫害领域,关于农产品信息文本的实体识别研究较少,通过采用BMES标注的方式对爬虫获取的农产品信息文本数据进行标注,提出融合BERT的BiLSTM-CRF深度学习模型对该文本数据进行实体抽取。将该模型与多种神经网络模型的实验结果比较发现,融合BERT的BiLSTM-CRF模型对农作物、地区、富含营养成分等3种命名实体识别的准确率和召回率分别为82.25%和84.54%,明显优于IDCNN-CRF等神经网络模型,说明该方法能有效识别抽取农产品信息文本数据命名实体。基于此,命名实体识别作为中文文本信息抽取的关键技术,在农产品信息推荐系统、智能问答等方面将会有广泛的应用前景。  相似文献   

5.
生物命名实体识别是对生物医学文本进行信息处理的关键技术.准确的生物命名实体识别工具是对文本进行后续工作如信息提取或文本分类等的先决条件.经过多年的研究,生命科学领域生物命名实体识别取得了一定的进展.本文总结了生物命名实体的特征,分析了基于不同方法的生物命名实体识别系统,及生物命名实体识别方法在提取蛋白质互作等方面的丰富应用,并展望了未来的发展趋势.  相似文献   

6.
针对棉花病虫害文本语料数据匮乏且缺少中文命名实体识别语料库,棉花病虫害实体内容复杂、类型多样且分布不均等问题,构建了包含11种类别的棉花病虫害中文实体识别语料库CDIPNER,提出了一种基于RoBERTa多特征融合的命名实体识别模型。该模型采用掩码学习能力更强的RoBERTa预训练模型进行字符级嵌入向量转换,通过BiLSTM和IDCNN模型联合抽取特征向量,分别捕捉文本的时序和空间特征,使用多头自注意力机制将抽取的特征向量进行融合,最后利用CRF算法生成预测序列。结果表明,该模型对于棉花病虫害文本中命名实体的识别精确率为96.60%,召回率为95.76%,F1值为96.18%;在ResumeNER等公开数据集上也有较好的效果。表明该模型能有效地识别棉花病虫害命名实体且具有一定的泛化能力。  相似文献   

7.
基于深度学习的渔业领域命名实体识别   总被引:2,自引:0,他引:2  
为了解决基于分词的渔业领域命名实体识别效果受分词准确度影响这一问题,采用一种基于深度学习的渔业领域命名实体识别方法。该方法使用神经网络训练得到字向量作为模型输入,避免了分词不准确对渔业领域命名实体识别效果造成的影响;针对渔业领域命名实体长度较长这一特点,使用LSTM单元保持较长时间记忆信息,并将标记信息融入到CRF模型中构建Character+LSTM+CRF实体识别模型。为验证方法的有效性,在渔业领域语料集上进行多组实验,结果表明,本研究中提出的Character+LSTM+CRF方法具有较好的效果,与LSTM模型相比较,在准确率、召回率、F值上分别提升了3.39%、2.99%、3.19%,对于渔业领域实体识别具有较好的效果。  相似文献   

8.
为解决渔业标准命名实体识别任务中部分实体语料分布稀疏导致的效果不佳问题,提出了基于多元组合数据增广(data augmentation method based on multiple combination,MCA)的渔业标准命名实体识别方法,该方法融合了基于领域词典的联合替换算法(joint replacement...  相似文献   

9.
融合注意力机制和BiLSTM+CRF的渔业标准命名实体识别   总被引:2,自引:0,他引:2  
为了解决渔业标准文本中专有命名实体具有上下文敏感性、长序列存在语义稀释等问题,提出了基于E-BIO标注法和融合注意力机制的BiLSTM+CRF (BiLSTM+Attention+CRF)命名实体识别模型,E-BIO标注法引入渔业标准文本中的结构化信息,可以使模型有效学习上下文结构特征,而注意力机制输出不断变化的语义向量,可有效解决长序列语义稀释问题。为验证所提出方法的有效性,在采用E-BIO方法标注的语料上进行对比试验,结果显示,BiLSTM+Attention+CRF模型对不同类别的渔业标准命名实体识别的准确率均能达到90%以上,召回率均能达到85%以上。研究表明,本研究中提出的BiLSTM+Attention+CRF命名实体识别模型可以有效利用上下文结构特征,避免了语义稀释问题,对于渔业标准命名实体识别具有较好的识别性能。  相似文献   

10.
基于本体(ontology)知识抽取的主要目标是研究如何从没有语义信息的非结构文档中抽取与领域本体匹配的知识,从而实现对知识充分、有效的利用。以农业知识为研究对象,提出一种利用本体从Web网页上提取知识的方法。首先利用自顶向下的方法建立农业领域本体,然后利用噪声消除算法去除噪音块,接着将农业领域本体解析的结果应用到中文分词、命名实体识别及知识抽取过程中,从而使得中文分词和命名实体识别的结果更准确,解决Web信息抽取系统中抽取结果缺乏语义信息的问题。最后,通过试验验证该抽取系统能够得到性能较高的抽取结果。  相似文献   

11.
大豆大垄密植栽培技术模式及配套机械化系统研究   总被引:3,自引:0,他引:3  
根据对大豆大垄密栽培机械化生产全过程的田间对比试验和调查研究,提出了一套适合该地区和技术先进的大豆种植全过程机械化栽培技术模式,并以此为例,建立各作业机组费用与作业量之间的数学模型,通过计算机程序进行了机组经济可行域和线性规划理论分析,对田间机械化作业项目所选的动力和机具进行数量配备,形成一套最优的机具配套方案.经实践证明该方案经济可行.  相似文献   

12.
发展农业产业化是实现农业现代化,促进农业和农村经济发展的必由之路,本从邯郸市的实际情况出发,根据农业产业化经营的内在要求,就进一步加速推进农业产业化进程进行了探讨。  相似文献   

13.
本文基于不同的经济条件与信息技术和网络环境的差异,提出面向发达地区、次发达地区和欠发达地区农村的有效开展农业科技远程培训的解决方案。方案以天网(卫星网)、地网(互联网、广电网)、入网(教学队伍)三网组成的立体式、全方位、多媒体、多终端的农业科技远程培训模式,构建一个天地人三网合一的农业科技远程培训服务体系。通过试点实施,取得显著的农业科技远程培训效果,深受农民欢迎。  相似文献   

14.
[目的]为吉林省耕地高效利用及可持续利用提供科学依据。[方法]采用DEA-Tobit二阶段法,第一阶段运用数据包络分析法中的BCC模型对吉林省耕地利用效率进行分析,第二阶段通过Tobit回归模型对耕地利用效率的影响因素进行分析。[结果]1996~2010年吉林省耕地利用纯技术效率表现出稳定的较高水平;技术效率表现不佳主要是由规模效率表现不佳所致;单位耕地面积农业机械总动力、农村人均纯收入等因素对耕地利用效率的影响较为显著。  相似文献   

15.
基于农业网络信息资源难以快速有效获取的现实情况,阐述了农业信息个性化服务的内涵,剖析农业网络信息资源个性化服务的特殊性,提出了符合农业生产的特殊性及农业信息用户特点的个性化服务模式,以期对推动农业信息服务发展及相关研究提供有益参考。  相似文献   

16.
为提高"两型农业"技术推广效率,利用辽宁省573户微观调查数据,运用Binary Logistic模型,对农户节水灌溉技术、测土配方施肥技术、秸秆还田技术3类"两型农业"技术采用行为的关键影响因素进行了分析。结果表明:1)户主年龄、社会公职、农地分散程度、户主外出务工、参加培训、技术获取渠道种数对农户节水灌溉技术的采用影响显著。2)社会公职、参加培训、技术获取渠道数量、农技推广、作物类型对农户测土配方施肥技术采用呈显著正向影响;在控制其他因素的条件下,水稻种植户采用节水灌溉技术、测土配方施肥技术和秸秆还田技术的比例比对照组玉米种植户分别高13.7%、6.8%、-22.4%。3)参加培训、农技推广、经营规模对农户秸秆还田技术采用影响显著。同一因素对不同两型农业技术采用的影响差异明显;加强技术培训和拓宽"两型农业"技术传播渠道能提高不同类型农业技术采纳率。  相似文献   

17.
基于生态学原理、系统论思想,以农业图书馆为研究对象,分析农业图书馆信息生态系统的构成因子与内涵。结合农业图书馆信息生态的特点,构建信息生态系统模型,并应用该模型来指导农业图书馆的生态化发展。文章将信息生态学的研究方法应用到农业图书馆的建设中,以期为农业图书馆的发展提供理论指导,同时丰富信息生态学的理论研究体系。  相似文献   

18.
为了探索高效节水灌溉措施,保证农业生产能够得到长足发展,本文以庐江灌区为例,结合庐江县在农业节水灌溉方面的管理现状,总结出细化计量单元、推进计量自动化和信息化、实施“干站合一”水价模式、建立“长藤结瓜”式灌溉系统、实施渠系节水改造工程、探索小型水利工程管护新模式等经验做法,并针对农业节水灌溉的建设与管理提出了相关建议,以期为完善灌区农业节水灌溉方式、推动灌区农业发展提供借鉴。  相似文献   

19.
在农业垂直搜索引擎研究过程中,中文分词是重要的研究方向。针对传统农业垂直搜索引擎搜索信息抽取不准确、速度慢等缺点,采用双数组Trie树为基本模型,利用中文词条首字区位码与数据库表行号相对应的方式,并根据农业垂直搜索引擎的需要设置了农业词汇的词性编码,以My SQL数据库为例设计了农业领域专用的分词词典。该分词词典可充分利用数据库的优势进行词典组织,并且可以进行词库的远程共享和共同维护,方便不同的系统进行访问;词条按首字分类存放构造双数组Trie树,可有效减少构造过程的内存空间。该农业分词词典结构对其他领域和行业也具有借鉴意义。  相似文献   

20.
探索了构建农业产业链信息流模型,以"关联数据采集-多源数据同化融合-海量数据分析处理-多用户交互应用"为研究路线,在前人研究的基础上,重点解决海量数据挖掘和分析处理、基于领域本体的数据解析、信息编码标准等问题,集成其他相关的技术,支持农业产业链各环节的信息获取、管理、分析和利用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号