首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为促进人工智能各项技术在农业生产中发挥作用,探索土壤肥力领域知识的组织、应用,采用人工构建的方法,以安徽省为例,使用Protégé本体库构建工具构建土壤肥力领域本体,再将土壤肥力相关的结构化、半结构化和非结构化数据通过纠错等操作后采取反距离加权插值,基于ERNIE-BiLSTM-CRF与PCNN-Attention深度学习模型实现命名实体识别和关系抽取任务,其后把得到的三元组数据保存至图数据库Neo4j中,成功构建土壤肥力可视化知识图谱。该研究可在本体构建、实体关系抽取模型以及知识图谱的可视化方面为其他农业知识图谱的构建提供参考。  相似文献   

2.
在当今互联网信息资源中,农业学者的信息组织仍处于相对无序和混乱的状态,成果信息与农业学者信息也难以实现一体化关联应用。为了实现农业学者信息的有效组织,提出针对农业学者的本体构建方法,为建立农业学者信息检索系统和知识服务平台等知识图谱应用奠定了模式层基础。首先,根据现有本体资源以及学者数据的特殊性,确定本体类的结构和属性,完成本体框架的构建;其次,使用本体描述语言进行形式化表示,并与现有知识组织资源进行关联以实现本体的共享与互操作;再次,应用深度学习算法实现长三角地区农业学者信息的命名实体识别,并利用Neo4j图数据库存储和展示农业学者实例数据;最后,以长三角地区农业学者为例进行本体验证与评估。结果表明,BiLSTM-CRF模型相较于其他模型在学者命名实体识别任务中具有更高的准确率、召回率和F1值,对于农业学者领域的实体抽取具有良好的适用性。进而为建立全面的农业学者知识图谱和智能化农业知识服务平台奠定语义基础,并提供建设思路。  相似文献   

3.
命名实体识别是从农产品信息文本数据中有效抽取信息的关键一步,旨在从非结构化文本中确定与农产品特性相关的命名实体。农业领域的命名实体识别研究大多集中在农业病虫害领域,关于农产品信息文本的实体识别研究较少,通过采用BMES标注的方式对爬虫获取的农产品信息文本数据进行标注,提出融合BERT的BiLSTM-CRF深度学习模型对该文本数据进行实体抽取。将该模型与多种神经网络模型的实验结果比较发现,融合BERT的BiLSTM-CRF模型对农作物、地区、富含营养成分等3种命名实体识别的准确率和召回率分别为82.25%和84.54%,明显优于IDCNN-CRF等神经网络模型,说明该方法能有效识别抽取农产品信息文本数据命名实体。基于此,命名实体识别作为中文文本信息抽取的关键技术,在农产品信息推荐系统、智能问答等方面将会有广泛的应用前景。  相似文献   

4.
针对油气领域知识图谱构建过程中命名实体识别使用传统方法存在实体特征信息提取不准确、识别效率低的问题,提出了一种基于BERT-BiLSTM-CRF模型的命名实体识别研究方法。该方法首先利用BERT(bidirectional encoder representations from transformers)预训练模型得到输入序列语义的词向量;然后将训练后的词向量输入双向长短期记忆网络(bi-directional long short-term memory, BiLSTM)模型进一步获取上下文特征;最后根据条件随机场(conditional random fields, CRF)的标注规则和序列解码能力输出最大概率序列标注结果,构建油气领域命名实体识别模型框架。将BERT-BiLSTM-CRF模型与其他2种命名实体识别模型(BiLSTM-CRF、BiLSTM-Attention-CRF)在包括3万多条文本语料数据、4类实体的自建数据集上进行了对比实验。实验结果表明,BERT-BiLSTM-CRF模型的准确率(P)、召回率(R)和F1值分别达到91.3%、94.5...  相似文献   

5.
针对棉花病虫害文本语料数据匮乏且缺少中文命名实体识别语料库,棉花病虫害实体内容复杂、类型多样且分布不均等问题,构建了包含11种类别的棉花病虫害中文实体识别语料库CDIPNER,提出了一种基于RoBERTa多特征融合的命名实体识别模型。该模型采用掩码学习能力更强的RoBERTa预训练模型进行字符级嵌入向量转换,通过BiLSTM和IDCNN模型联合抽取特征向量,分别捕捉文本的时序和空间特征,使用多头自注意力机制将抽取的特征向量进行融合,最后利用CRF算法生成预测序列。结果表明,该模型对于棉花病虫害文本中命名实体的识别精确率为96.60%,召回率为95.76%,F1值为96.18%;在ResumeNER等公开数据集上也有较好的效果。表明该模型能有效地识别棉花病虫害命名实体且具有一定的泛化能力。  相似文献   

6.
基于本体(ontology)知识抽取的主要目标是研究如何从没有语义信息的非结构文档中抽取与领域本体匹配的知识,从而实现对知识充分、有效的利用。以农业知识为研究对象,提出一种利用本体从Web网页上提取知识的方法。首先利用自顶向下的方法建立农业领域本体,然后利用噪声消除算法去除噪音块,接着将农业领域本体解析的结果应用到中文分词、命名实体识别及知识抽取过程中,从而使得中文分词和命名实体识别的结果更准确,解决Web信息抽取系统中抽取结果缺乏语义信息的问题。最后,通过试验验证该抽取系统能够得到性能较高的抽取结果。  相似文献   

7.
为解决羊群疾病检索过程中出现的大量冗余数据及检索后仍需人工挑选准确答案造成的资源浪费,本研究通过以下3个步骤构建基于知识图谱的羊群疾病问答系统:(1)通过爬虫获取数据,人工提取部分信息,再进行自动化信息抽取,在命名实体识别任务中使用双向长短期记忆循环神经网络Bi-LSTM模型,并添加注意力机制提高识别效率,然后使用BIO规则进行实体标注,完成信息抽取,将数据融合后存储在Neo4j图数据库中,构建羊群疾病知识图谱。(2)针对属性映射,构建Bert-softmax模型;根据用户提问,采用Bert模型计算问句和属性的语义相似度,并通过softmax算法进行归一化处理,返回合适答案给用户,实现羊群疾病问答系统算法设计。(3)构建羊群疾病诊断平台,使用Bootstrap、Echarts、Vue组件实现羊群疾病问答系统的可视化,利用Python语言包含的flask框架搭建后台,封装疾病信息,通过web前端呈现给用户,并于后端建立连接,实现数据之间的交互。试验结果显示,基于Bi-LSTM+Attention+CRF模型实体识别的F1值为83.16%,构建的知识图谱包含实体4 576个,实体关系超13...  相似文献   

8.
系统介绍了生物医学文本挖掘的具体流程和文本挖掘技术在生物医学领域中的应用情况,并着重从自然语言处理和本体、命名实体识别、关系抽取、文本分类与聚类、共现分析、系统工具及评价、可视化等方面分别做了阐述。  相似文献   

9.
土壤污染数据来源多样且结构各异,知识图谱是对多源异构土壤污染数据进行数据融合及综合应用的有效手段。针对土壤污染数据的结构特征,本课题组提出了1种土壤污染数据融合与知识图谱构建的方法,首先,基于D-S证据理论和克里格插值法对原始数据进行清洗融合;然后,根据领域本体进行实体识别;最后,抽取土壤污染数据的实体联系与实体属性,形成土壤污染数据的大规模知识图谱。本课题组首次实现了土壤污染数据领域的知识图谱构建,该研究有助于实现土壤污染信息的知识化,提高智能化服务水平。  相似文献   

10.
命名实体识别是构建知识图谱的关键,在农业病虫害领域存在病虫害数据匮乏、实体结构复杂、实体类型识别困难等问题。针对于病虫害数据匮乏,本文采用网络爬虫技术以及扫描文本数据的方法,构建了玉米、小麦、水稻病虫害实体语料库。传统的命名实体识别方法无法解决农业病害实体结构复杂、实体类型识别困难等问题。本文提出一种基于GPT规则修正的LEBERT-BilSTM-CRF模型,LEBERT模型构建了字典树和Lexicon-Adapter结构,将原始字符进行扩充增加数据的丰富性,将经过BiLSTM-CRF的输出和GPT结果进行实体标签修正以此来提高准确率。在公开数据集训练得到合适的参数后,在自建文本语料库进行训练,通过条件随机场和GPT修正生成全局最优序列取得很好的识别效果,准确率为94.23%,召回率为92.34%,F1值为93.28%。  相似文献   

11.
为解决烟叶烘烤工艺知识存在多源、异构等问题,有效利用和管理烘烤工艺知识,可借助知识图谱的知识互联组织功能对烘烤工艺知识进行整合及可视化。通过结合烘烤工艺的知识特点以及需求,经过本体构建、数据收集、知识抽取、知识融合和知识存储等环节,初步构建了面向烟叶烘烤工艺的知识图谱。在此基础上进行应用研究,包括烟叶烘烤实体识别和智能问答,从而形成一个面向烟叶烘烤工艺领域的知识平台。研究结果验证了烟叶烘烤工艺知识图谱构建和应用的可行性。  相似文献   

12.
基于知识图谱的水稻病虫害智能诊断系统   总被引:2,自引:1,他引:1  
目的 利用知识图谱对水稻病虫害领域复杂的异构数据信息进行结构化存储,建立病虫害间语义关系,为水稻病虫害关联检索及智能诊断提供理论依据。方法 首先提出一种面向水稻病虫害的知识图谱构建方法和基于图的水稻病虫害检索算法,通过引入节气实体实现水稻病虫害的预警。其次提出基于确定性因子(Certainty factor,CF)模型和知识图谱相结合的知识推理方法,利用CF与水稻病株症状的结合实现水稻病虫害的诊断。结果 利用命名实体识别模型,得出病、虫害名称及危害症状实体的准确率分别为0.92、0.90及0.87,进一步构建包括1 972个实体及5 226个实体关系的垂直领域知识图谱。通过自主开发的智能诊断系统进行案例分析,试验表明,诊断算法正确率达到86.25%。结论 该系统有效地解决了水稻病虫害领域数据检索、预警与诊断中知识的复杂性及不确定性的问题,有较强的实用价值和推广前景。  相似文献   

13.
三峡库区的珍稀濒危植物及其保护   总被引:1,自引:0,他引:1  
该文依据“三峡库区植物数据库”,对库区的珍稀濒危植物进行了研究。结果表明:库区有珍稀濒危植物44种,其中濒危的6种,渐危的20种,稀有的18种;半数以上的种类隶属于起源古老的科,反映出该地区珍稀濒危植物的主老性;受淹没影响最大的兴山、巴东、宜昌、巫山4县市拥有近2/3的珍稀濒危植物种次,成为重点保护区域;三峡水库虽不会导致植物物种的消灭,但将直接淹没荷叶铁线蕨的主要原产地和长瓣短柱茶的部分野生生境。  相似文献   

14.
宁陕火地塘珍稀濒危木本植物计有15种,占秦岭林区木本保护植物的71%,是秦岭珍稀濒危植物分布较为集中的地区之一。本文在阐明火地塘分布的珍稀濒危木本植物的分类、分布及保护价值的基础上,提出了拟采取的保护措施。  相似文献   

15.
为解决渔业健康养殖标准文本关系抽取领域特定性强、语意复杂导致关系抽取准确率不高等问题,提出了基于改进BiRTE的渔业健康养殖标准复杂关系抽取方法,针对实体和语义关联建模,将RoBERTa作为编码器,采用全词掩码和动态掩码的方式增强词向量特征表示,并在此基础上融合了自注意力机制(Self-Attention, SelfATT)将实体特征与关系特征结合聚焦,加强实体抽取与关系预测的联系,从而提升渔业标准文本抽取的准确性。结果表明:本文提出的基于改进BiRTE的渔业健康养殖标准复杂关系抽取模型(RoBERTa-BiRTE-SelfATT)对渔业标准复杂关系抽取的准确率、召回率和F1值分别为95.9%、95.4%、95.7%,较BiRTE模型分别提升了4.2%、3.1%、3.8%。研究表明,本文提出的渔业健康养殖标准复杂关系抽取模型RoBERTa-BiRTE-SelfATT可以有效解决渔业标准文本关系抽取中专有名词识别不准确、语意复杂导致实体关系难以抽取的问题,是一种有效的渔业标准复杂关系抽取方法。  相似文献   

16.
曹岚  梁芳  邹红  赖学文 《安徽农业科学》2012,40(3):1696-1698,1711
在对江西官山国家级自然保护区植物种质资源进行全面调查研究的基础上,根据国内有关珍稀濒危植物评估的标准体系,分析和统计该保护区珍稀濒危植物多样性状况。结果表明,保护区珍稀濒危植物多样性丰富(50科81属121种),被列入《国家重点保护野生植物名录》(第一批)的有26种,被列入《中国珍稀濒危保护植物名录》(第一册)的有34种,被列入《江西省重点保护植物》的有85种。该保护区珍稀植物具有种类丰富、起源古老、地理分布复杂的特征。  相似文献   

17.
黄瓜病害识别是病害防治的提前。针对现有作物病害识别方法中存在实体关系交叉关联、多源异构数据聚合能力差、依靠大规模标注数据、缺乏专家经验知识指导等问题,提出一种知识图谱与深度学习的黄瓜叶部病害识别方法(KGCNN)。该方法通过知识图谱与实体链接消歧嵌入获取作物病害知识图谱中的结构化病害知识,并将病害特征词向量与知识实体向量作为卷积神经网络的多通道输入,在卷积过程中从知识和语义2个层面表示不同病害类型。与现有的作物叶部病害识别方法相比,该方法充分利用了知识图谱和CNN分别在知识表示和特征学习方面的优势。在由黄瓜白粉病、斑点病和角斑病的病害叶片及其对应的环境气候气象信息的数据集上进行训练和测试。结果表明该方法的识别性能优于基于CNN及其改进模型和其他病害识别方法。该方法适用于作物初步病害识别,可为其他作物病害的识别提供技术支持。  相似文献   

18.
西北地区珍稀濒危植物及其保护   总被引:7,自引:0,他引:7  
描述了西北地区分布的国家珍稀濒危保护植物的种类、分布、濒危等级及保护级别,分析了该地区在珍稀濒危保护植物的研究与保护方面所做的工作。在此基础上,提出了保护的建议与对策:加强法制建设及宣传教育;加强科学研究;加强保护管理和规划工作。  相似文献   

19.
融合注意力机制和BiLSTM+CRF的渔业标准命名实体识别   总被引:2,自引:0,他引:2  
为了解决渔业标准文本中专有命名实体具有上下文敏感性、长序列存在语义稀释等问题,提出了基于E-BIO标注法和融合注意力机制的BiLSTM+CRF (BiLSTM+Attention+CRF)命名实体识别模型,E-BIO标注法引入渔业标准文本中的结构化信息,可以使模型有效学习上下文结构特征,而注意力机制输出不断变化的语义向量,可有效解决长序列语义稀释问题。为验证所提出方法的有效性,在采用E-BIO方法标注的语料上进行对比试验,结果显示,BiLSTM+Attention+CRF模型对不同类别的渔业标准命名实体识别的准确率均能达到90%以上,召回率均能达到85%以上。研究表明,本研究中提出的BiLSTM+Attention+CRF命名实体识别模型可以有效利用上下文结构特征,避免了语义稀释问题,对于渔业标准命名实体识别具有较好的识别性能。  相似文献   

20.
浙江遂昌珍稀濒危植物有23种,隶属于18科21属。其中二级珍稀濒危植物有8种,三级珍稀濒危植物有15种。分析得出该区系具有木本植物占优势、区系起源古老,孑遗种多、地理成分复杂、特有植物多和绝大部分种类分布在海拔700~1500m等特征;还探讨了它们与邻近地区珍稀濒危植物区系的关系。提出了遂昌珍稀濒危植物保护措施。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号