首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
融合注意力机制和BiLSTM+CRF的渔业标准命名实体识别   总被引:2,自引:0,他引:2  
为了解决渔业标准文本中专有命名实体具有上下文敏感性、长序列存在语义稀释等问题,提出了基于E-BIO标注法和融合注意力机制的BiLSTM+CRF (BiLSTM+Attention+CRF)命名实体识别模型,E-BIO标注法引入渔业标准文本中的结构化信息,可以使模型有效学习上下文结构特征,而注意力机制输出不断变化的语义向量,可有效解决长序列语义稀释问题。为验证所提出方法的有效性,在采用E-BIO方法标注的语料上进行对比试验,结果显示,BiLSTM+Attention+CRF模型对不同类别的渔业标准命名实体识别的准确率均能达到90%以上,召回率均能达到85%以上。研究表明,本研究中提出的BiLSTM+Attention+CRF命名实体识别模型可以有效利用上下文结构特征,避免了语义稀释问题,对于渔业标准命名实体识别具有较好的识别性能。  相似文献   

2.
针对油气领域知识图谱构建过程中命名实体识别使用传统方法存在实体特征信息提取不准确、识别效率低的问题,提出了一种基于BERT-BiLSTM-CRF模型的命名实体识别研究方法。该方法首先利用BERT(bidirectional encoder representations from transformers)预训练模型得到输入序列语义的词向量;然后将训练后的词向量输入双向长短期记忆网络(bi-directional long short-term memory, BiLSTM)模型进一步获取上下文特征;最后根据条件随机场(conditional random fields, CRF)的标注规则和序列解码能力输出最大概率序列标注结果,构建油气领域命名实体识别模型框架。将BERT-BiLSTM-CRF模型与其他2种命名实体识别模型(BiLSTM-CRF、BiLSTM-Attention-CRF)在包括3万多条文本语料数据、4类实体的自建数据集上进行了对比实验。实验结果表明,BERT-BiLSTM-CRF模型的准确率(P)、召回率(R)和F1值分别达到91.3%、94.5...  相似文献   

3.
基于深度学习的渔业领域命名实体识别   总被引:2,自引:0,他引:2  
为了解决基于分词的渔业领域命名实体识别效果受分词准确度影响这一问题,采用一种基于深度学习的渔业领域命名实体识别方法。该方法使用神经网络训练得到字向量作为模型输入,避免了分词不准确对渔业领域命名实体识别效果造成的影响;针对渔业领域命名实体长度较长这一特点,使用LSTM单元保持较长时间记忆信息,并将标记信息融入到CRF模型中构建Character+LSTM+CRF实体识别模型。为验证方法的有效性,在渔业领域语料集上进行多组实验,结果表明,本研究中提出的Character+LSTM+CRF方法具有较好的效果,与LSTM模型相比较,在准确率、召回率、F值上分别提升了3.39%、2.99%、3.19%,对于渔业领域实体识别具有较好的效果。  相似文献   

4.
方莹 《广东农业科学》2011,38(6):197-199
提出了一种基于层叠条件随机场模型(C-CRF)的农业领域命名实体识别方法。该方法在底层以字作为切分粒度,充分利用农作物特征词典,识别简单命名实体。识别结果作为高层条件随机场的输入,在高层以词作为切分粒度,结合复杂特征,识别嵌套命名实体。实证分析表明该方法获得了较好的结果。  相似文献   

5.
针对棉花病虫害文本语料数据匮乏且缺少中文命名实体识别语料库,棉花病虫害实体内容复杂、类型多样且分布不均等问题,构建了包含11种类别的棉花病虫害中文实体识别语料库CDIPNER,提出了一种基于RoBERTa多特征融合的命名实体识别模型。该模型采用掩码学习能力更强的RoBERTa预训练模型进行字符级嵌入向量转换,通过BiLSTM和IDCNN模型联合抽取特征向量,分别捕捉文本的时序和空间特征,使用多头自注意力机制将抽取的特征向量进行融合,最后利用CRF算法生成预测序列。结果表明,该模型对于棉花病虫害文本中命名实体的识别精确率为96.60%,召回率为95.76%,F1值为96.18%;在ResumeNER等公开数据集上也有较好的效果。表明该模型能有效地识别棉花病虫害命名实体且具有一定的泛化能力。  相似文献   

6.
句子相似度度量在自然语言处理领域中有着广泛的应用。针对现有的句子相似度计算方法不能充分捕捉句子的语义结构特征信息的问题,提出一种基于字向量和LSTM (long-short term memory,长短期记忆)网络的句子相度计算方法。首先,通过Word2Vec模型对中文维基百科语料进行训练,得到中文字向量词典;然后根据字向量词典将句子映射为句向量,并输入LSTM网络,获得句子的特征向量;最后,通过相似度算法计算2个句子特征向量之间的相似度。通过在2个数据集上的试验结果表明,该方法能够提高句子相似度计算的准确性,效果好于传统的语句相似度计算方法和基于词向量的相似度计算方法。  相似文献   

7.
为解决渔业健康养殖标准文本关系抽取领域特定性强、语意复杂导致关系抽取准确率不高等问题,提出了基于改进BiRTE的渔业健康养殖标准复杂关系抽取方法,针对实体和语义关联建模,将RoBERTa作为编码器,采用全词掩码和动态掩码的方式增强词向量特征表示,并在此基础上融合了自注意力机制(Self-Attention, SelfATT)将实体特征与关系特征结合聚焦,加强实体抽取与关系预测的联系,从而提升渔业标准文本抽取的准确性。结果表明:本文提出的基于改进BiRTE的渔业健康养殖标准复杂关系抽取模型(RoBERTa-BiRTE-SelfATT)对渔业标准复杂关系抽取的准确率、召回率和F1值分别为95.9%、95.4%、95.7%,较BiRTE模型分别提升了4.2%、3.1%、3.8%。研究表明,本文提出的渔业健康养殖标准复杂关系抽取模型RoBERTa-BiRTE-SelfATT可以有效解决渔业标准文本关系抽取中专有名词识别不准确、语意复杂导致实体关系难以抽取的问题,是一种有效的渔业标准复杂关系抽取方法。  相似文献   

8.
[目的]本研究将FASTmrEMMA、最小角回归(least angle regression, LARS)和随机森林(random forest, RF)方法应用于全基因组选择,以提高植物数量性状预测的准确性和效率,为植物遗传和育种提供有益信息。[方法]对拟南芥自然群体的模拟数据和真实数据进行全基因组预测。在模拟数据分析中,设置不同的表型缺失率,以平均绝对误差(mean absolute error,MAE)、均方误差(mean squared error,MSE)、预测模型拟合度和计算时间为指标,比较基于最小角回归和随机森林的两阶段算法(two-stage algorithm based on least angle regression and random forest, TSLRF)、基于随机森林的两阶段变量选择(two-stage stepwise variable selection based on random forest, TSRF)、随机森林和全基因组最佳线性无偏预测(genomic best linear unbiased prediction, GBLUP)4种方法的优劣。在拟南芥真实数据研究中,针对长日照花期(days to flowering under long day, LD)、春化长日照花期(days to flowering under long day with vernalization, LDV)和短日照花期(days to flowering under short day, SD)实施全基因组预测,并利用这些表型预测值与观测值进行全基因组关联分析,以比较上述4种全基因组选择方法的性能。[结果]模拟研究表明:在不同表型缺失率下,TSLRF的全基因组预测准确度和预测模型拟合度均较高;真实数据的TSLRF分析也获得相似的结论,且检测到40个已报道与目标性状显著关联的基因。[结论]TSLRF方法的全基因组预测准确度和模型拟合度较高,计算速度快,为分子育种和优异亲本组合的预测提供理论依据。  相似文献   

9.
为解决因外来海洋生物领域实体复杂且实体间存在嵌套导致命名实体识别效果较差等问题, 提出基于融合注意力机制的卷积神经网络 (CNN) -双向门控循环单元网络 (BiGRU) -条件随机场 ( CRF) 网络模型进行外来海洋生物命名实体识别, 并构造词向量、词性特征向量等特征作为网络模型的联合输入, 以提升网络模型识别效果.结果表明: 使用融合多特征向量的CNN-BiGRU-CRF网络模型对外来海洋生物名称实体、时间实体、地名实体3类实体上的命名实体识别结果平均准确率达到了90. 62%, 平均召回率达到了89. 50%, 平均F1值达到了90. 05%, 较传统命名实体识别方法均有较大提高.研究表明, 本研究中提出的网络模型可以充分提取文本特征, 解决了文本的长距离依赖问题, 对外来海洋生物领域的命名实体识别具有较好的识别效果.  相似文献   

10.
[目的/意义]开展面向数字人文的古籍触发动词识别及分类研究,对于古籍文本的深层次挖掘和内容揭示具有重大的意义。本文利用深度学习分类算法,探索依据古籍触发词进行事件句文本多元分类的自动化方法。[方法/过程]在构建了典籍事件触发词分类体系和触发词典的基础上,选取4个不同类别的事件句文本作为实验数据,利用Onehot和Tokenizer对类别标签和句子文本进行分别编码后,输入Bi-LSTM模型中训练分类器,并通过调整参数设置了对比实验,采取通用的评价指标分析了分类器的性能。[结果/结论]经过多次训练和调整之后得到的分类器,在测试集的评估中精确度达到了0.95,证明基于深度学习的实验方法和构建的触发词数据集能够有效的帮助我们实现古籍事件句文本的自动化多元分类。  相似文献   

11.
乳糖和矿质元素是哺乳仔猪十分重要的营养素,对7日龄的哺乳仔猪乳糖酶研究结果表明:哺乳仔猪乳糖酶的酶活力常数是65.825μg(ONP)/mL·min,矿质元素钠、铁和钙能促进乳糖酶的酶活力.  相似文献   

12.
Ca2+ Fe2+ Mg2+ Zn2+ Na+ K+对哺乳仔猪乳糖酶活力的影响   总被引:1,自引:0,他引:1  
乳糖和矿质元素是哺乳仔猪十分重要的营养素,对7日龄的哺乳仔猪乳糖酶研究结果表明:哺乳仔猪乳糖酶的酶活力常数是65.825μg(ONP)/mL.m in,矿质元素钠、铁和钙能促进乳糖酶的酶活力。  相似文献   

13.
为寻求水环境中重金属监测的指示植物应用于生产,通过离子溶液浸泡试验,研究Cu~(2+)、Hg~(2+)及其混合胁迫对高等水生沉水植物阿根廷蜈蚣草可溶性蛋白质含量、可溶性糖含量和MDA(丙二醛)含量、CAT(过氧化氢酶)活性等生理生化指标的影响。结果表明:1)可溶性蛋白质和可溶性糖含量随胁迫强度的增加而持续下降,当Cu~(2+)、Cu~(2+)+Hg~(2+)混合处理浓度≤1 mg/L时,可溶性蛋白质含量上升;2)MDA含量与受胁迫强度呈正相关关系;3)在胁迫处理24h内,CAT活性逐渐升高,而后随时间延长活性下降,直至出现抑制现象;4)同浓度处理对阿根廷蜈蚣草生理胁迫强度为Cu~(2+)Hg~(2+)Cu~(2+)+Hg~(2+)。  相似文献   

14.
日语里“NP1 格助词 の NP2”中格助词的显陷模式可分为必须无形化、转化为其他格助词、必须保留、可省略四类,其制约机制可求助于“格的阶层性”理论,即在“格的阶层”中处于上位的格助词必须或容易无形化。  相似文献   

15.
关于不定方程 5x(x+1 )(x+2 )(x+3 ) =6y(y+1 )(y+2 )(y+3 )   总被引:1,自引:1,他引:0       下载免费PDF全文
运用递归序列和平方剩余的方法,证明了不定方程5x(x+1)(x+2)(x+3)=6y(y+1)(y+2)(y+3)仅有正整数解(x,y)=(21,20).  相似文献   

16.
详细介绍了在C Builder 6.0中编写动态链接库(Dynamic Link Libraries,DLL)的方法,并分别说明了DLL的静态链接方式、动态链接方式及其延时加载特性.  相似文献   

17.
通过研究近30株嗜盐或耐盐放线菌在不同浓度的Na^+,K^+,M^2+,Ca^2+条件下的生长范围,发现耐盐放线菌对Na^+,K^+,M^2+有广泛的适应性。只有少数耐盐放线菌能在较底浓度的CaCl2条件下生长;多数嗜盐放线菌生长所需的Na^+可被K^+,Mg^2+所替代,而不能被Ca^2+所替代,少数嗜盐放线菌的生长离不开Na^+,对Na^+有高度的专一性。因此,提出自然环境中是否也存在类似的专嗜K^+或专嗜Mg^2+的嗜盐放线菌的推测。  相似文献   

18.
盐适应烟草愈伤组织与不适应愈伤组织K、Na含量一致,Na吸收速率下降;与无NaCl培养基上生长的愈伤组织相比,K+含量下降,Na含量大幅度上升,Na吸收速率下降,结果表明,Na缓慢吸收可减轻Na积累的毒害。  相似文献   

19.
“公司+基地+农户”生产经营模式分析   总被引:7,自引:0,他引:7  
吕帆  涂炳坤 《湖北农业科学》2011,(21):4513-4517
“公司+基地+农户”的生产经营模式是以技术先进、资金雄厚的农业公司为龙头,利用基地的作用把分散的农户集中起来,最终以合约的形式把农户和公司结合在一起.“公司+基地+农户”生产经营模式使农户实现了订单农业生产,一方面改变了农户长期以来靠天吃饭的生产方式,极大地降低了农户生产的风险,使农户的收入得到了保障;同时使原来分散的...  相似文献   

20.
研究了重组脂蛋白体中K^ 运输蛋白对K^ 的转运特征。当外界pH值为7.5时,ATPase和K^ 转运的相对活力最高。加入10μmol/L钒酸钠,抑制50% ATPase活力和K^ 转运,表明对钒酸钠敏感;同时,由该运输蛋白参与的K^ 跨膜运输受外界ATP和K^ 浓度影响,其Km值分别为60μmol/L和14μmol/L,表明专一性亲和ATP和K^ ,与膜两侧电势梯度无关。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号