首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 281 毫秒
1.
提出一种基于领域本题概念相似度计算的语义Web服务发现方法。给出合理的概念相似度计算公式,通过领域本体概念相似度计算,最终获得请求和候选服务之间的相似度。传统的概念相似度计算方法只考虑继承关系,本文采用的单概念语义不但考虑继承关系,还考虑二元关系,使本体关系结构构成图结构,更加合理。计算语义距离时,适当处理多继承问题和环问题。实验证实,本算法使得匹配更加合理精确。  相似文献   

2.
针对基于XML的农产品溯源平台中的数据集成问题,提出一种XML Schema模式匹配方法。该方法同时考虑元素的语义性和结构性,结合文档元素的名称、数据类型以及基数约束3个方面,通过相应的度量标准计算出元素的语义相似度,实现语义匹配;通过计算模式树中元素节点的祖先相似度,同时考元素本身的语义相似度,实现结构匹配。阐述了匹配算法的设计过程和试验评估结果。结果表明,相比较现有的几种方法,该方法能实现全自动化的匹配过程,提供更精确的匹配结果。  相似文献   

3.
句子相似度度量在自然语言处理领域中有着广泛的应用。针对现有的句子相似度计算方法不能充分捕捉句子的语义结构特征信息的问题,提出一种基于字向量和LSTM (long-short term memory,长短期记忆)网络的句子相度计算方法。首先,通过Word2Vec模型对中文维基百科语料进行训练,得到中文字向量词典;然后根据字向量词典将句子映射为句向量,并输入LSTM网络,获得句子的特征向量;最后,通过相似度算法计算2个句子特征向量之间的相似度。通过在2个数据集上的试验结果表明,该方法能够提高句子相似度计算的准确性,效果好于传统的语句相似度计算方法和基于词向量的相似度计算方法。  相似文献   

4.
传统的基于本体概念的相似度算法过于依赖层次结构,且忽略了许多影响概念间语义相似度的因素。针对这一问题,通过引入边权重关系、语义相关度影响因素,提出1种新的基于森林病虫害本体的语义相似度的计算方法。结果表明:改进后的相似度算法比传统算法更接近林业相关领域的专家经验值,证明了该方法的准确性及有效性,体现了林业领域本体概念间的复杂关系。  相似文献   

5.
以《同义词词林》为基础,结合云南种子植物特有属领域知识补充了《同义词词林》中该领域的词语,并提出了一种基于同义词词林的词语相似度改进算法。经过测试对比,在植物检索领域该计算方法比一般的基于同义词词林的词语相似度算法更加准确,而且召回率得到了明显提升,更适用于云南种子植物特有属领域信息的检索。  相似文献   

6.
目的为了对在线考试系统中主观题进行更合理的评分,提出一种基于中文分词的算法对主观题进行评分。方法对中文分词进行了详细介绍,并对已有的算法进行研究和改进,利用基于中文分词技术并结合文本相似度对主观题进行自动评分,从文本串长度相似度、文本串词形相似度和文本串词序相似度,再结合影响因子,形成最终的综合相似度。结果通过综合考虑考试科目的特征,合理的设置3个相对影响因子的值,对试卷通过4个实验进行测试,试卷题目分别为4个Office简答题,标准答案控制在100字内,每个实验回收电子试卷50份,与使用原算法的实验结果进行比对。实验测试表明,优化后的算法准确率有了很大提高。结论优化后的算法准确率有明显提高,在词形相似度较高的情况下评分效果与原算法差距不大,依然有改进的空间。  相似文献   

7.
[目的]水稻FAQ(frequently asked question,常问问题集)问答系统对农户在水稻种植过程中遇到的问题进行解答,问句相似度计算是其核心,用来匹配用户问题和FAQ中的问题。针对传统句子相似度算法准确率普遍较低的问题,本研究旨在用深度学习计算问句相似度,以提高系统回答的准确性。[方法]构建一个基于word2vec和LSTM(long-short term memory,长短期记忆)神经网络,包括输入层、嵌入层、LSTM层、全连接层和输出层的句子相似度模型。对水稻FAQ中的3 007个问题进行归类和组合得到32 072个问题对,并标注其相似性作为训练和测试数据。使用基于农业领域语料库训练得到的word2vec模型对训练数据向量化后作为输入,训练句子相似度模型。[结果]在测试集上对模型进行验证,并与基于How Net、基于词向量的余弦距离以及基于word2vec和卷积神经网络(convolutional neural network,CNN)的3种句子相似度算法进行对比。对句子相似度的计算结果进行抽样检查,该模型的计算结果更符合人的直观印象。从准确率和ROC(receiver operating characteristic curve)曲线进行分析,该模型也明显优于其他3种方法,准确率达到了93.1%。[结论]本研究构建的模型显著提升了句子相似度计算的准确率,基于该模型开发的水稻FAQ问答系统,能够准确匹配用户问题和水稻FAQ中的问题,帮助农户更好地解决水稻生产中遇到的问题。  相似文献   

8.
基于实例推理的机械设计过程中,属性相似度计算和属性权重确定对于实例检索的有效性和可靠性具有决定性影响。采用区间值属性相似度计算模型,将各种类型属性的相似度计算统一起来;引入层次分析法和基于相似度离差信息法确定属性的组合权重。将实例推理技术应用在免耕播种机圆盘破茬装置的设计过程中,采用最近邻实例检索策略完成实例检索并根据设计要求进行修改,对设计方案进行三维造型。验证结果表明:区间值属性相似度计算模型使属性间的相似度比较具有统一标准,组合权重可综合反映设计者主观评价和属性信息量对决策结果的贡献,基于相似度的实例检索算法能得到符合设计要求的最佳匹配实例,具有较高的实例分辨能力和检索成功率  相似文献   

9.
在农业领域中,农业知识问答系统以其能接受自然语言检索和直接返回精确答案而成为一种新的信息检索技术。针对农业领域,提出了一种多重信息融合的句子相似度算法。该算法结合了句子的结构信息、词法信息和语义信息,同时考虑农业知识问答系统中问句的特征,使其更适合应用在农业特定领域中,并通过实验验证了算法的可行性和准确性。  相似文献   

10.
汪材印  崔琳 《长江大学学报》2012,(4):103-105,123
问答系统是信息检索系统的一种高级形式,它能够用准确、简洁的自然语言回答用户用自然语言提出的问题。如何计算问句之间的语义相似度是问答系统面临的主要难题。提出一种新的计算问句间语义相似度的方法,即综合考虑问句之间的显式关联和隐武关联2个方面,将链接预测模型与查询似然语言模型相结合计算问句之间的语义相似度。试验表明,采用该方法可提高问句语义匹配的准确率。  相似文献   

11.
汉英句子结构最主要的区别在于意合与形合。意合与形合是两种语言不同的组织特点,各有其深厚的文化传统。汉语注重话题,英语注重主谓,汉语的话题句侧重于语义结构,英语的主谓句侧重于语法结构。汉语句子中动词十分丰富,英语句子只能有一个谓语动词。本 文《红楼梦》及其英译本中的句子为例,分析比较汉英两种语言因句法结构之差异在翻译中所产生的不对应性。  相似文献   

12.
万维网服务语义标注和匹配算法的研究成果大都是基于本体技术,但存在复杂度高等不足。提出了用描述概念特征的特征词集的语义相似性计算来间接判断概念的相似性方法,并以此方法对服务描述文件进行简单扩展,实现了一种简便的面向普通用户的万维网服务语义标注和匹配算法。  相似文献   

13.
The restoration of disrupted words to their original form in a sentence shadowing task is dependent upon semantic and syntactic context variables, thus demonstrating an on-line interaction between the structural and the lexical and phonetic levels of sentence processing.  相似文献   

14.
[目的/意义]开展面向数字人文的古籍触发动词识别及分类研究,对于古籍文本的深层次挖掘和内容揭示具有重大的意义。本文利用深度学习分类算法,探索依据古籍触发词进行事件句文本多元分类的自动化方法。[方法/过程]在构建了典籍事件触发词分类体系和触发词典的基础上,选取4个不同类别的事件句文本作为实验数据,利用Onehot和Tokenizer对类别标签和句子文本进行分别编码后,输入Bi-LSTM模型中训练分类器,并通过调整参数设置了对比实验,采取通用的评价指标分析了分类器的性能。[结果/结论]经过多次训练和调整之后得到的分类器,在测试集的评估中精确度达到了0.95,证明基于深度学习的实验方法和构建的触发词数据集能够有效的帮助我们实现古籍事件句文本的自动化多元分类。  相似文献   

15.
将计算机视觉技术应用到数控剖竹机运动加工目标的检测和跟踪中,提出一种基于改进Camshift算法的适合竹材加工运动目标检测和跟踪算法.针对竹材检测、跟踪过程中的干扰因素,通过图像的色度值来代替背景图像的亮度值,来减少阴影干扰,采用背景差分法与帧间差分法相结合的目标检测方法,改进Camshift算法,利用HSV图的H分量均值和每一帧H分量均值的差值结果来进行H分量均值更新,以克服光照影响,并利用Kalman滤波实现对下一帧竹材所在位置进行预测,预测结果用于修正Camshift算法的跟踪结果.结果表明,改进的算法能够对运动竹材目标进行实时跟踪,算法高效、准确.  相似文献   

16.
为了提高针对大规模农业信息的语义检索性能,提出一种基于改进的随机索引语义空间和潜在语义空间的农业信息检索模型(IRI&LSA)。利用120万张中文网页和2 000张分为4类的小规模中文农业网页,对IRI&LSA和两种分别基于单向量兰克泽斯算法(LAS2)和半离散矩阵分解算法(SDD)的常用潜在语义检索模型(LSA-LAS2和LSA-SDD)进行了对比实验。结果表明,IRI&LSA检索结果的平均F1值可达83%,明显高于LSA-LAS2(71%)和LSA-SDD(64%);IRI&LSA的检索速度分别是LSA-LAS2和LSA-SDD的3.6倍和4.9倍。研究结果表明,IRI&LSA适合应用于较大规模农业信息检索。  相似文献   

17.
针对烧结配料系统中的非线性、复杂性和相关性,基于BP神经网络建立烧结配料的预测模型,并采用粒子群算法对预测模型参数进行优化。为了克服粒子群算法的局部收敛性,在迭代过程中,根据迭代次数对惯性权重进行动态非线性调整,从而提高算法的搜索能力。仿真结果表明,所提出的改进粒子群算法与传统的粒子群算法比较,收敛速度快、迭代次数少、具有较强的全局寻优能力。  相似文献   

18.
有效的广告语言可以帮助广告实现它的商业价值。作为具有推销能力的语言,英语广告一方面在词汇上使用高频词与创新词,甚至错拼来抓住读者注意力;另一方面在句式上使用疑问句与祈使句激发读者好奇心、增强广告感召力。同时,英语广告还特别注意修辞手段的应用,如仿拟、重复与呼应等,以达到新颖、生动的表达效果。正是凭借这些词汇、句式、修辞方面的技巧,英语广告帮助广告实现了注意价值和记忆价值,最终实现了广告的商业价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号