首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 531 毫秒
1.
【目的】将语音识别技术应用到农产品价格信息采集中,面向非特定人和限定词汇量的汉语普通话连续语音识别,提出一种适合于农产品价格采集环境的语音识别鲁棒性方法;以隐马尔科夫模型为基础,训练出适合该环境下的声学模型,以缓解因测试环境和训练环境不匹配而导致的识别率降低,进一步提高识别率。【方法】在数据采集和处理阶段,首先根据要识别的限定词汇按照一定的语法规则构建转换文法,利用该文法生成的脚本指导训练集和测试集录音;然后选择不同的农产品价格采集环境和不同的说话人进行语音采集,并进行准确的人工切分,最后构建出语音语料库;在模型训练阶段,选择自左向右无跳转结构的连续混合密度隐马尔科夫模型,对训练集中的数据提取39维的MFCC特征向量,用于模型训练。首先以单音素为建模单元,并分别训练基于隐马尔科夫模型的男声模型、女声模型及男女混合声学模型;然后,考虑到单音素稳定性差和易受协同发音现象影响等因素,以上下文相关的三音素为识别单元建模,重新训练上述模型;针对三音子建模单元带来的模型数量大量增加,进而造成的训练样本不足问题,采用决策树状态聚类方法来改善该问题;决策树的构建过程中,利用语音学知识,根据声母发音方式、发音部位的不同以及韵母构成、韵头的不同,划分出若干声韵母集合实现了二值问题集的设计;在此基础上,用增加混和高斯分量的方法来进一步使得模型描述更加精确;最后,为了解决信道的乘性噪声问题,在采用上述策略的同时利用CMN和CVN方法来缓解测试环境与训练环境不匹配问题,最终训练得到了相应的男声模型和女声模型。在测试阶段,对采用上述各方法后得到的不同模型,分别采用相同的测试集进行试验,得出不同方法下的句子识别率、词识别率以及精准度。【结果】三音子声学模型的识别性能明显优于单音素声学模型,女声模型和男声模型的性能均优于男女混合声学模型,决策树聚类方法对识别率的提高不明显但可以明显减少三音子模型的数量,混合高斯分量的增加对识别率具有一定提高但同时带来计算量的增加,CMN和CVN方法可以明显提高系统的识别性能。通过对不同地点和不同说话人进行测试,最终识别率男性为95.04%,女性为97.62%。【结论】语音识别技术应用到农产品价格信息采集过程中是可行的。本文提出了一种农产品价格采集环境下提高语音识别率的方法,试验证明通过该方法训练出的模型具有较好的识别性能,本研究方法为日后应用系统的开发奠定了基础。  相似文献   

2.
对利用基因算法训练连续隐马尔柯夫模型的语音识别的具体算法进行系统的研究;然后基于该语音识别技术对深圳市司法局社区矫正声纹识别系统进行详细设计。该系统上线后的运行结果表明,利用基因算法训练连续隐马尔柯夫模型的语音识别算法的识别速度较快同时具有较高的识别率。基于模式识别技术的司法社区矫正声纹识别系统建设在我国司法系统目前尚处于起步阶段,推广和建设司法社区矫正声纹识别系统具有重要的现实意义。  相似文献   

3.
语音识别系统中多种特征参数组合的抗噪性   总被引:2,自引:0,他引:2  
构建了基于连续隐马尔可夫模型(CHMM)的汉语数字串语音识别系统,为了提高系统在噪音环境下的鲁棒性,抑制平稳噪声及去除信道卷积噪声的影响,引入了动态参数,实验仿真表明采用MFCC参数及一阶、二阶差分及倒谱化明显提高了噪声环境下语音识别系统的识别性能。  相似文献   

4.
自动语音识别(ASR)是机器或程序识别语音命令或听写的能力,其内容涉及将语音模式与所提供或获取的词汇匹配的能力。目前,主要使用基于隐马尔可夫模型(HMM)的语音识别器。本文旨在为应用于农产品交易领域的宁夏银川方言普通话构建语音识别系统,隐马尔可夫模型工具包(HTK)用于开发系统,它使用声学词模型识别孤立的词。系统训练113个常用农业词汇,训练数据收集于9位说话人,实验结果表明,HMM拓扑中10个状态的系统的整体精度为96.61%和95.49%。  相似文献   

5.
提出一种利用隐马尔可夫模型建立目标特征匹配库来识别图像中局部遮挡目标的新方法。该方法首先通过SIFT算法提取目标SIFT特征,然后采用隐马尔可夫模型对目标所有的SIFT特征进行训练,得到目标SIFT特征对应的模型输出概率范围,将该概率范围作为目标特征匹配库。在对图像中的目标进行识别时,利用目标特征匹配库可以把目标特征从图像所有特征中识别出来,即使目标遮挡比例为60%时,该方法仍能识别出目标。实验结果表明,新方法可以精准地识别出图像中被遮挡目标,能够很好地解决遮挡情况下的目标识别问题。与现有局部遮挡目标识别算法相比,新方法所取得的目标识别率均有所提高。  相似文献   

6.
针对特定人孤立词识别任务,传统的语音识别系统中构造的神经网络模型主要采用BP神经网络和径向基函数网络,为了解决这两种神经网络构造下的语音识别系统对训练样本需求量较大和识别率较低问题,提出了一种基于正交基函数展开的混合学习算法,并应用于语音识别中,同时与传统的BP神经网络、径向基函数网络进行了比较.仿真结果表明,采用对向...  相似文献   

7.
设计一款能够识别语音命令并进行简单语音对话的儿童交互式智能小车,可提高儿童智能玩具的乐趣,培养儿童的创造思维。本文从软、硬件设计方面具体阐述特定人语音识别在智能小车上的实现过程,并说明实验测试方法。实验表明:该系统对于小词汇量、特定人识别系统,具有很好的识别效果。  相似文献   

8.
农产品信息采集场所通常以大型集贸批发市场为主,其语音场景又以单语言、多口音、多目标、高噪声为特点,在此特定领域开展语音识别应用研究的关键在于解决多语音数据集之间的声学、通道和环境的不匹配问题。本文考虑在小词汇量任务下,使用标准普通话和两种宁夏地方口音的数据,从目标用户群体中采集语音数据,在单语言多口音环境下分别训练连续概率密度隐马尔可夫模型(CDHMM)和子空间高斯混合模型(SGMM),通过基线实验对比了两种声学建模方法的性能特点。  相似文献   

9.
目前我国关于花卉分类识别技术已较为成熟,但由于类间相似性较高,花卉特征较难提取,对于同种不同类的相似花卉仍存在识别率较低的问题,因此提出使用卷积神经网络(CNN)中4类深度学习网络SqueezeNet、ResNet、InceptionV3及DenseNet的训练模型,搭建了对4种相似月季进行识别的花朵识别客户端,并对识别结果进行比较,筛选出最优模型,同时运用GPU对训练过程以及识别过程进行加速.对实验过程产生的数据进行统计对比后得出InceptionV3网络训练后得到的模型较其余3种网络而言识别率最高且识别速度较快,可以作为最优模型.将搭建的花朵识别系统应用于花卉分类工作中,在节省人工的同时也能够加速园艺自动化的进程.  相似文献   

10.
基于MMSE谱减算法的农产品市场信息语音识别技术   总被引:1,自引:0,他引:1  
为解决传统的便携式农产品市场信息采集设备操作不便,易受使用环境影响等问题,提出利用语音识别技术采集信息,以增加操作界面的灵活性。为增强语音识别的抗噪声鲁棒性,针对农产品市场信息采集的特殊工作环境,采集到20男20女语音训练集材料。首先利用最小均方误差( MMSE)谱减法进行前端带噪语音增强,得到增强后的语音信号,然后提取其 MFCC 特征用于HMM声学模型的训练;声学识别单元采用上下文相关的三音子模型,模型训练过程中采用了决策树状态聚类和增加高斯混合分量的策略,以提高模型的精确度。在3处不同环境不同信噪比情况下对训练出的模型进行测试,结果表明,MMSE谱减算法处理后的语音识别率比基本谱减法( SS)、多带谱减法( MB)有明显的提高,特别是在较低信噪比情况下更为明显。  相似文献   

11.
使用竹片图像实现竹片缺陷自动识别,目前深度学习可以有效地解决该类问题,但是必须使用大量样本数据做训练才能获得较高的识别准确率。当图像数量有限时,利用基于迁移学习的方法,把经过预训练的卷积神经网络模型进行迁移,即共享卷积层和池化层的权重参数,调整新网络模型的超参数,并建立一个包含4种共计6 360张竹片缺陷图像的数据库,把图片分成4种训练集测试集形式,即80%训练、20%测试;60%训练、40%测试;40%训练、60%测试;20%训练、80%测试,分别利用支持向量机SVM分类方法、深度学习方法和迁移学习方法进行训练和测试,并将这3种方法作对比。最后,通过构建竹片缺陷识别的混淆矩阵对迁移学习进行具体分析与说明。结果表明,按照80%训练、20%测试的识别准确率最高,通过迁移学习得到的竹片缺陷最高识别精度分别达到98.97%,比普通深度学习提高了11.55% ,比SVM分类方法提高了13.04%。说明迁移学习比普通深度学习和传统支持向量机SVM分类方法更适合用于小样本数据集的分类识别,并且效果优于普通深度学习和 SVM 分类方法。  相似文献   

12.
利用人工神经网络能够较好地模拟在各种不确定因素影响下的因果变量之间的内在关系。建立了基于人工神经网络的管道运行费用预测模型,该模型的网络结构由输入层(1个节点)、隐层(7个节点)和输出层(1个节点)组成。采用改进的BP算法对25组学习样本进行训练,得到各节点间的连接权和阈值,然后用优化好的网络进行给定输量的管道运行费用预测。预测结果表明,利用该方法建立的模型预测误差在4%以内,可以完全满足工程实际需要。  相似文献   

13.
为了提高动作的识别精度与鲁棒性,降低冗余特征,提高算法效率,设计了一种基于最大相关-最小冗余(Max-Correlation and Min-Redundancy,MCMR)的动作识别算法.首先,为了消除噪声影响,减少计算成本,利用符号聚集近似(SAX)技术将连续图像序列转换为离散符号;其次,为避免出现时间漂移问题,利用动态时间归整(Dynamic Time Warping,DTW)来计算符号特征的距离,提取符号序列的特征;然后,为了消除冗余的特征,定义了一个特征权重,根据权重对特征进行降序排列,引入最大相关-最小冗余技术消除相关性弱的特征,筛选出具有高相关性和低冗余的特征;最后,为了完成动作识别,根据筛选出的特征,利用k-近邻(K-Nearest Neighbor,KNN)进行分类器学习.结果表明:与当前动作识别算法相比,本文算法能够有效完成动作的识别与理解,具有较高的识别率,有效地降低了冗余特征,提高了算法的效率和鲁棒性.  相似文献   

14.
育肥猪生长过程中脸部变化对识别模型准确率的影响   总被引:2,自引:0,他引:2  
为探究猪脸识别模型对育肥猪猪脸生长变化的识别效果,采用深度卷积网络,对大白育肥猪生长过程中脸部变化与识别模型准确率之间的关系进行研究。结果表明:1)在预训练的DenseNet201、MobileNetV3_small、SeNet154和Xception 4种模型中,SeNet154模型猪脸识别效果最好,对验证集的识别准确率可达98.80%,选其为猪脸识别模型;2)分别用试验期间第1~2、1~3、1~4和1~5天采集的猪脸图像数据训练该模型,并分别使用第3~8、4~9、5~10和6~11天的数据逐天测试模型的猪脸识别效果发现,使用第1~4与1~5天数据训练的模型猪脸识别效果相当且优于使用第1~2与1~3天数据训练的模型。使用第1~4天数据训练的模型对第5天数据的识别准确率最高,为96.74%,其后5天的识别准确率逐天下降,到第10天为84.17%。分析认为,造成识别准确率下降的原因是猪脸生长、光照变化以及污渍附着。3)使用第(n-4)~(n-1)天(5≤n≤10)的数据重新训练动态模型后,对第n天猪脸数据的识别准确率均在95.82%以上。深度卷积网络模型在猪脸识别方面有较高的识别准确率,可以用于育肥猪的脸部识别;建议在育肥猪的猪脸识别系统中每天都使用至少前4天,且≥10 800组图像数据重新更新猪脸识别模型。  相似文献   

15.
人工神经网络(ANN)是一种动态信息(处理)系统,它具有联想记忆、自组织、自适应、自学习和容错等优异的特性而得到广泛应用。ANN已广泛地应用于诸如模式识别、拟合、分类、决策和预测等领域,而水产科学有很多涉及上述技术的问题。本文在简述ANN结构和工作原理的基础上,讨论分析了利用BP神经网络模型、自组织特性神经网络或Kohonen神经网络模型进行分类、模式识别、图像处理和鉴别、预测与评价、系统模拟以及最优化和多目标决策等方面的应用实例。从神经网络模型建模和数据预处理原理研究了应用人工神经网络技术建模的局限性和缺陷。并明确指出:若不采用检验样本监控学习过程,对于一定数量的样本数据,过大的神经网络结构将不可避免地引起对样本数据的过拟合,从而得到了不能正确反映样本数据结构和内在特性和神经网络模型,而可能是对样本数据的噪声的反映。本文最后探讨了人工神经网络技术与模糊数学、逻辑控制和拓扑学以及非确定性原理相结合的应用趋势。  相似文献   

16.
为提高设施生产中对各生长阶段生菜鲜重的无损估测精度进而更好地指导生产,提出一种利用生菜冠层图像为输入,基于迁移学习技术和卷积神经网络估测鲜重的方法,对比分析AlexNet、VGG-16、GoogLeNet和ResNet-18模型迁移学习后在生菜鲜重估测任务上的效果;同时,对比不同迁移学习方法对模型性能的影响,通过冻结卷积层和减少全连接层改善模型的参数量和训练速度。结果表明:1)AlexNet和VGG-16两种模型能较好的实现生菜鲜重的估测,AlexNet模型的决定系数R2为0.928 0,标准均方根误差NRMSE为19.08%,VGG-16模型的R2为0.938 0,NRMSE为17.71%,但VGG-16模型存在参数量大训练慢的问题,综合考虑选取AlexNet模型迁移学习后作为生菜鲜重估测模型;2)与全新学习方法相比,在预训练模型基础上对生菜鲜重数据集进行迁移学习,可以明显提升生菜鲜重估测模型的训练速度和准确度;3)冻结卷积层能显著加快模型的训练速度,训练时间可减少18%,减少全连接层在保持精度的前提下能大幅度减少模型的参数量。基于迁移学习的卷积神经网络模型可用于生菜鲜重的快速估测,该方法也可以拓展应用到其他叶类蔬菜的鲜重估测中。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号