首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 187 毫秒
1.
设计了一种基于小波变换的孤立词语音识别系统。该系统提取语音信号的特征矢量,使用DTW算法对待测语音进行匹配,通过对输入信号的降噪处理,提高孤立词在噪声环境下的识别精度。测试结果表明,在无强噪声干扰条件下,该系统能较好实现孤立词语音识别。  相似文献   

2.
为了在高噪声环境下得到较清晰的语音信息,对倒谱距离算法进行了改进,利用语音信号的倒谱向量判断语音端点信息。MATLAB仿真实验结果表明,在白噪声和汽车噪声环境下,信噪比分别为10 dB和15 dB时,得到的语音单字清晰度分别达到93%和95%,实现了90~100 dB高噪声环境下可靠的语音通信。  相似文献   

3.
通过研究在低能量段用幂函数代替自然对数函数对MeI滤波器组的输出进行处理,从而得到一种改进Mel频率倒谱系数(PL_MFCC).实验表明,这种参数能够提高含噪语音的说话人识别率.如果含噪语音通过wiener滤波增强算法消噪后,再用PL_MFCC来提取特征参数,能够进一步提高在噪声环境下说话人的识别率.  相似文献   

4.
针对高噪环境下语音识别的困难,以独立分量分析和小波理论为基础,提出一种负熵最大化小波语音降噪预处理新方法,对不同种类和不同输入信噪比的噪声设计了试验,结果表明在低输入信噪比情况下本方法的优越性,此结论对高噪环境下的信号分析和语音识别具有重要意义。  相似文献   

5.
高噪声环境下的语音活动检测技术   总被引:2,自引:0,他引:2  
以MOTOROLA公司生产的DSP56F801芯片为核心搭建系统硬件电路,对语音信号进行处理。采用能够根据背景噪声变化而自适应调节门限的算法对语音活动进行精确检测,实现整机系统在高噪声环境下的正常通讯。实际检测结果表明:在100、110、115dB的强背景噪声环境下,系统识别率分别为100%、96%和94%,丢字漏字率分别为2%、5%和10%;在100~110、110-115dB的背景噪声环境,系统稳定性分别为100%和98%。采用此种算法,增强了系统的抗干扰能力,在高噪声和噪声不太稳定的环境下,实现了对语音活动的精确检测。  相似文献   

6.
针对特定人孤立词识别任务,传统的语音识别系统中构造的神经网络模型主要采用BP神经网络和径向基函数网络,为了解决这两种神经网络构造下的语音识别系统对训练样本需求量较大和识别率较低问题,提出了一种基于正交基函数展开的混合学习算法,并应用于语音识别中,同时与传统的BP神经网络、径向基函数网络进行了比较.仿真结果表明,采用对向...  相似文献   

7.
语音特征参数在说话人识别中的应用   总被引:1,自引:0,他引:1  
在噪声环境下,用传统特征参数如LPCC、MFCC说话人识别往往达不到很好的识别效果。用加权、差分和组合的方法对原始特征参数进行二次处理,并对处理的结果进行PCANN变换,可得到一种新的说话人特征参数。新特征实现了对原特征的降维和去冗余,丢弃了分布在高维的噪声信息,实验表明,新特征增强了说话人识别系统的鲁棒性,提高了系统的识别性能。  相似文献   

8.
当前便携式农产品市场信息采集设备缺少语音接口,且通用领域的识别算法又过于复杂,为此提出一种适用于该设备作业环境的语音识别鲁棒性方法。首先利用MMSE估计器对带噪信号进行增强,以提高输入信号的信噪比;对增强后产生的语音失真和残留噪声,再利用倒谱均值方差归一化(CMVN)方法进行补偿。实验结果表明,该联合后的算法能有效的提高系统的识别率,特别是在低信噪比(0~10 dB)环境下更为有效。  相似文献   

9.
基于分形理论的语音端点检测   总被引:5,自引:0,他引:5       下载免费PDF全文
为提高语音端点检测(VAD)在较低信噪比(<10 dB)下的准确率,提出一种基于短时分形维数的改进算法。结合语音信号的特点,对2种常用的语音信号分形维数计算方法进行了比较和选择,同时采用动态跟随门限值实现语音端点的自适应检测。试验结果表明:对于信噪比6~10 dB的带噪语音,此方法可以实现整段语音的检测,而且具有一定的噪声鲁棒性,系统运行期间能够自适应调整门限值以适应环境噪声的变化,提高了VAD算法的准确率。  相似文献   

10.
为提高声调识别率,利用隐条件随机场对汉语声调进行建模,通过加入音节内动态特征、音节间动态特征以及段长特征来进一步提高声词识别性能。提出了将声调模型加入大词汇量连续语音识别系统的区分性方法,根据最小音子错误准则区分性训练模型相关的概率权重,对声学模型及声调模型概率进行加权;给出了两种权重组合策略并通过一种平滑方法来克服权重训练过拟合的问题。实验结果表明,基于隐条件随机场声调模型能够显著提高声词识别率以及大词汇量语音识别的识别率,同时与全局模型权重方法比较,区分性的模型权重训练能够在声调模型加入连续语音识别系统之后,进一步提高系统的识别性能。  相似文献   

11.
对利用基因算法训练连续隐马尔柯夫模型的语音识别的具体算法进行系统的研究;然后基于该语音识别技术对深圳市司法局社区矫正声纹识别系统进行详细设计。该系统上线后的运行结果表明,利用基因算法训练连续隐马尔柯夫模型的语音识别算法的识别速度较快同时具有较高的识别率。基于模式识别技术的司法社区矫正声纹识别系统建设在我国司法系统目前尚处于起步阶段,推广和建设司法社区矫正声纹识别系统具有重要的现实意义。  相似文献   

12.
【目的】将语音识别技术应用到农产品价格信息采集中,面向非特定人和限定词汇量的汉语普通话连续语音识别,提出一种适合于农产品价格采集环境的语音识别鲁棒性方法;以隐马尔科夫模型为基础,训练出适合该环境下的声学模型,以缓解因测试环境和训练环境不匹配而导致的识别率降低,进一步提高识别率。【方法】在数据采集和处理阶段,首先根据要识别的限定词汇按照一定的语法规则构建转换文法,利用该文法生成的脚本指导训练集和测试集录音;然后选择不同的农产品价格采集环境和不同的说话人进行语音采集,并进行准确的人工切分,最后构建出语音语料库;在模型训练阶段,选择自左向右无跳转结构的连续混合密度隐马尔科夫模型,对训练集中的数据提取39维的MFCC特征向量,用于模型训练。首先以单音素为建模单元,并分别训练基于隐马尔科夫模型的男声模型、女声模型及男女混合声学模型;然后,考虑到单音素稳定性差和易受协同发音现象影响等因素,以上下文相关的三音素为识别单元建模,重新训练上述模型;针对三音子建模单元带来的模型数量大量增加,进而造成的训练样本不足问题,采用决策树状态聚类方法来改善该问题;决策树的构建过程中,利用语音学知识,根据声母发音方式、发音部位的不同以及韵母构成、韵头的不同,划分出若干声韵母集合实现了二值问题集的设计;在此基础上,用增加混和高斯分量的方法来进一步使得模型描述更加精确;最后,为了解决信道的乘性噪声问题,在采用上述策略的同时利用CMN和CVN方法来缓解测试环境与训练环境不匹配问题,最终训练得到了相应的男声模型和女声模型。在测试阶段,对采用上述各方法后得到的不同模型,分别采用相同的测试集进行试验,得出不同方法下的句子识别率、词识别率以及精准度。【结果】三音子声学模型的识别性能明显优于单音素声学模型,女声模型和男声模型的性能均优于男女混合声学模型,决策树聚类方法对识别率的提高不明显但可以明显减少三音子模型的数量,混合高斯分量的增加对识别率具有一定提高但同时带来计算量的增加,CMN和CVN方法可以明显提高系统的识别性能。通过对不同地点和不同说话人进行测试,最终识别率男性为95.04%,女性为97.62%。【结论】语音识别技术应用到农产品价格信息采集过程中是可行的。本文提出了一种农产品价格采集环境下提高语音识别率的方法,试验证明通过该方法训练出的模型具有较好的识别性能,本研究方法为日后应用系统的开发奠定了基础。  相似文献   

13.
为建立一种更为友好的,人性化的应用程序界面方面提出了一种构想,并且提供了一种通用的接口,使得Windows应用程序可以非常方便的利用它实现语音控制。在提高语音识别率方面,充分考虑了目前几种比较先进的语音分析方法,针对不同特征的语音信号,运用决策树的方法动态选择识别算法,极大地提高了语音识别率。在消息模拟方面提出了较有创意又切实可行的方案。  相似文献   

14.
在许多模式识别采样的过程中,由于环境噪声和设备误差,往往导致采集的数据与真实值有一定偏差,这种偏差会影响识别的效果。本文采用Max-T FHNN模型,提出一种应用于智能化交通管理的车型识别方法。并用实验证实相对于其他车型识别方法,该方法在待测样本含有噪声的情况下能得到更好的识别率。  相似文献   

15.
依赖廉价劳动力和大量消耗资源得以做大的“中国制造”,其基础是脆弱的。“中国制造”正面临着前所未有的危机和挑战,诸多的困惑和隐忧严重地威胁和阻碍着“中国制造”开拓国际市场的步伐。要想真正做强“中国制造”,就必须转变经济发展方式,大力推进科技进步,增强自主创新能力,积极培育自主品牌,进一步提高产品质量;同时,政府和企业采取有效的政策措施积极应对各种形式的贸易保护主义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号