基于DNN-LSTM的VAD算法
【摘要】:基于深度神经网络(Deepneuralnetwork,DNN)的语音活动性检测(Voiceactivitydetection,VAD),忽略了语音帧特征在时间上的相关性,随着信噪比的降低性能会明显下降。本文提出了一种基于DNN-LSTM(长短时记忆单元,LSTM)的VAD检测算法,进一步对语音帧特征序列的动态信息加以分析利用。同时结合DNN-LSTM结构提出一种基于上下文信息的网络训练代价函数。实验语料基于TIDIGITS语音库,使用Noisex-92噪声库加噪。实验结果显示,在不同噪声环境下DNN-LSTM的VAD比基于DNN的VAD方法有更好的性能,新的代价函数比传统的更适用于本文提出的算法。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|