非线性频谱变换的说话人识别性能分析
【摘要】:本文分析非线性频谱变换对说话人识别系统性能的影响.首先对反映人耳听觉感知特性的三种典型非线性频谱变换,即 Mel 尺度频谱变换、BARK 尺度频谱变换和 ERB 尺度频谱变换特性进行了分析与描述,并在频率变换域提取语音信号的倒谱特征,分析相应的说话人识别系统性能.实验结果表明,Mel 频率倒谱系数并不是表征说话人特征的最优特征参数,在很多情况下,基于 BARK 尺度的特征参数更优.
|
|
|
|
1 |
宁向延;景昊;;二次判决的融合系统在说话人识别中的应用[J];武汉大学学报(工学版);2011年04期 |
2 |
何亮;栗志意;蔡猛;刘加;;集合分类中的鉴别式局部信息距离保持映射[J];清华大学学报(自然科学版);2011年07期 |
3 |
;[J];;年期 |
4 |
;[J];;年期 |
5 |
;[J];;年期 |
6 |
;[J];;年期 |
7 |
;[J];;年期 |
8 |
;[J];;年期 |
9 |
;[J];;年期 |
10 |
;[J];;年期 |
11 |
;[J];;年期 |
12 |
;[J];;年期 |
13 |
;[J];;年期 |
14 |
;[J];;年期 |
15 |
;[J];;年期 |
16 |
;[J];;年期 |
17 |
;[J];;年期 |
18 |
;[J];;年期 |
19 |
;[J];;年期 |
20 |
;[J];;年期 |
|