基于三特征流DBN模型的听视觉情感识别
【摘要】:本文构建了一种三特征流混合动态贝叶斯网络(T_AsyDBN)听视觉情感识别模型,听觉流采用MFCC特征和经过PCA降维的局部韵律特征,视觉流定义了二维面部几何特征和三维面部动作参数特征,并经过PCA降维,形成19维视觉特征。两个听觉特征流在状态层同步,而它们与视觉特征流可以在一定约束条件下异步。在eNERFACE'05听视觉情感数据库上的情感识别实验表明,通过调整听视觉状态流之间的异步约束,与传统的多流隐马尔可夫模型(MSHMM)以及有状态异步约束的听视觉双流DBN模型(Asy_DBN)相比,T_AsyDBN模型的识别率分别高出18.73%和10.21%。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||
|