收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于改进卷积神经网络的语音分离方法

张婷  刘允刚  
【摘要】:最近几年,基于深度神经网络的语音分离方法被提出,与传统的模型相比呈现出强大的优势.但是这种方法在训练模型之前需要提取各种复杂特征作为输入,该过程是非常耗时的.在本文中,我们提出了一种基于语音单帧特征的一维卷积神经网络(1D-CNN)框架,通过设置卷积核的维度大小并对权值向量进行初始化,自动学习语音局部信息的特征表达.实验结果表明,与已有的基于DNN的语音分离系统相比,具有相同层数和节点的1D-CNN框架可以大大提高理想二值掩蔽(IBM)中的HIT-FA指标(命中率-误报率),尤其可以有效地减少将噪声单元错误分类为目标语音单元的误报率(FA),这对于提升语音目标的质量和可懂度是非常有益的.此外,我们通过对不同的噪声混合信号和不同的输入信噪比进行实验,进一步验证了1D-CNN系统的泛化能力.另外,通过对比不同池化窗口大小的实验结果,我们发现当窗口大小大于1时,系统的时间复杂度减小.同时语音分离性能会略微下降,所以实际应用中可以通过设定合理的池化窗口,满足系统对精度和时间复杂度的要求.

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李从清;孙立新;龙东;任晓光;;语音分离技术的研究现状与展望[J];声学技术;2008年05期
2 施剑;杜利民;;基于麦克阵列的实时盲语音分离系统[J];微计算机应用;2008年05期
3 张磊;刘继芳;项学智;;基于计算听觉场景分析的混合语音分离[J];计算机工程;2010年14期
4 杨海滨;张军;;基于模型的单通道语音分离综述[J];计算机应用研究;2010年11期
5 虞晓,胡光锐;基于高斯混合密度函数估计的语音分离[J];上海交通大学学报;2000年01期
6 虞晓,胡光锐;基于高斯混合密度函数估计的语音分离[J];上海交通大学学报;2000年02期
7 张雪峰,刘建强,冯大政;一种快速的频域盲语音分离系统[J];信号处理;2005年05期
8 陈锴;卢晶;徐柏龄;;基于话者状态检测的自适应语音分离方法的研究[J];声学学报;2006年03期
9 董优丽;谢勤岚;;不确定信号源个数的语音分离[J];现代电子技术;2008年03期
10 徐方鑫;;瑞米兹交替算法在语音分离上的应用[J];电脑知识与技术;2012年03期
11 刘俊良;于凤芹;;基于分离度变步长的自然梯度算法的语音分离[J];计算机工程与应用;2013年21期
12 李鹏;关勇;刘文举;徐波;;一种改进的单声道混合语音分离方法[J];自动化学报;2009年08期
13 赵鹤鸣,葛良,陈雪勤,俞一彪;基于声音定位和听觉掩蔽效应的语音分离研究[J];电子学报;2005年01期
14 付中华;赵亚丽;;基于时频稀疏性的混叠语音分离及失真对策(待续)[J];电声技术;2012年05期
15 付中华;赵亚丽;;基于时频稀疏性的混叠语音分离及失真对策(续完)[J];电声技术;2012年06期
16 丁慧,徐柏龄;自适应降噪系统的语音分离研究[J];声学学报;2004年01期
17 张学良;刘文举;李鹏;徐波;;改进谐波组织规则的单通道浊语音分离系统[J];声学学报;2011年01期
18 赵立恒;汪增福;;基于谐波和能量特征的单声道浊语音分离方法[J];声学学报;2012年02期
19 赵鹤鸣,朱美虹,陈雪勤,肖筱华;基于声场景分析的混叠语音分离研究[J];通信技术;2002年01期
20 罗元;童开国;张毅;邢武超;陈凯;陈红松;何春江;陈君;;多个声源下基于人耳听觉特性的语音分离[J];智能系统学报;2012年02期
中国重要会议论文全文数据库 前5条
1 史晓非;王宪峰;黄耀倞;刘人杰;;一个推广参数矢量算法在语音分离中的应用[A];中国航海学会通信导航专业委员会2004学术年会论文集[C];2004年
2 刘学观;陈雪勤;赵鹤鸣;;基于改进遗传算法的混叠语音分离研究[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
3 林静然;彭启琮;邵怀宗;;基于麦克风阵列的双波束近场定位及语音分离[A];第二届全国信息获取与处理学术会议论文集[C];2004年
4 茅泉泉;赵力;;基于MIMO的盲信道语音分离技术[A];2004年全国物理声学会议论文集[C];2004年
5 李量;杜忆;吴玺宏;Claude Alain;;人类听皮层在语音分离中对频率线索和空间线索的线性整合[A];增强心理学服务社会的意识和功能——中国心理学会成立90周年纪念大会暨第十四届全国心理学学术会议论文摘要集[C];2011年
中国博士学位论文全文数据库 前2条
1 赵立恒;基于计算听觉场景分析的单声道语音分离研究[D];中国科学技术大学;2012年
2 王雨;基于计算听觉场景分析的单通道语音分离研究[D];华东理工大学;2013年
中国硕士学位论文全文数据库 前10条
1 赵训川;基于计算听觉场景分析和麦克风阵列的语音分离的研究[D];燕山大学;2015年
2 何求知;单通道语音分离关键技术研究[D];电子科技大学;2015年
3 曹猛;基于计算听觉场景分析和深度神经网络的混响语音分离[D];太原理工大学;2016年
4 李枭雄;基于双耳空间信息的语音分离研究[D];东南大学;2015年
5 王瑜;基于计算听觉场景分析的三通道语音分离研究[D];燕山大学;2016年
6 王菁;基于计算听觉场景分析的混合语音分离[D];燕山大学;2016年
7 束佳明;基于双耳声源定位的鲁棒语音分离研究[D];东南大学;2016年
8 陈麟琳;基于机器学习的欠定语音分离方法研究[D];大连理工大学;2016年
9 张晖;层叠与深度神经网络研究及其在语音分离中的应用[D];内蒙古大学;2014年
10 童开国;多声源环境下基于听觉中枢系统的语音分离研究[D];重庆邮电大学;2012年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978