收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于Alize工具包的广播音频播音员自动标注系统

卢咪咪  谢磊  郑李磊  杨玉莲  张艳宁  
【摘要】:本文设计与实现了一个基于Alize开源说话人识别工具包的广播音频播音员自动标注系统,对中央电视台《新闻联播》节目主持人以及重要说话人进行自动身份识别、分割与标注。采用Alize工具包提供的Feature Server、Mixture Server和Statistics Server,实现了基于高斯混合模型(GMM)的说话人识别模块。系统引入音频分类、语音分割等模块,音频分类模块对新闻音频中存在的多种音频类型进行区分,仅有被标注为语音的部分被挑选出进行说话人识别和标注。采用一种分层策略进行播音员自动标注,先按身份已知和未知对说话人分类,再对未知说话人进行性别标注。实验表明,该系统的说话人识别错误率低于0.05,对完整《新闻联播》节目的说话人自动标注错误率为0.229。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 石柱;;声纹识别的应用与矢量量化算法研究[J];电声技术;2006年10期
2 余华,赵力,吴镇扬;基于FVQ的说话人识别系统的DSP实现[J];电声技术;2004年08期
3 武妍,金明曦,王洪波;基于KL-小波包分析的文本无关的说话人识别[J];计算机工程与应用;2005年04期
4 崔桂香,丁晓明;声纹识别技术应用及一些关键问题[J];计算机安全;2004年07期
5 王吉林;利用矢量量化的说话人识别系统的研究[J];安徽工业大学学报(自然科学版);2005年03期
6 李财莲;赵小阳;王丽娟;岳振军;;说话人识别中关键技术的现状与发展[J];军事通信技术;2005年02期
7 叶蕾;方鹏;;说话人识别技术中Mel倒谱参数改进算法的C程序实现[J];计算机与现代化;2007年11期
8 崔国辉,田岚;基于子带处理多分类器融合的说话人识别[J];山东大学学报(工学版);2004年04期
9 连翰,汪峥,王建军;一种RBFN和FLD融合的说话人识别方法[J];复旦学报(自然科学版);2005年01期
10 万洪杰,杜利民,邓浩江;基于贝叶斯网络的说话人识别研究[J];计算机应用;2005年06期
11 陈若珠;李战明;王贞;;基于组合神经网络的与文本无关的说话人识别[J];兰州理工大学学报;2006年03期
12 但志平;胡刚;刘勇;;基于LPC倒谱参数分析的说话人识别系统[J];三峡大学学报(自然科学版);2007年01期
13 高争艳;张玉双;王慕坤;;基于核K-均值聚类和支持向量机结合的说话人识别方法[J];哈尔滨理工大学学报;2008年05期
14 于保华,吴亚栋,李治柱;基于长时频谱统计参数的说话人识别[J];计算机工程;2004年02期
15 连翰,汪峥,王建军,张立明;基于自适应RBFN阵列的说话人识别[J];信息与电子工程;2004年03期
16 郭春霞,裘雪红;基于MFCC的说话人识别系统[J];电子科技;2005年11期
17 周燕;;遗传算法与BP神经网络相结合的说话人识别系统[J];传感器与微系统;2009年06期
18 王仁华,何林顺,黎建宁;等方差加权倒谱失真测度及其在说话人识别中的应用[J];电子学报;1992年08期
19 张颖;张友纯;;基于MFCC和最小距离分类器的说话人识别系统[J];软件导刊;2006年19期
20 王伟;邓辉文;;基于MFCC参数和VQ的说话人识别系统[J];仪器仪表学报;2006年S3期
中国重要会议论文全文数据库 前10条
1 卢咪咪;谢磊;郑李磊;杨玉莲;张艳宁;;基于Alize工具包的广播音频播音员自动标注系统[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
2 吴志强;陈珂;迟惠生;;语音识别技术与说话人识别技术的结合——文本无关说话人识别的另一种方法[A];第四届全国人机语音通讯学术会议论文集[C];1996年
3 朱磊;江杰;郑榕;徐波;;一种快速说话人搜索算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 王昌昌;王成儒;;一种改进的基于KPCA和SVM的文本无关说话人识别算法研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年
5 司罗;胡起秀;金琴;;基于码字概率分布(BCDM)的说话人辨识系统[A];第五届全国人机语音通讯学术会议论文集[C];1998年
6 张利鹏;曹犟;徐明星;郑方;;说话人识别系统防止假冒者闯入问题的研究[A];第九届全国人机语音通讯学术会议论文集[C];2007年
7 黄晓丹;洪青阳;李琳;李稀敏;梁大伟;陈万里;吕伟辰;丘敬云;王薇;;声纹识别语音数据库建设的探讨[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
8 黎建宁;王仁华;;矢量量化在说话人识别中的应用[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
9 郭皓婷;;基于声纹识别技术的应用难点研究[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
10 殷启新;贾学明;彭宇;;数字声纹识别技术在刑侦工作中的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 章志勇;三维模型几何相似性比较的研究[D];浙江大学;2005年
2 李冬冬;基于拓展和聚类的情感鲁棒说话人识别研究[D];浙江大学;2008年
3 包永强;噪声环境下说话人识别的研究[D];东南大学;2006年
4 邵虹;基于内容的医学图像检索关键技术研究[D];东北大学;2005年
5 孙建德;抗时间同步攻击的数字视频水印方法研究[D];山东大学;2005年
6 吴国民;海量多媒体数字水印技术研究[D];浙江大学;2007年
7 陈倩;多生物特征融合身份识别研究[D];浙江大学;2007年
8 庄毅;海量多媒体数据库的高效查询处理[D];浙江大学;2007年
9 许剑峰;数字视频中的文本分割的研究[D];华南理工大学;2005年
10 孙兴华;基于内容的图像检索研究[D];南京理工大学;2002年
中国硕士学位论文全文数据库 前10条
1 徐海华;说话人识别方法及其系统的应用开发研究[D];华中科技大学;2004年
2 杨璞;基于声门特征的说话人识别研究[D];浙江大学;2005年
3 王炜;文本无关的连续自然语音的说话人识别及基于DSP的实现[D];解放军信息工程大学;2004年
4 于俊凤;语音信号的识别与转换研究[D];成都理工大学;2004年
5 林琳;说话人识别算法研究及DSP实现[D];吉林大学;2004年
6 徐爽;小波分析理论在说话人识别中的应用研究[D];燕山大学;2004年
7 桑立锋;动态贝叶斯网络及其在说话人识别中的应用[D];浙江大学;2004年
8 崔宣;基于语音混合特征说话人识别的研究[D];西华大学;2008年
9 马建;基于独立成分分析的说话人识别技术研究[D];电子科技大学;2005年
10 张坤;说话人识别系统的硬件设计及相关软件实现[D];吉林大学;2004年
中国重要报纸全文数据库 前9条
1 吴玺宏;声纹识别应用前景[N];计算机世界;2001年
2 邢方亮;以声辨人[N];计算机世界;2003年
3 实习生 沈春梅;鉴定萨达姆录音真假[N];科技日报;2003年
4 吴思、杨春、王雁凌;掀起多媒体检索革命[N];中国计算机报;2002年
5 颜色;让音乐软件插上技术的翅膀[N];中国文化报;2007年
6 李文;身体密码:确定唯一的你[N];广州日报;2011年
7 黄中;指纹 声纹 味纹和DNA纹[N];中国知识产权报;2001年
8 吴加录;微软技术节演绎“中国创新”[N];中国计算机报;2008年
9 中国科技大学计算机系 邢方亮;神经网络挑战人类大脑[N];计算机世界;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978