收藏本站
《第六届全国现代语音学学术会议论文集(下)》2003年
收藏 | 手机打开
二维码
手机客户端打开本文

连续汉语语音识别语料库的设计

王天庆  李爱军  
【摘要】:本文描述了连续汉语识别语料库的建立过程。本语料的主要特点是以口语为主,选择在内容和语义上均完整的句子作为挑选对象,按照音节间的三音子作为挑选的基本单元,并且在挑选时首次尝试考虑了韵律信息。文章对可能合理存在的三音子组合进行了统计,得到了可能存在的三音子集。我们在对初始文本断句后,测算了断句后的句长及其它的标准差,得到了比较合理的录音文本控制长度。文章最后给出了带韵律信息的文本挑选的算法,利用此算法,得到了录音用文本,并分析了挑选出的文本在音段和声调方面的覆盖情况。

手机知网App
【引证文献】
中国重要会议论文全文数据库 前1条
1 李爱军;王天庆;殷治纲;;863语音识别语音语料库RASC863—四大方言普通话语音库[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
【参考文献】
中国期刊全文数据库 前1条
1 吴华,徐波,黄泰翼;基于三音子模型的语料自动选择算法[J];软件学报;2000年02期
【共引文献】
中国期刊全文数据库 前1条
1 赵晖;唐朝京;;基于汉语视频三音素的可视语音合成[J];电子与信息学报;2009年12期
中国重要会议论文全文数据库 前1条
1 宁振江;杜利民;;面向语音识别声学模型的汉语语料抽选方法[A];中国声学学会2003年青年学术会议[CYCA'03]论文集[C];2003年
中国博士学位论文全文数据库 前1条
1 赵晖;真实感汉语可视语音合成关键技术研究[D];国防科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 刘波;文本驱动的可视语音合成技术研究[D];哈尔滨工程大学;2010年
2 刘亚玉;限定性文本的语料库自动构建[D];中国海洋大学;2010年
3 包世恩;蒙古语非特定人大词汇量连续语音识别系统的研究与实现[D];内蒙古大学;2005年
4 王志强;孤立词语音识别系统关键问题的研究[D];北京邮电大学;2006年
5 毕力格图;基于HMM建模的蒙古语连续语音识别系统的研究与实现[D];内蒙古大学;2006年
6 李尘一;基于联合得分的语音置信度评估系统的研究与设计[D];内蒙古大学;2006年
7 彭荻;语音识别系统的声学建模研究[D];北京邮电大学;2007年
8 蔡琴;基于HTK的维吾尔语连续数字语音识别研究[D];新疆大学;2007年
9 艾霞;面向语音识别的蒙古语语言模型的研究[D];内蒙古大学;2007年
10 李原;小词汇量连续语音识别系统的研究[D];西南大学;2008年
【同被引文献】
中国重要会议论文全文数据库 前2条
1 于珏;李爱军;王霞;;上海普通话与普通话卷舌元音的声学特征对比研究[A];第六届全国现代语音学学术会议论文集(上)[C];2003年
2 汤胜良;张士礼;张志平;吴玺宏;迟惠生;;基于新闻联播语料库的语音合成系统[A];第八届全国人机语音通讯学术会议论文集[C];2005年
【二级引证文献】
中国期刊全文数据库 前2条
1 金玉卿;吕成国;;情感变异的语音语料库的设计和构建[J];智能计算机与应用;2011年05期
2 张小燕;宿建军;薛化建;王磊;;维吾尔语语音识别语料库中的OOV研究[J];计算机工程与设计;2012年02期
中国硕士学位论文全文数据库 前3条
1 吴丹;基于小型呼叫中心的预约诊疗系统的设计与实现[D];齐齐哈尔大学;2011年
2 吴亦斌;母语为英语的留学生汉语二字组韵律偏误研究[D];南京师范大学;2011年
3 杜守栓;方言口音普通话语音自动切分算法研究[D];中国科学院研究生院(计算技术研究所);2006年
【相似文献】
中国期刊全文数据库 前10条
1 高璐;;藏语天气预报语音合成系统的初步研究[J];电脑与电信;2009年01期
2 黄德智;张晓洲;蔡莲红;;一种数字语音处理研究平台的设计[J];计算机工程;2006年12期
3 才让卓玛;才智杰;;基于语料库的藏语TTS技术研究[J];青海师范大学学报(自然科学版);2010年02期
4 周斌,双志伟,王仁华,戴礼荣;一种应用于音库压缩的低速率编解码方案[J];信号处理;2004年06期
5 周艳;艾斯卡尔;;基于可变长音素序列拼接单元的维吾尔语语音合成技术研究[J];四川理工学院学报(自然科学版);2007年02期
6 杨雅婷;董兴华;王磊;吐尔洪·吾司曼;李晓;;电话信道维吾尔语口语语料库设计与研究[J];计算机工程与应用;2011年23期
7 赵世霞,蔡莲红,常晓磊;汉语语音合成语料库管理系统的建立[J];小型微型计算机系统;2000年03期
8 王宏;李鑫;高阳;;基于大学生的汉语说话人识别语音库设计[J];昌吉学院学报;2008年06期
9 沈亚敏;赵晖;张权;唐朝京;;面向语音转换的汉语语料自动选取算法[J];计算机工程;2011年05期
10 梁青青;杨鸿武;郭威彤;裴东;甘振业;;利用五度字调模型实现普通话到兰州方言的转换[J];声学技术;2010年06期
中国重要会议论文全文数据库 前10条
1 蔡莲红;蔡锐;吴志勇;陶建华;;语音合成语料库的设计与声学特征分析[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
2 王天庆;李爱军;;连续汉语语音识别语料库的设计[A];第六届全国现代语音学学术会议论文集(下)[C];2003年
3 王仁华;胡郁;李威;凌震华;;基于决策树的汉语大语料库合成系统[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 贺琳;张蕊;俞舸;;大规模语音合成语料库的录制及常见问题[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
5 俞舸;贺琳;;言语合成语料库的制作[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
6 方棣棠;;汉语普通话听写机的发展现状与前景[A];第五届全国人机语音通讯学术会议论文集[C];1998年
7 黄秀芳;贺琳;吕士楠;;言语合成语料库发音人的挑选[A];第八届全国人机语音通讯学术会议论文集[C];2005年
8 孙岭;胡郁;王仁华;;中文语音合成系统中的语料库设计[A];第六届全国人机语音通讯学术会议论文集[C];2001年
9 朱维彬;张家录;;汉语语音数据库的标注[A];第四届全国人机语音通讯学术会议论文集[C];1996年
10 曲菲;黄泰翼;张希军;;汉语综合语音库语料设计[A];第四届全国人机语音通讯学术会议论文集[C];1996年
中国重要报纸全文数据库 前10条
1 ;新型身份验证:图形密码[N];中国计算机报;2006年
2 鼎桥通信技术有限公司 范晨 李克;TD—MBMS:抢滩多媒体广播业务[N];通信产业报;2007年
3 ;中国移动手机条码拥有五大功能[N];人民邮电;2006年
4 朗讯科技(中国)有限公司;朗讯AnyPath实现融合最终梦想[N];通信产业报;2006年
5 刘兵 邢军;打造远程教育的“星际舰队”[N];网络世界;2003年
6 山东 董肇荣;在PROGDVB中增加卫星和转发器的方法[N];电子报;2004年
7 小今;多媒体播放成热点[N];计算机世界;2003年
8 聂小青;图像压缩技术实现突破[N];新华每日电讯;2002年
9 朱虹;尽快实施手机汉字输入国家标准[N];人民日报;2007年
10 ;MP3看电子书为啥有乱码[N];中国电脑教育报;2008年
中国博士学位论文全文数据库 前4条
1 黄平牧;中文TTS系统中若干关键技术研究[D];北京邮电大学;2008年
2 陈志立;语言隐写术的分析与设计研究[D];中国科学技术大学;2009年
3 程明智;电子商务环境中信息快速加密及内容安全管理相关技术研究[D];北京邮电大学;2010年
4 曹卫兵;基于数字图像的信息隐藏技术研究[D];西北工业大学;2003年
中国硕士学位论文全文数据库 前10条
1 麦麦提艾力·吐尔逊;基于语料库的维吾尔语语音合成系统的研究与实现[D];新疆大学;2007年
2 陆静芳;基于语料库的汉语语音模拟系统技术研究[D];国防科学技术大学;2005年
3 邱莎;基于统计的生物命名实体识别研究[D];四川大学;2006年
4 郭威彤;西安方言的声学特征分析和韵律建模的研究[D];西北师范大学;2009年
5 邹荣;大词汇量连续语音识别系统中统计语言模型的研究[D];北京邮电大学;2006年
6 哈斯其劳;面向语音识别的蒙古语声学模型的研究[D];内蒙古大学;2008年
7 崔文迪;会议语音的混响消除及其在词汇量连续语音识别的研究[D];厦门大学;2008年
8 裴定瑜;基于大语料库英文TTS语音拼接单元的选择[D];同济大学;2006年
9 耿现保;汉语情感语音的可视合成研究[D];山东大学;2009年
10 蔡琴;基于HTK的维吾尔语连续数字语音识别研究[D];新疆大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026