收藏本站
《中国计算机语言学研究前沿进展(2007-2009)》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

汉语儿童口语语料库的建立及语料初步统计分析

张碧川  王小捷  徐文智  刘冬雪  
【摘要】:我们认为基于儿童语言习得的过程可以帮助建立一种语言的计算模型。研究儿童语料资源在语言习得及其计算模型的研究中是不可或缺的,本文将CHILDES语料中汉语语音进行转录及词性标注,得到一个儿童口语语料库。并比较了儿童语言,儿向语言和成人语言之间的字层句层特点,我们基于实验结果讨论了语言习得理论。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 罗振声;罗军;;语料库应用得好,有可能产生语言研究的革命[J];中文信息;1996年06期
2 王海静;;歇后语语料库模型设计与建设[J];科技情报开发与经济;2009年05期
3 罗振声;;清华大学TH大型通用汉语语料库系统的研制[J];清华大学学报(哲学社会科学版);1996年01期
4 胡强;汉语语料库满足社会需求的思考[J];江苏教育学院学报(社会科学版);2002年06期
5 张虎;郑家恒;;基于分类的汉语语料库词性标注一致性检查[J];计算机工程;2008年08期
6 乐明;;汉语篇章修辞结构的标注研究[J];中文信息学报;2008年04期
7 刘江,郑家恒,张虎;中文文本语料库分词一致性检验技术的初探[J];计算机应用研究;2005年09期
8 张民,李生,赵铁军;大规模汉语语料库中任意n的n-gram统计算法及知识获取方法[J];情报学报;1997年01期
9 张国煊;汉语语料库加工技术[J];杭州电子工业学院学报;1996年01期
10 牛洪梅;吐尔根;伊不拉音;;维吾尔语的词性标注校对初探[J];微型电脑应用;2006年12期
11 梅勇,王群生,徐秉铮;基于 FoxPro for Windows 的汉语语料库系统的构造[J];华南理工大学学报(自然科学版);1998年01期
12 李新福;赵杰;梁巍;;基于互信息的宋史语料库词表的提取[J];河北大学学报(自然科学版);2006年05期
13 王东海;赵伟;陈洁;梁贺;;基于隐Markov模型汉语词性自动标注的若干分析与改进[J];长春工业大学学报(自然科学版);2007年01期
14 苏翔;李玉鑑;;GIZA++计算性能分析[J];计算机工程与科学;2010年05期
15 张海军;史树敏;朱朝勇;黄河燕;;中文新词识别技术综述[J];计算机科学;2010年03期
16 龙志祎;程葳;沈俊辉;;TDT中新发现话题的分类研究与实现[J];武汉理工大学学报(信息与管理工程版);2009年05期
17 王素格,张永奎;汉语词性标注排歧方法探讨[J];计算机工程与应用;2001年07期
18 李群;;文本分词的自动校对[J];渤海大学学报(自然科学版);2006年03期
19 刘鹏远;赵铁军;杨沐昀;李壮;;基于等价伪译词模型的无指导译文消歧研究[J];电子与信息学报;2008年07期
20 陈群秀;检阅成果 同描蓝图──全国第二届计算语言学联合学术会议简介[J];语言文字应用;1994年01期
中国重要会议论文全文数据库 前10条
1 张碧川;王小捷;徐文智;刘冬雪;;汉语儿童口语语料库的建立及语料初步统计分析[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
2 石民;陈小荷;于丽丽;李斌;;基于CRF的古汉语分词标注一体化研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 张洁;孟遥;于浩;;基于分词性能的汉语语料库比较研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
4 姚树杰;肖桐;朱靖波;;基于句对质量和覆盖度的统计机器翻译训练语料选取[A];第五届全国青年计算语言学研讨会论文集[C];2010年
5 黄居仁;;瓶颈,挑战,与转机:中文分词研究的新思维[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
6 陈宁昱;周雅倩;黄萱菁;吴立德;;利用未标注语料改进实体名识别性能[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
7 朱慕华;陈文亮;朱靖波;;词聚类在文本分类中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 熊军军;李成荣;;实际场景语料和FSN语料的平衡方法[A];第九届全国人机语音通讯学术会议论文集[C];2007年
9 张冬冬;李志灏;李沐;周明;;第四届机器翻译研讨会微软亚洲研究院技术报告[A];机器翻译研究进展——第四届全国机器翻译研讨会论文集[C];2008年
10 玉素甫.艾白都拉;阿不都热依木沙力;热孜万;;现代维语语料库加工处理中的机器词根词典研究[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 洪宇;基于语义结构和时序特征的话题检测与跟踪技术研究[D];哈尔滨工业大学;2009年
2 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
3 肖镜辉;非时齐语言建模技术研究及实践[D];哈尔滨工业大学;2007年
4 刘鹏远;基于知识自动获取的无指导译文消歧方法研究[D];哈尔滨工业大学;2008年
5 孙广路;基于统计学习的中文组块分析技术研究[D];哈尔滨工业大学;2008年
6 谭红叶;中文事件抽取关键技术研究[D];哈尔滨工业大学;2008年
7 王乐;短语消息聚类相关技术研究[D];国防科学技术大学;2008年
8 巢文涵;基于双语语料库的机器翻译关键技术研究[D];国防科学技术大学;2008年
9 胡明涵;面向领域的文本分类与挖掘关键技术研究[D];东北大学 ;2009年
10 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 魏瑾;基于统计的汉英机器翻译技术的研究[D];国防科学技术大学;2006年
2 王铮;基于CRF的古籍地名自动识别研究[D];广西民族大学;2008年
3 邓舒;中文短信分析及其语言模型研究[D];北京邮电大学;2009年
4 何晓峰;基于短语的汉英统计机器翻译系统的设计与实现[D];山东大学;2009年
5 陈小陆;人物言论抽取与跟踪技术研究[D];哈尔滨工业大学;2008年
6 夏静;常用词的兼类自动识别研究[D];郑州大学;2012年
7 王敏;基于改进的隐马尔科夫模型汉语词性标注[D];山西大学;2007年
8 陈婕;短信息文本自动分类技术的研究与实施[D];北京邮电大学;2008年
9 胡思磊;基于CRF模型的汉语介词短语识别[D];大连理工大学;2008年
10 黄浩炜;SVM与基于转换的错误驱动学习方法相结合的生物实体识别[D];国防科学技术大学;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978