收藏本站
《民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集》2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于统计语言模型蒙古文词汇分析校正器的设计与实现

赵军  敖其尔  吉仁尼格  巩政  葡萄  陈建东  
【摘要】:自动校对是自然语言处理领域中一项重要的研究内容。在蒙古文信息处理研究中,对蒙古文自动校对的探索还没有提出一个很好的解决方案。本文介绍了基于统计语言模型的蒙古文词汇分析校正方法,并重点探讨了模型的设计和可行性。

手机知网App
【参考文献】
中国期刊全文数据库 前7条
1 王明会,潘新安,钟义信;神经元网络用于拼音-汉字的转换[J];北京邮电大学学报;1994年02期
2 潘凌云,杨长生;拼音、汉字计算机自动转换系统[J];计算机学报;1990年04期
3 孙茂松,肖明,邹嘉彦;基于无指导学习策略的无词表条件下的汉语自动分词[J];计算机学报;2004年06期
4 陈耀东,王挺;基于有向图的双向匹配分词算法及实现[J];计算机应用;2005年06期
5 张仰森,丁冰青;基于二元接续关系检查的字词级自动查错方法[J];中文信息学报;2001年03期
6 冯冲;陈肇雄;黄河燕;关真珍;;基于Multigram语言模型的主动学习中文分词[J];中文信息学报;2006年01期
7 米吉提·阿布力米提,库尔班·吾布力;在多文种环境下的维吾尔语文字校对系统的开发研究[J];系统工程理论与实践;2003年05期
【共引文献】
中国期刊全文数据库 前10条
1 陈宏彦;陈俊杰;;规则与统计相结合的分词算法[J];电脑开发与应用;2006年08期
2 冯永;贺迅;唐黎;陈显勇;陈贞;;面向文本知识管理的自适应中文分词算法[J];重庆大学学报;2010年10期
3 蒲海霞;李佳田;李锐;何育枫;王华;;非结构化文本数据的GIS描述性查询方法[J];计算机应用;2012年09期
4 关白;才科扎西;;现代藏文音节字自动校对研究[J];计算机工程与应用;2012年29期
5 曲慧雁;赵伟;;基于词频的机械匹配文本分类改进算法[J];长春工业大学学报(自然科学版);2012年06期
6 修驰;宋柔;;基于无监督学习的专业领域分词歧义消解方法[J];计算机应用;2013年03期
7 赵衍;张永娟;陈成材;陈恒;;一种提高计算机自动赋词标引准确性的综合方法——基于创新型CBA数据库的实证分析[J];情报杂志;2012年05期
8 张开旭;夏云庆;宇航;;基于条件随机场的古汉语自动断句与标点方法[J];清华大学学报(自然科学版);2009年10期
9 张开旭;夏云庆;宇航;;基于条件随机场的古文自动断句与标点方法[J];清华大学学报(自然科学版)网络.预览;2009年10期
10 都菁;熊海灵;;基于论坛语料识别中文未登录词的方法[J];计算机工程与设计;2010年03期
中国重要会议论文全文数据库 前10条
1 韩冬煦;常宝宝;;基于边界熵和卡方统计量的多领域适应性中文分词方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 刮俊杰;吴树国;伊胜伟;;基于词效应的中文术语提取方法[A];第三届中国智能计算大会论文集[C];2009年
3 刘秉权;张凯;王晓龙;;语音识别中基于规则的语言模型的研究[A];第五届全国人机语音通讯学术会议论文集[C];1998年
4 龚小谨;罗振声;骆卫华;;模式匹配和句型成分分析相结合的语法错误自动检查[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 李斌;陈小荷;;面向中文陌生文本的人机交互式分词方法[A];第三届学生计算语言学研讨会论文集[C];2006年
6 牛洪梅;吐尔根.伊不拉音;;维吾尔语的词性标注校对初探[A];第三届学生计算语言学研讨会论文集[C];2006年
7 吐尔地·托合提;维尼拉·木沙江;米吉提·阿不里米提;;维吾尔文搜索引擎Web Server的实现[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
8 米吉提·阿不里米提;艾斯卡尔·艾木都拉;吐尔地·托合提;;维语词法分析器研究开发[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
9 王思力;王斌;;基于双字耦合度的中文分词交叉歧义处理方法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 王芳;万常选;;基于可信度的中文完整词自动识别[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国博士学位论文全文数据库 前10条
1 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
2 宗成庆;音字转换与句子规范化处理研究[D];中国科学院研究生院(计算技术研究所);1998年
3 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年
4 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
5 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
6 秦颖;汉语词和短语的歧义消解研究[D];北京邮电大学;2008年
7 李志国;面向分布式文本知识管理的中文分词与文本分类研究[D];重庆大学;2008年
8 车海燕;面向中文自然语言Web文档的自动知识抽取和知识融合[D];吉林大学;2008年
9 袁彩霞;中文功能组块分析及应用研究[D];北京邮电大学;2009年
10 熊英;中文自然语言理解中基于条件随机场理论的词法分析研究[D];上海交通大学;2009年
中国硕士学位论文全文数据库 前10条
1 孔胜;文本资源的知识抽取研究[D];大连理工大学;2010年
2 郭瞳康;基于词典的中文分词技术研究[D];哈尔滨理工大学;2010年
3 李丹;基于规则与统计的汉语自动分词研究[D];长春工业大学;2010年
4 林渌;基于新闻主题模型的热点工作挖掘系统[D];浙江大学;2011年
5 葛世海;基于J2EE的站群管理平台的设计与实现[D];电子科技大学;2010年
6 曹亚辉;非结构文本最佳近似匹配系统的研究与实现[D];东华大学;2011年
7 胡家豪;基于互联网的WEB舆情问答系统[D];电子科技大学;2011年
8 史俊冰;问答系统中词义消歧与关键词扩展研究[D];太原理工大学;2011年
9 郇政永;基于OCR的中文文本校对研究[D];北方工业大学;2011年
10 魏莎莎;一种中文未登录词识别及词典设计新方法[D];西南大学;2011年
【二级参考文献】
中国期刊全文数据库 前3条
1 梁南元;书面汉语的自动分词与一个自动分词系统—CDWS[J];北京航空学院学报;1984年04期
2 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
3 闫引堂,周晓强;交集型歧义字段切分方法研究[J];情报学报;2000年06期
中国重要会议论文全文数据库 前1条
1 周强;詹卫东;任海波;;构建大规模的汉语语块库[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
【相似文献】
中国期刊全文数据库 前10条
1 赵明明;梁颖红;周美玲;姚建民;;基于音节首字母匹配的音译单元对齐方法[J];江南大学学报(自然科学版);2009年06期
2 华浪珊;新闻出版界的好帮手——中文自动校对系统[J];今日电子;1994年11期
3 牛洪梅;吐尔根;伊不拉音;;维吾尔语的词性标注校对初探[J];微型电脑应用;2006年12期
4 牛洪梅;加米拉·吾守尔;吐尔根·依布拉音;;现代维吾尔语的词性标注校对技术研究[J];伊犁师范学院学报(自然科学版);2007年01期
5 吴岩,李秀坤,刘挺,王开铸;中文自动校对系统的研究与实现[J];哈尔滨工业大学学报;2001年01期
6 戴文华,焦翠珍,徐斌;基于统计的自然语言处理模型[J];咸宁学院学报;2005年03期
7 钱揖丽,郑家恒;中文文本词性自动校对系统的实现[J];电脑开发与应用;2004年01期
8 钱揖丽,郑家恒;汉语语料词性标注自动校对方法的研究[J];中文信息学报;2004年02期
9 李学明;唐相桢;;基于3-gram模型和数据挖掘技术的元数据预取[J];重庆大学学报;2008年06期
10 多杰卓玛;;基于统计的藏文音节联想输入[J];湛江师范学院学报;2008年03期
中国重要会议论文全文数据库 前10条
1 赵军;敖其尔;吉仁尼格;巩政;葡萄;陈建东;;基于统计语言模型蒙古文词汇分析校正器的设计与实现[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
2 倪宏;李昌立;莫福源;;基于词汇的汉语文语转换系统[A];第三届全国人机语音通讯学术会议论文集[C];1994年
3 詹津明;牟晓隆;李树青;方棣棠;;一个大字表语音识别系统中的语言模型[A];第五届全国人机语音通讯学术会议论文集[C];1998年
4 白双成;胡其图;木仁;;蒙古文音节切分算法实现及其应用[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 曲维光;;语料自动校对中一致性问题的处理[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
6 陈韬;李昌立;莫福源;;汉语孤立字全音节实时识别系统[A];第一届全国语言识别学术报告与展示会论文集[C];1990年
7 贾媛;李爱军;;普通话五字组焦点成分音高和时长模式研究[A];第九届全国人机语音通讯学术会议论文集[C];2007年
8 倪晋富;王仁华;;按音节过渡组织词组音库语料[A];第三届全国人机语音通讯学术会议论文集[C];1994年
9 郑家恒;杨晓岩;;英文译名自动识别方法研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
10 袁楚;李爱军;;汉语自然口语中非正常停顿现象初探[A];第九届全国人机语音通讯学术会议论文集[C];2007年
中国重要报纸全文数据库 前7条
1 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年
2 中科院自动化所 陶建华;听话要听音[N];计算机世界;2005年
3 蒋宇;用智慧优化编校软件[N];中国新闻出版报;2006年
4 内蒙古 白者;让Windows帮你发音[N];电子报;2008年
5 清华大学计算机系人机交互与媒体集成研究所 陶建华 蔡莲红;语音合成的应用系统设计[N];计算机世界;2001年
6 左常睿;计算机也认藏文了[N];科技日报;2003年
7 ;迷你型中日语音翻译器跨越中日语言障碍[N];计算机世界;2001年
中国硕士学位论文全文数据库 前10条
1 张虎;汉语语料库词性标注一致性检查及自动校对方法研究[D];山西大学;2005年
2 刘江;大规模汉语语料库分词一致性检验技术研究[D];山西大学;2005年
3 赵军;基于音节统计语言模型蒙古文词汇分析校正器的设计与实现[D];内蒙古大学;2007年
4 伊力亚尔·加尔木哈买提;哈萨克文语料库词汇校对研究[D];新疆大学;2008年
5 杨雅琴;视频字幕识别结果校对方法的研究与实现[D];北京邮电大学;2009年
6 秦健;N-gram技术在中文词法分析中的应用研究[D];中国海洋大学;2009年
7 朱磊;自然语言处理之汉语文本自动校对[D];电子科技大学;2005年
8 毛伟;基于统计语言模型的中文自动文本分类系统[D];北京邮电大学;2006年
9 杨永火;组合向量空间模型和语言模型的信息检索系统[D];天津大学;2006年
10 唐相桢;基于数据挖掘的文件元数据预取研究与实现[D];重庆大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026