收藏本站
《少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集》2010年
收藏 | 手机打开
二维码
手机客户端打开本文

蒙古文词语切分在自动词性标注中的应用

艳红  王斯日古楞  
【摘要】:本文首先介绍了蒙古文附加成分的切分方法,然后描述了改进的蒙古文自动词性标注系统的总体结构,最后以规模为95万词的语料库作为训练语料,对5万词的测试文本进行了一级标注,封闭测试标注准确率和排歧准确率分别为97.9%和85.9%,开放测试标注准确率和排歧准确率分别为97.6%和85.5%。
【作者单位】:内蒙古师范大学计算机与信息工程学院
【分类号】:TP391.1

免费申请
【参考文献】
中国期刊全文数据库 前1条
1 魏欧,吴健,孙玉芳,sonata.iscas.ac.cn;基于统计的汉语词性标注方法的分析与改进[J];软件学报;2000年04期
【共引文献】
中国期刊全文数据库 前10条
1 付国宏,王晓龙;面向真实文本的汉语词法自动分析系统[J];高技术通讯;1999年12期
2 王海峰,李生,赵铁军;BT863-II汉英机器翻译系统中的兼类处理方法[J];高技术通讯;2000年01期
3 魏欧,孙玉芳;基于非监督训练的汉语词性标注的实验与分析[J];计算机研究与发展;2000年04期
4 胡俊华,杨波,李金屏;自然语言理解研究略述[J];济南大学学报(社会科学版);2001年05期
5 高升,王晓龙;语句级汉字输入系统中语义规则研究[J];计算机工程与应用;2003年04期
6 高升,徐志明;统计语言模型中词的自动聚类技术研究[J];计算机工程与应用;2003年11期
7 李国臣,段建勇;基于模糊集的名词细分类研究[J];计算机工程;2004年01期
8 梁以敏,黄德根;基于完全二阶隐马尔可夫模型的汉语词性标注[J];计算机工程;2005年10期
9 张虎,郑家恒,刘江;汉语语料库词性标注自动校对方法研究[J];计算机应用;2005年01期
10 温锐,朱巧明,李培峰;HMM和负反馈模型在词性标注中的应用[J];苏州大学学报(自然科学版);2005年03期
中国重要会议论文全文数据库 前4条
1 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 隋岩;张普;;基于“动态流通语料库”进行“有效字符串”提取的初步研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 张艳;徐波;;基于转换的错误学习方法的汉语词性自动标注研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
4 陈文亮;朱靖波;吕学强;姚天顺;;词性标注规则的获取和优化[A];第一届学生计算语言学研讨会论文集[C];2002年
中国博士学位论文全文数据库 前3条
1 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
2 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
3 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
中国硕士学位论文全文数据库 前10条
1 关宏超;基于统计的开放式汉语自动分词[D];大连理工大学;2002年
2 张丽静;规则与统计相结合的兼类词处理机制[D];大连理工大学;2002年
3 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
4 耿长欣;网络“净化”器的设计与实现[D];山东师范大学;2003年
5 段建勇;现代汉语词性细分类标注研究[D];山西大学;2004年
6 张虎;汉语语料库词性标注一致性检查及自动校对方法研究[D];山西大学;2005年
7 陈耀东;汉语一体化的句法分析模型的研究[D];国防科学技术大学;2004年
8 陈鹏;基于语料库的维吾尔语词干提取和词性标注[D];新疆大学;2006年
9 黄鑫;无指导学习下基于修正词频库的分词方法研究[D];重庆大学;2006年
10 贺胜;面向现代汉语文本处理的全文检索、自动分词通用系统[D];南京师范大学;2006年
【二级参考文献】
中国期刊全文数据库 前5条
1 周强;规则和统计相结合的汉语词类标注方法[J];中文信息学报;1995年03期
2 那顺乌日图;关于面向信息处理的蒙古语语义研究[J];内蒙古大学学报(人文.社会科学版);2002年05期
3 魏欧,吴健,孙玉芳,sonata.iscas.ac.cn;基于统计的汉语词性标注方法的分析与改进[J];软件学报;2000年04期
4 陈文亮,朱靖波,吕学强;词性标注规则的获取和优化[J];术语标准化与信息技术;2004年02期
5 巴达玛敖德斯尔;面向信息处理的蒙古语词语分类体系研究[J];中央民族大学学报(哲学社会科学版);2004年03期
【相似文献】
中国期刊全文数据库 前10条
1 努尔比娅·塔依尔;地里木拉提·吐尔逊;艾斯卡尔·肉孜;;面向韵律层边界自动划分的维吾尔语词性自动标注技术研究[J];计算机应用与软件;2011年08期
2 姜文斌;吴金星;乌日力嘎;那顺乌日图;刘群;;蒙古语有向图形态分析器的判别式词干词缀切分[J];中文信息学报;2011年04期
3 李文;李淼;梁青;朱海;应玉龙;乌达巴拉;;基于短语统计机器翻译模型蒙古文形态切分[J];中文信息学报;2011年04期
4 余传明;黄建秋;郭飞;;从客户评论中识别命名实体——基于最大熵模型的实现[J];现代图书情报技术;2011年05期
5 张继美;;用图书谱写红色旋律——新疆科学技术出版社庆祝建党90周年献礼图书出版纪实[J];新疆新闻出版;2011年04期
6 许德山;张智雄;赵妍;;中文问句与RDF三元组映射方法研究[J];图书情报工作;2011年06期
7 厉小军;戴霖;施寒潇;黄琦;;文本倾向性分析综述[J];浙江大学学报(工学版);2011年07期
8 孙广路;郎非;薛一波;;基于条件随机域和语义类的中文组块分析方法[J];哈尔滨工业大学学报;2011年07期
9 刘莉;何中市;邢欣来;毛小丽;;基于语义角色的中文时间表达式识别[J];计算机应用研究;2011年07期
10 王斯日古楞;斯琴图;那顺乌日图;;汉蒙统计机器翻译中的调序方法研究[J];中文信息学报;2011年04期
中国重要会议论文全文数据库 前10条
1 艳红;王斯日古楞;;蒙古文词语切分在自动词性标注中的应用[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
2 赵大明;;关于《现代汉语规范字典》的词性标注[A];中国辞书论集1999[C];1999年
3 邢富坤;宋柔;;自动词性标注中语法因素和词汇因素对英汉语的不同影响[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 帕里旦·吐尔逊;艾山·吾买尔;吐尔根·依布拉音;早克热·卡德尔;阿力木江·艾沙;;基于最大熵的维吾尔语词性标注模型[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 那顺乌日图;雪艳;淑琴;敖日格乐;;蒙古文人名自动识别研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 通拉嘎;;汉、蒙、藏、维分词与词性标注技术发展现状研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 乌达巴拉;敖其尔;;蒙英翻译片段对的自动抽取[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
8 道布;;回鹘式蒙古文研究概况[A];中国民族古文字研究[C];1980年
9 林红;胡欣;;最大熵模型的应用[A];新世纪气象科技创新与大气科学发展——中国气象学会2003年年会“地球气候和环境系统的探测与研究”分会论文集[C];2003年
10 陈文亮;朱靖波;吕学强;姚天顺;;词性标注规则的获取和优化[A];第一届学生计算语言学研讨会论文集[C];2002年
中国重要报纸全文数据库 前10条
1 记者 李霞 通讯员 王彦军;蒙古文文献数字管理系统填补国内空白[N];内蒙古日报(汉);2009年
2 孟克;如何打破蒙古文图书产销两难的困境[N];中国民族报;2010年
3 记者 吉儒木图;手机可以使用蒙古文了[N];内蒙古日报(汉);2007年
4 姜永禄;邮政用品上的蒙古文[N];中国邮政报;2004年
5 特约记者 王大方;内蒙古文博界“三贴近”有成效[N];中国文物报;2005年
6 阿勒得尔图;嘎日迪:蒙古文信息化处理的先驱[N];中国民族报;2007年
7 尚志亮;中华大藏经蒙古文版出版有望启动[N];中国新闻出版报;2004年
8 记者 戴宏 通讯员 梁玉龙;我区牵手工信部推动蒙古文软件开发应用[N];内蒙古日报(汉);2010年
9 记者 张文强;蒙古文图书农牧民阅读大接力活动启动[N];内蒙古日报(汉);2008年
10 徐恒泰;要全力抓好蒙古文教学资源建设[N];鄂尔多斯日报;2008年
中国博士学位论文全文数据库 前10条
1 王桂荣;蒙古文字结构研究[D];内蒙古大学;2011年
2 额尔敦朝鲁;面向信息处理的蒙古语动词语义研究[D];内蒙古大学;2005年
3 乌兰巴根;《元史》满蒙翻译研究[D];中央民族大学;2009年
4 乌云毕力格;论《苏布喜地》及其对蒙古箴言诗的影响[D];内蒙古大学;2009年
5 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
6 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年
7 图雅;桦树皮律令研究[D];内蒙古大学;2007年
8 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
9 斯琴高娃;17世纪前半叶满蒙关系文书语言研究[D];内蒙古大学;2007年
10 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 钱揖丽;中文文本分词及词性标注自动校对方法研究[D];山西大学;2003年
2 图格木勒;蒙古语语言资源库建设相关技术研究[D];内蒙古大学;2007年
3 刘金宁;词性标注体系对中文分词的影响[D];大连理工大学;2010年
4 刘东旭;在自然汉语中进行分词和词性标注[D];电子科技大学;2003年
5 张虎;汉语语料库词性标注一致性检查及自动校对方法研究[D];山西大学;2005年
6 张磊;基于最大熵模型的汉语词性标注研究[D];大连理工大学;2008年
7 熊冬明;汉语自动分词和中文人名识别技术研究[D];浙江大学;2006年
8 樊立三;现代汉语语文辞书词性标注研究[D];鲁东大学;2006年
9 孔海霞;基于最大熵的汉语词性标注[D];大连理工大学;2007年
10 张卫;中文词性标注的研究与实现[D];南京师范大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026