基于NFA的蒙古语词法分析算法研究
【摘要】:蒙古语是黏着性语言,其构词和构形是通过词根、词干上连接不同的词缀来实现的,从理论上讲蒙古语词汇是无限的,因此词典中不可能包罗所有的单词和其诸多的形态变化。研制一套独立、高效的词法分析软件来识别和生成词语以及其形态变化是非常有必要的。我们在本文中介绍了一种蒙古语词法分析器,该分析器采用了基于有限状态自动机的分析算法解决了未登录词识别、非词检查、复合词识别等问题,并大大提高了分析速度,在现代蒙古语句法分析软件中试用后发现与单纯的基于词典或规则的算法相比在速度上提高了将近两个数量级。
|
|
|
|
1 |
斯·劳格劳;华沙宝;萨如拉;;基于NFA的蒙古语词法分析算法研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年 |
2 |
山丹;;蒙古语标准音水平测试系统设计构思[A];第九届中国语音学学术会议论文集[C];2010年 |
3 |
胡阿旭;格根塔娜;吕士良;于洪志;;肃北蒙古语复元音研究[A];第九届中国语音学学术会议论文集[C];2010年 |
4 |
呼和;;蒙古语实验语音学发展历程及最新成果介绍[A];中国民族语言学会第10届学术讨论会摘要集[C];2010年 |
5 |
姜文斌;吴金星;长青;赵理莉;刘群;那顺乌日图;;蒙古语词法分析的生成式统计建模[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年 |
6 |
通拉嘎;赵小兵;;论蒙古语词素切分的实现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年 |
7 |
图雅;;蒙古语土尔扈特土语元音的固有特性[A];第九届中国语音学学术会议论文集[C];2010年 |
8 |
敖敏;;蒙古语肃北土语单词韵律模式初探[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年 |
9 |
胡阿旭;吕士良;格根塔娜;于洪志;;蒙古语松紧元音言语空气动力学[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年 |
10 |
胡阿旭;吕士良;格根塔娜;于洪志;;蒙古语松紧元音言语空气动力学研究[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年 |
|