基于混合策略的维吾尔语名词词干提取系统
【摘要】:本文对维吾尔语名词形态结构进行研究,并构造了名词有限状态自动机(FSM),然后针对自动机的缺陷使用最大熵模型给有限状态自动机加入了歧义词缀识别能力,最后根据维吾尔语的元音和谐特点,建立了基于规则和信道噪声模型的元音和谐处理方法。本文,有机结合以上三种方法构造出了基于规则和统计的名词词干提取方法。为了有效利用现有的资源,提高系统的性能,把基于词典的词干提取方法与规则和统计相结合的名词词干提取方法的结合,从而开发出多种策略相结合的维吾尔语名词词干提取系统,该系统具有较强的鲁棒性,准确率保持95%以上。
|
|
|
|
1 |
早克热·卡德尔;艾山·吾买尔;吐尔根·依布拉音;帕里旦·吐尔逊;买热哈巴·艾力;;基于混合策略的维吾尔语名词词干提取系统[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年 |
2 |
阿依克孜.卡德尔;开沙尔.卡德尔;吐尔根.依布拉音;;面向自然语言信息处理的维吾尔语名词形态分析研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年 |
3 |
阿里甫·库尔班;吾买尔江·库尔班;尼加提·阿不都肉苏力;;维吾尔语框架语义网的数据库结构的设计[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年 |
4 |
艾斯卡尔·艾木都拉;;维吾尔语鼻音的声学特征分析[A];第九届中国语音学学术会议论文集[C];2010年 |
5 |
梁洁;杨新璐;;维吾尔语韵律层级边界感知及其声学特征研究[A];第九届中国语音学学术会议论文集[C];2010年 |
6 |
热依曼·吐尔逊;依皮提哈尔·买买提;;维吾尔语语音语料库管理系统的设计[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年 |
7 |
依皮提哈尔·买买提;吾守尔·斯拉木;;维吾尔语语音合成语音语料库的设计与标注[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年 |
8 |
古力米热·依玛木;艾斯卡尔·艾木都拉;;维吾尔语句韵律层级的人工标注规则研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年 |
9 |
陈曦;;汉字的形、音、义对色词干扰效应的影响[A];第九届全国心理学学术会议文摘选集[C];2001年 |
10 |
杨雅婷;马博;王磊;吐尔洪·吾司曼;李晓;;维吾尔语语音识别中发音变异现象[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年 |
|