收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于最大熵的维吾尔语词性标注模型

帕里旦·吐尔逊  艾山·吾买尔  吐尔根·依布拉音  早克热·卡德尔  阿力木江·艾沙  
【摘要】:最大熵模型能够充分利用多个任意的特征。本文中提出基于最大熵模型的维吾尔语词性标注方法。本文中主要的工作是选出对兼类词和未登录词词性标注有较大贡献的特征。作为黏着语言,维吾尔语单词为表达语法功能而附加词缀。本文中,除了前后单词的词性和词形之外,把前后单词的最后词缀作为特征使用。实验结果表明,前后单词的最后词缀对兼类词和未登录词的词性标注有着明显的提高,模型准确率到达96.58%。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵法兴;赵伟;;平滑的最大熵模型在汉语词性自动标注中的应用[J];长春工业大学学报(自然科学版);2007年02期
2 尹木;肖铮;;词性标注与动词细分类研究[J];电脑知识与技术;2009年24期
3 王保芳;张瑞强;;关于对数线性模型在词性标注中的应用[J];计算机科学;2008年05期
4 赵岩;王晓龙;刘秉权;关毅;;融合聚类触发对特征的最大熵词性标注模型[J];计算机研究与发展;2006年02期
5 洪铭材;张阔;唐杰;李涓子;;基于条件随机场(CRFs)的中文词性标注方法[J];计算机科学;2006年10期
6 侯呈风;古丽拉·阿东别克;;改进的HMM应用于哈萨克语词性标注[J];计算机工程与应用;2010年36期
7 朱靖波,张玫杰,姚天顺;一种基于NA假设的训练数据自动构造方法[J];东北大学学报(自然科学版);1999年04期
8 韩东妹;林民;;自动词性标注概述[J];内蒙古科技与经济;2006年01期
9 刘遥峰;王志良;王传经;;中文分词和词性标注模型[J];计算机工程;2010年04期
10 孙静;李军辉;周国栋;;基于条件随机场的无监督中文词性标注[J];计算机应用与软件;2011年04期
11 吴杨;;词性标注对外文信息检索系统性能的影响[J];民营科技;2011年05期
12 屈刚,陆汝占;基于特征的汉语词性标注模型[J];计算机研究与发展;2003年04期
13 姚天昉,林莉,玉素甫·艾白都拉;基于德语语料库词性标注和统计方法的研究[J];上海交通大学学报;1996年06期
14 牛洪梅;加米拉·吾守尔;吐尔根·依布拉音;;现代维吾尔语的词性标注校对技术研究[J];伊犁师范学院学报(自然科学版);2007年01期
15 谷川;田喜平;;基于条件随机场的汉语词性标注方法研究[J];安阳师范学院学报;2010年05期
16 付国宏,王晓龙,姜守旭;一种启发式的汉语词性标注算法[J];计算机工程与设计;2000年05期
17 袁里驰,钟义信;一种新颖的词性标注模型[J];微电子学与计算机;2005年09期
18 佟晓筠;宋国龙;刘强;张俐;姜伟;;中文分词及词性标注一体化模型研究[J];计算机科学;2007年09期
19 王永景;刘功申;李生红;荆涛;;用于文本校对的分词与词性标注一体化算法[J];计算机技术与发展;2008年08期
20 方春平;管建和;;FST在中文词性标注技术中的应用[J];科技信息(学术研究);2008年36期
中国重要会议论文全文数据库 前10条
1 帕里旦·吐尔逊;艾山·吾买尔;吐尔根·依布拉音;早克热·卡德尔;阿力木江·艾沙;;基于最大熵的维吾尔语词性标注模型[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
2 通拉嘎;;汉、蒙、藏、维分词与词性标注技术发展现状研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 艳红;王斯日古楞;;蒙古文词语切分在自动词性标注中的应用[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
4 朱莉;孟遥;赵铁军;;典型参数平滑算法在词性标注中的性能评价[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 杨尔弘;方莹;乔羽;;汉语自动分词和词性标注评测[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 张艳;徐波;;基于转换的错误学习方法的汉语词性自动标注研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
7 苏祺;昝红英;胡景贺;项锟;;词性标注对信息检索系统性能的影响[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
8 石民;陈小荷;于丽丽;李斌;;基于CRF的古汉语分词标注一体化研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 邢富坤;宋柔;罗智勇;;SSD模型及其在词性标注中的应用[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
10 刘力;皮德常;;基于词性的文本挖掘算法在IDS日志中的应用[A];2009年中国智能自动化会议论文集(第三分册)[C];2009年
中国博士学位论文全文数据库 前10条
1 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年
2 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
3 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
4 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
5 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
6 周雅倩;最大熵方法及其在自然语言处理中的应用[D];复旦大学;2005年
7 李晓黎;WEB信息检索与分类中的数据采掘研究[D];中国科学院研究生院(计算技术研究所);2001年
8 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
9 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
10 袁彩霞;中文功能组块分析及应用研究[D];北京邮电大学;2009年
中国硕士学位论文全文数据库 前10条
1 钱揖丽;中文文本分词及词性标注自动校对方法研究[D];山西大学;2003年
2 刘金宁;词性标注体系对中文分词的影响[D];大连理工大学;2010年
3 刘东旭;在自然汉语中进行分词和词性标注[D];电子科技大学;2003年
4 张虎;汉语语料库词性标注一致性检查及自动校对方法研究[D];山西大学;2005年
5 张一哲;汉语词类划分与词性标注方法的研究[D];南京师范大学;2011年
6 张磊;基于最大熵模型的汉语词性标注研究[D];大连理工大学;2008年
7 李泽中;最大熵结合词语聚类的中文词性标注研究[D];大连理工大学;2010年
8 熊冬明;汉语自动分词和中文人名识别技术研究[D];浙江大学;2006年
9 孔海霞;基于最大熵的汉语词性标注[D];大连理工大学;2007年
10 张卫;中文词性标注的研究与实现[D];南京师范大学;2007年
中国重要报纸全文数据库 前10条
1 方忠诚;OCR技术及其应用[N];北京电子报;2000年
2 陈丽梅;一指“走”天下[N];光明日报;2000年
3 吴思、杨春、王雁凌;掀起多媒体检索革命[N];中国计算机报;2002年
4 北京数码空间信息技术有限公司技术总监 刘斌;Web Mining:第二代网络信息处理技术[N];计算机世界;2000年
5 中科院计算所-银晨网讯面像识别联合实验室 山世光 高文 曾文斌;面像识别看像认人[N];计算机世界;2001年
6 武德锋 李国辉 林洪文 姚作梁;图像 “堆”里寻知识[N];计算机世界;2002年
7 武德锋 李国辉 林洪文 姚作梁;图像世界任我行[N];计算机世界;2002年
8 中科院自动化所 何鹏 陶建华 谭铁牛;看懂人的“脸色”[N];计算机世界;2005年
9 成成;指纹识别 正走入我们的生活[N];山西科技报;2000年
10 孙哲南 谭铁牛;生物识别的十大关键技术[N];计算机世界;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978