收藏本站
《中国计算语言学研究前沿进展(2009-2011)》2011年
收藏 | 手机打开
二维码
手机客户端打开本文

哈萨克语通用词汇自动提取方法研究与实现

王雅莉  古丽拉·阿东别克  
【摘要】:以哈萨克语通用词汇自动提取为目标,实现了哈萨克语词汇通用度统计系统。主要介绍了哈萨克语通用词汇自动提取技术,基于通用词汇的三大特征:领域通用性、地域通用性、时间通用性,采用统计的方法考察哈萨克语词汇的通用程度,在哈萨克语词频统计的基础上实现了哈萨克语词汇的通用度统计,根据词语通用度OK值提取哈萨克语通用词汇。实验结果表明此方法可行有效。

手机知网App
【参考文献】
中国期刊全文数据库 前2条
1 嘎日迪,赵小兵,马红旭,赛音,白小玲;蒙古文自动处理系统研究[J];中文信息学报;1999年04期
2 王灿辉;张敏;马少平;;自然语言处理在信息检索中的应用综述[J];中文信息学报;2007年02期
中国博士学位论文全文数据库 前2条
1 赵小兵;基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究[D];北京语言大学;2007年
2 韩秀娟;基于动态流通语料库的通用词语用字研究及字词语关系考察[D];北京语言大学;2007年
【共引文献】
中国重要会议论文全文数据库 前3条
1 丁凡;王斌;白硕;刘宜轩;李亚楠;;文本检索中句法信息的有效利用研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 那斯尔江·吐尔逊;吾守尔·斯拉木;麦麦提艾力;;维吾尔语大词汇量连续语音识别研究——语音语料库的建立[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
3 陈志峰;朱巧明;;面向课程教学的中文问答系统研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前2条
1 杨震;文本分类和聚类中若干问题的研究[D];北京邮电大学;2007年
2 王树梅;信息检索相关技术研究[D];南京理工大学;2007年
中国硕士学位论文全文数据库 前1条
1 阿力木江·托乎提(Alimjan Tohti);维吾尔语语音和谐规律处理及其软件设计[D];中央民族大学;2007年
【二级参考文献】
中国期刊全文数据库 前10条
1 徐国庆;再论现代汉语词汇层[J];北方论丛;1998年06期
2 杨彩梅,陈利文;英语基本词汇的掌握及阅读自动化[J];重庆大学学报(社会科学版);2000年03期
3 詹卫东;80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J];当代语言学;2000年02期
4 张能甫;汉语基本词汇研究的回顾与展望[J];达县师范高等专科学校学报;1998年01期
5 安华林;现代汉语释义基元词探索[J];甘肃高师学报;2004年06期
6 张锋,樊孝忠,许云;基于遗传算法的文本聚类特征选择[J];华南理工大学学报(自然科学版);2004年S1期
7 郭艳华,周昌乐;自然语言理解研究综述[J];杭州电子工业学院学报;2000年01期
8 申小龙;汉字的特点及其归宿[J];汉语学习;1987年01期
9 连远锋,侯锟,张沛露,许建潮;演化计算在特征词条优化中的应用[J];长春工业大学学报(自然科学版);2004年01期
10 杨新武,刘椿年,张俊卿;基于遗传算法的一阶规则获取[J];计算机工程与应用;2002年17期
中国博士学位论文全文数据库 前6条
1 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
2 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
3 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
4 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
5 史艳岚;基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究[D];北京语言大学;2006年
6 韩秀娟;基于动态流通语料库的通用词语用字研究及字词语关系考察[D];北京语言大学;2007年
中国硕士学位论文全文数据库 前3条
1 刘潭仁;基于粗糙集和遗传算法的空间数据挖掘技术研究[D];重庆大学;2004年
2 史中琦;基于DCC动态流通报纸语料库的流通度词表和使用度词表的对比分析[D];北京语言大学;2005年
3 江务学;改进的遗传算法及其在多目标优化中的应用研究[D];天津工业大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 王欣;陈海;;维哈柯文信息处理系统检测技术研究[J];信息技术与标准化;2011年06期
2 扎西加;高定国;;藏语语料库TEI标记规范探讨[J];中文信息学报;2011年04期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 王雅莉;古丽拉·阿东别克;;哈萨克语通用词汇自动提取方法研究与实现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 王花;古丽拉·阿东别克;;基于语料的哈萨克语词频统计的研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
3 王晓莉;古丽拉·阿东别克;;哈萨克语语句情感识别研究初探[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
4 江阿古丽·哈依达尔;吐尔根·依布拉音;艾山·吾买尔;早克热·卡德尔;加米拉·吾买尔;;哈萨克语名词构形词缀有限状态自动机的构造[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 尹斌庸;方世增;;词频统计的新概念和新方法[A];语言文字应用研究论文集(Ⅰ)[C];1995年
6 尹斌庸;方世增;;词频统计的新概念和新方法[A];语言文字应用研究论文集(Ⅱ)[C];2004年
7 古丽拉.阿东别克;达吾勒.阿布都哈依尔;;基于规则的哈萨克语词干提取系统的研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
8 陈宗振;;古代突厥文献中的bεrk及其演变[A];中国民族古文字研究(第三辑)[C];1991年
9 玛依来·哈帕尔;古丽拉·阿东别克;;基于K-最近距离方法的哈萨克语报纸分类初探[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
10 伊力亚尔.加尔木哈买提;古丽拉.阿东别克;;中国哈萨克阿拉伯文与哈萨克斯拉夫文文本转换[A];第三届学生计算语言学研讨会论文集[C];2006年
中国重要报纸全文数据库 前10条
1 记者方云静;维哈柯语键盘输入法推出[N];新疆日报(汉);2010年
2 记者 王瑟;国家在新疆建立哈萨克和柯尔克孜语研究基地[N];光明日报;2010年
3 记者张灵;中国哈萨克语广播网下月一日开通[N];伊犁日报(汉);2010年
4 通讯员 宋建峰;两万牧民群众受教育[N];昌吉日报;2007年
5 本报驻莫斯科记者  韩显阳;小字母折射大政治[N];光明日报;2006年
6 记者 张亮;好学奋进的阿依努尔[N];伊犁日报(汉);2006年
7 阿丹;多姿多彩的哈萨克族文化[N];伊犁日报(汉);2006年
8 杨杰;我区实施高层次“双语”人才特培计划[N];新疆日报(汉);2007年
9 本报记者 王瑟 通讯员 崔志坚;“哪怕只有一名学生,我们也不放弃”[N];光明日报;2010年
10 记者 郝静;欢快的舞蹈跳起来[N];阿勒泰日报;2008年
中国博士学位论文全文数据库 前3条
1 杨洪建;哈萨克族学生汉语否定结构习得研究[D];新疆大学;2007年
2 邬美丽;在京少数民族大学生语言使用及语言态度调查[D];中央民族大学;2007年
3 陈文祥;新疆东乡族文化变迁研究[D];兰州大学;2008年
中国硕士学位论文全文数据库 前10条
1 王雅莉;哈萨克语通用词汇提取方法及小学语文教材用词调查研究[D];新疆大学;2012年
2 王花;基于语料库的哈萨克文统计研究[D];新疆大学;2010年
3 阿依努尔·木拉提;新疆电视台哈萨克语自办栏目研究[D];新疆大学;2010年
4 叶丽夏提·波拉提;新疆地州级电视台哈萨克语频道自办栏目研究[D];新疆大学;2011年
5 江阿古丽·哈依达尔;哈萨克语句子相似度计算方法的研究[D];新疆大学;2012年
6 古丽海夏;哈萨克语俄语借词的语音及拼写规则研究[D];中央民族大学;2010年
7 冯鲸华;基于N-gram模型的哈萨克语实体名识别方法研究[D];新疆大学;2010年
8 赛迪努尔·毛兰;哈萨克文版《新疆日报》词汇特点研究—1950-1965年[D];中央民族大学;2012年
9 仲崇峰;哈萨克语中的汉语借词研究[D];中央民族大学;2009年
10 杨洪建;汉语形容词重叠结构在哈萨克语中的对应表达及其教学[D];新疆大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026