收藏本站
《中国计算语言学研究前沿进展(2009-2011)》2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于规则与统计的维吾尔族人名识别研究

赛依旦·阿不力米提  吐尔根·依布拉音  
【摘要】:本文提出了一种基于规则与统计相结合的维吾尔族人名识别算法。我们从语料中提取人名左右边界词语,人名边界频度作为特征。识别过程是首先利用维吾尔族人名的后缀特点进行基于词典查找,然后应用带有频度的边界模型识别出可能的人名,并用几条排除规则对识别结果进行边界校正。系统采用真实语料进行测试的结果表明,正确率为88%,召回率为90%。

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 李中国;刘颖;;边界模板和局部统计相结合的中国人名识别[J];中文信息学报;2006年05期
2 黄德根,杨元生,王省,张艳丽,钟万勰;基于统计方法的中文姓名识别[J];中文信息学报;2001年02期
3 季姮,罗振声;基于统计和规则的中文姓名自动辨识[J];语言文字应用;2001年01期
【共引文献】
中国期刊全文数据库 前10条
1 黄德根,马玉霞,杨元生;基于互信息的中文姓名识别方法[J];大连理工大学学报;2004年05期
2 张长利,赫枫龄,左万利;一种基于后缀数组的无词典分词方法[J];吉林大学学报(理学版);2004年04期
3 余祖波;高庆狮;方淼;;中文姓名自动识别系统的设计与实现[J];计算机工程与应用;2006年10期
4 王源媛;何中市;;基于词性探测的中文姓名识别算法[J];计算机科学;2005年04期
5 张永奎,赵辄谦,白丽君,陈鑫卿;基于互联网的中文问答系统[J];计算机工程;2003年15期
6 向晓雯,史晓东,曾华琳;一个统计与规则相结合的中文命名实体识别系统[J];计算机应用;2005年10期
7 邓宏涛;中文自动分词系统的设计模型[J];计算机与数字工程;2005年04期
8 张子荣,初敏;解决多音字字-音转换的一种统计学习方法[J];中文信息学报;2002年03期
9 黄德根,岳广玲,杨元生;基于统计的中文地名识别[J];中文信息学报;2003年02期
10 李丽双;黄德根;陈春荣;杨元生;;SVM与规则相结合的中文地名自动识别[J];中文信息学报;2006年05期
中国重要会议论文全文数据库 前10条
1 向晓雯;史晓东;曾华琳;;一个统计与规则相结合的中文命名实体识别系统[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 张艳丽;黄德根;张丽静;杨元生;;统计和规则相结合的中文机构名称识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 刘俊;张益肇;;基于统计的中文姓名提取方法[A];第六届全国人机语音通讯学术会议论文集[C];2001年
4 Jimin Liu, Jing Xiao and Tat-Seng Chua School of Computing, National University of Singapore;Finding Names in Chinese Text using a Hybrid Rule Induction Model[A];第一届学生计算语言学研讨会论文集[C];2002年
5 那顺乌日图;雪艳;淑琴;敖日格乐;;蒙古文人名自动识别研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 董宇;;称谓语与人名自动识别[A];第二届全国学生计算语言学研讨会论文集[C];2004年
7 朱江涛;赵丽奎;蔡东风;;基于最大熵模型的中文姓名识别方法初探[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 廖先桃;于海滨;秦兵;刘挺;;HMM与自动规则提取相结合的中文命名实体识别[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 朱丽丽;郑家恒;;一种基于实例学习的人名识别方法[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
10 董静;孙乐;吕元华;冯元勇;;基于线性链条件随机场模型的语义角色标注[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国博士学位论文全文数据库 前9条
1 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
2 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
3 姜吉发;自由文本的信息抽取模式获取的研究[D];中国科学院研究生院(计算技术研究所);2004年
4 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
5 刘柏嵩;基于Web的通用本体学习研究[D];浙江大学;2007年
6 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
7 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
8 周顺先;文本信息抽取模型及算法研究[D];湖南大学;2007年
9 杨志豪;面向生物医学领域的文本挖掘技术研究[D];大连理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 葛强;亲属关系逻辑推理专家系统的研究[D];河南大学;2005年
2 胡业江;中文姓名自动识别技术研究[D];华侨大学;2005年
3 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
4 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
5 张艳丽;中文机构名称的自动识别[D];大连理工大学;2003年
6 许林杰;中文文本分词研究[D];山东师范大学;2003年
7 赵辄谦;基于互联网的中文问答系统研究[D];山西大学;2003年
8 王源媛;中文未登录名词短语的识别方法研究[D];重庆大学;2004年
9 肖敏;试论藏缅语族的父子连名制[D];四川大学;2004年
10 孟利青;基于DSP的中文电子阅读系统的研究[D];辽宁工程技术大学;2005年
【二级参考文献】
中国期刊全文数据库 前10条
1 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
2 付国宏,王晓龙;汉语词语边界自动划分的模型与算法[J];计算机研究与发展;1999年09期
3 吴胜远;一种汉语分词方法[J];计算机研究与发展;1996年04期
4 张锋,樊孝忠,许云;基于统计的中文姓名识别方法研究[J];计算机工程与应用;2004年10期
5 靳从,唐振民,杨静宇;自动标引中中文姓名的切分[J];计算机工程;2003年22期
6 张华平,刘群;基于角色标注的中国人名自动识别研究[J];计算机学报;2004年01期
7 郑家恒,李鑫,谭红叶;基于语料库的中文姓名识别方法研究[J];中文信息学报;2000年01期
8 刘秉伟,黄萱菁,郭以昆,吴立德;基于统计方法的中文姓名识别[J];中文信息学报;2000年03期
9 赵铁军,吕雅娟,于浩,杨沐昀,刘芳;提高汉语自动分词精度的多步处理策略[J];中文信息学报;2001年01期
10 吕雅娟,赵铁军,杨沐昀,于浩,李生;基于分解与动态规划策略的汉语未登录词识别[J];中文信息学报;2001年01期
【相似文献】
中国期刊全文数据库 前10条
1 杨来复!830002;新闻报道应重视少数民族译名的准确性[J];当代传播;1999年06期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前2条
1 赛依旦·阿不力米提;吐尔根·依布拉音;;基于规则与统计的维吾尔族人名识别研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 方颐;;传记型人名辞典的读者需求与总体设计[A];中国辞书学会第六届中青年辞书工作者学术研讨会论文集[C];2010年
中国硕士学位论文全文数据库 前1条
1 汪岩武;汉维姓氏文化对比[D];新疆师范大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026