收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于混合策略的汉语未登录词整体识别

于传武  李生  陈鄞  赵铁军  
【摘要】:未登录词的识别一直是汉语分词研究的焦点和难点,本文通过对各类未登录词的用字频率及上下文进行了详细地分析,提出一种基于混合策略的未登录词识别方法。实验表明,该方法对于多种未登录词的整体识别取得了较好的结果。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈丽江;从ACL-SIGHAN国际分词竞赛看已知词和未登录词识别的平衡问题[J];南京师范大学文学院学报;2005年01期
2 尹海良;;基于语料库的现代汉语词缀与派生词自动识别问题初探[J];语言文字应用;2010年01期
3 韩维良;汉语自动分词系统中切分歧义与未登录词的处理策略[J];青海师范大学学报(自然科学版);2004年02期
4 沈达阳,孙茂松,黄昌宁;汉语分词系统中的信息集成和最佳路径搜索方法[J];中文信息学报;1997年02期
5 王淑华;;双字组合理解模式探索[J];上海大学学报(社会科学版);2007年03期
6 李迅;;自动分词与分词规范——关于《信息处理现代汉语分词规范》的重新思考[J];山东文学;2010年01期
7 罗智勇;宋柔;朱小杰;;藏族人名汉译名识别研究[J];情报学报;2009年03期
8 宋作艳;;字族化与汉语未登录词的自动提取[J];北京大学学报(哲学社会科学版);2007年02期
9 毛隽;何炎祥;刘娟;成钢;;一种增强的Good-Turing方法[J];武汉大学学报(理学版);2007年05期
10 揭春雨;正词法和分词规范[J];语文建设;1990年04期
11 沈达阳,孙茂松,黄昌宁;基于统计的汉语分词模型及实现方法[J];中文信息;1998年Z1期
12 进明;有关汉语分词的几点意见[J];语言文字应用;1997年02期
13 孙宏林;浅谈汉语分词的标准[J];语言文字应用;1997年04期
14 傅爱平;汉语信息处理中单字的构词方式与合成词的识别和理解[J];语言文字应用;2003年04期
15 杨成凯;关于汉语分词问题之我见[J];语言文字应用;1997年03期
16 余希田;李丹亚;胡铁军;;汉语自动分词歧义处理研究[J];医学信息学杂志;2007年06期
17 刘源;字词频统计与汉语分词规范[J];语文建设;1992年05期
18 董振东;汉语分词研究漫谈[J];语言文字应用;1997年01期
19 陶家骏;HSK自动化词频统计分析[J];暨南大学华文学院学报;2005年01期
20 徐艳华;;新词语结构分析在自动分词中的作用[J];烟台职业学院学报;2007年04期
中国重要会议论文全文数据库 前10条
1 于传武;李生;陈鄞;赵铁军;;基于混合策略的汉语未登录词整体识别[A];第一届学生计算语言学研讨会论文集[C];2002年
2 何燕;;基于单字词转移概率的未登录词识别[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 陈丽江;;ACL-SIGHAN第一届国际中文分词竞赛评述[A];第二届全国学生计算语言学研讨会论文集[C];2004年
4 曲维光;;解决汉语自动分词的方法选择[A];第一届学生计算语言学研讨会论文集[C];2002年
5 陈鄞;赵铁军;吕雅娟;于浩;;汉英机器翻译中数词的识别和翻译[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
6 徐艳华;;面向自动分词的三音节新词语构词法研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
8 李晶;陈鄞;杨沐昀;徐冰;;关于在分词系统中引入领域词典的研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 钱揖丽;张虎;;汉语分词及词性标注自动校验方法研究[A];第一届学生计算语言学研讨会论文集[C];2002年
10 傅思泉;;机器词典中按韵分词及虚词问题[A];江西省语言学会第五届会员大会暨2002年学术年会论文集[C];2002年
中国博士学位论文全文数据库 前3条
1 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
2 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
3 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前10条
1 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
2 季娜;未登录词的语法功能猜测[D];南京师范大学;2008年
3 普布旦增;藏文自动分词技术方法研究[D];西藏大学;2010年
4 乌仁曹都;汉蒙电子词典开发平台的设计与实现[D];内蒙古大学;2008年
5 潘景景;韩国和欧美学习者汉字识别中的加工策略研究[D];北京语言大学;2007年
6 牟小峰;面向英汉机器翻译的树库建设[D];北京语言大学;2007年
7 索南扎西;藏语语音合成关键技术研究[D];西藏大学;2011年
8 杨哲萍;网络聊天机器人在少数民族汉语教学中的关键技术研究[D];中央民族大学;2012年
9 骆彬;汉语新词语辅助识别系统的研制[D];中国社会科学院研究生院;2003年
10 吴金星;蒙古语词法标注语料库的构建及相关技术研究[D];内蒙古大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978