收藏本站
《第五届全国青年计算语言学研讨会论文集》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

汉、蒙、藏、维分词与词性标注技术发展现状研究

通拉嘎  
【摘要】:中文信息处理用各种统计方法实现精度的提高,而规则的运用更多是在歧义和未登录词的研究上。蒙古语的统计方法发轫于近几年,但更多的是一种理念的进步,仍是以词干加附加成分的规则方法为主,现有AYIMAG和DARHAN切分和词性标注系统。藏文较多运用规则加统计的方法,也有直接运用viterbi算法进行分词的成果,其基于规则的方法是用格助词和词典库进行分词;现有北大计算语言学研究所和国家语言资源监测与研究中心少数民族语言分中心的藏文自动分词系统,不过还未见藏文词性标注系统的实现成果。维吾尔语有基于隐马尔科夫模型的viterbi算法与基于n-gram模型的尝试,其规则方法仍是词干加附加成分的切分理念,现还未见可用的切分与标注系统。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘遥峰;王志良;王传经;;中文分词和词性标注模型[J];计算机工程;2010年04期
2 袁里驰,钟义信;一种新颖的词性标注模型[J];微电子学与计算机;2005年09期
3 侯呈风;古丽拉·阿东别克;;改进的HMM应用于哈萨克语词性标注[J];计算机工程与应用;2010年36期
4 朱靖波,张玫杰,姚天顺;一种基于NA假设的训练数据自动构造方法[J];东北大学学报(自然科学版);1999年04期
5 韩东妹;林民;;自动词性标注概述[J];内蒙古科技与经济;2006年01期
6 潘炜;沈超;;面向层次分类标签的词性标注系统[J];计算机工程;2009年21期
7 孙静;李军辉;周国栋;;基于条件随机场的无监督中文词性标注[J];计算机应用与软件;2011年04期
8 吴杨;;词性标注对外文信息检索系统性能的影响[J];民营科技;2011年05期
9 孔骏,陈玉泉,陆汝占;自学习结合部分句法分析的汉语词性标注[J];上海交通大学学报;2001年09期
10 姚天昉,林莉,玉素甫·艾白都拉;基于德语语料库词性标注和统计方法的研究[J];上海交通大学学报;1996年06期
11 牛洪梅;加米拉·吾守尔;吐尔根·依布拉音;;现代维吾尔语的词性标注校对技术研究[J];伊犁师范学院学报(自然科学版);2007年01期
12 谷川;田喜平;;基于条件随机场的汉语词性标注方法研究[J];安阳师范学院学报;2010年05期
13 付国宏,王晓龙,姜守旭;一种启发式的汉语词性标注算法[J];计算机工程与设计;2000年05期
14 赵法兴;赵伟;;平滑的最大熵模型在汉语词性自动标注中的应用[J];长春工业大学学报(自然科学版);2007年02期
15 佟晓筠;宋国龙;刘强;张俐;姜伟;;中文分词及词性标注一体化模型研究[J];计算机科学;2007年09期
16 王永景;刘功申;李生红;荆涛;;用于文本校对的分词与词性标注一体化算法[J];计算机技术与发展;2008年08期
17 方春平;管建和;;FST在中文词性标注技术中的应用[J];科技信息(学术研究);2008年36期
18 阴晋岭;王惠临;;词性标注的方法研究——结合条件随机场和基于转换学习的方法进行词性标注[J];现代图书情报技术;2009年03期
19 尹木;肖铮;;词性标注与动词细分类研究[J];电脑知识与技术;2009年24期
20 刘洁彬;宋茂强;赵方;杨志宇;;基于上下文的二阶隐马尔可夫模型[J];计算机工程;2010年10期
中国重要会议论文全文数据库 前10条
1 通拉嘎;;汉、蒙、藏、维分词与词性标注技术发展现状研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 杨尔弘;方莹;乔羽;;汉语自动分词和词性标注评测[A];第二届全国学生计算语言学研讨会论文集[C];2004年
3 帕里旦·吐尔逊;艾山·吾买尔;吐尔根·依布拉音;早克热·卡德尔;阿力木江·艾沙;;基于最大熵的维吾尔语词性标注模型[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
4 艳红;王斯日古楞;;蒙古文词语切分在自动词性标注中的应用[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 朱莉;孟遥;赵铁军;;典型参数平滑算法在词性标注中的性能评价[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 徐润华;陈小荷;;一种利用注疏的《左传》分词新方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 刘力;皮德常;;基于词性的文本挖掘算法在IDS日志中的应用[A];2009年中国智能自动化会议论文集(第三分册)[C];2009年
8 李怡平;吴飞;;多语言环境下的分布式互联网分词平台[A];第十六届全国数据库学术会议论文集[C];1999年
9 赵伟;路永刚;吴琼;;一种新的基于BMM和RMM分词方法的研究与实现[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
10 张艳;徐波;;基于转换的错误学习方法的汉语词性自动标注研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
中国重要报纸全文数据库 前10条
1 陆元婕;聪明的搜索引擎[N];中国计算机报;2001年
2 本报记者 侯闯;让企业不再“眼花”[N];计算机世界;2003年
3 ;大恒FTR全文检索软硬件解决方案[N];计算机世界;2001年
4 朱艳;术语解释[N];中国电脑教育报;2000年
5 郑昊;数据挖掘加工海量数据[N];中国计算机报;2007年
6 郑依华;搜索引擎也开源[N];计算机世界;2006年
7 清华大学计算机系人机交互与媒体集成研究所 陶建华 蔡莲红;语音合成的应用系统设计[N];计算机世界;2001年
8 杨宝昌;让MySQL支持中文全文检索[N];计算机世界;2006年
9 ;特殊符号在搜索引擎中的妙用[N];电脑报;2004年
10 晓梦;“面对面”的智能电子词典[N];计算机世界;2004年
中国博士学位论文全文数据库 前10条
1 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
2 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
3 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年
4 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
5 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
6 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
7 蒋昌金;基于关键词提取的中文网页自动文摘方法研究[D];华南理工大学;2010年
8 侯锋;中文报业出版的文字质量智能辅助控制技术研究[D];国防科学技术大学;2010年
9 李晓黎;WEB信息检索与分类中的数据采掘研究[D];中国科学院研究生院(计算技术研究所);2001年
10 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
中国硕士学位论文全文数据库 前10条
1 钱揖丽;中文文本分词及词性标注自动校对方法研究[D];山西大学;2003年
2 刘东旭;在自然汉语中进行分词和词性标注[D];电子科技大学;2003年
3 刘金宁;词性标注体系对中文分词的影响[D];大连理工大学;2010年
4 俞鸿魁;基于层次隐马尔可夫模型的汉语词法分析和命名实体识别技术[D];北京化工大学;2004年
5 张虎;汉语语料库词性标注一致性检查及自动校对方法研究[D];山西大学;2005年
6 孙静;基于平行语料库的无监督中文词性标注研究[D];苏州大学;2010年
7 张丽静;规则与统计相结合的兼类词处理机制[D];大连理工大学;2002年
8 张磊;基于最大熵模型的汉语词性标注研究[D];大连理工大学;2008年
9 李泽中;最大熵结合词语聚类的中文词性标注研究[D];大连理工大学;2010年
10 熊冬明;汉语自动分词和中文人名识别技术研究[D];浙江大学;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978