收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于转换的错误学习方法的汉语词性自动标注研究

张艳  徐波  
【摘要】:词性标注是自然语言处理的基础.本文采用了基于规则与统计相结合的标注方法.首先用基于词性与词相结合的三元统计模型对汉语分词及标注进行一体化处理,完成对语料库的初始标注;然后用Brill的基于转换的学习方法通过转换规则完成最终的词性标注.对大规模真实语料的标注实验表明基于转换的方法与三元统计模型方法相得益彰;高起始点的初始标注对于提高Brill方法的准确性至关重要;Brill的基于转换的方法在高精度的初始标注的基础上又有明显的提高.

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 朱聪慧;赵铁军;郑德权;;基于无向图序列标注模型的中文分词词性标注一体化系统[J];电子与信息学报;2010年03期
2 刘遥峰;王志良;王传经;;中文分词和词性标注模型[J];计算机工程;2010年04期
3 胡军光;刘力;车奇;;基于词性的文本挖掘算法在IDS日志中的应用[J];计算机与数字工程;2010年02期
4 刘洁彬;宋茂强;赵方;杨志宇;;基于上下文的二阶隐马尔可夫模型[J];计算机工程;2010年10期
5 张春祥;梁颖红;于林森;;基于错误驱动的翻译模板自动获取[J];计算机科学;2010年07期
6 谷川;田喜平;;基于条件随机场的汉语词性标注方法研究[J];安阳师范学院学报;2010年05期
7 胡顺义;赵晓凡;;基于PB的汉语电子词典管理系统设计与实现[J];安阳师范学院学报;2010年05期
8 赵红丹;王希杰;;基于隐马尔科夫模型的词性标注[J];安阳师范学院学报;2010年05期
9 阴晋岭;王惠临;;词性标注的方法研究——结合条件随机场和基于转换学习的方法进行词性标注[J];现代图书情报技术;2009年03期
10 张晨;祁坤钰;;基于Penn Treebank英语标注集对《圣经》标注集的扩充研究[J];才智;2009年20期
中国重要会议论文全文数据库 前10条
1 李红印;;词类标注给《现汉》设例带来的新问题[A];中国辞书学会第六届中青年辞书工作者学术研讨会论文集[C];2010年
2 刘娅琼;;论汉语语文辞书词性标注[A];中国辞书学会第六届中青年辞书工作者学术研讨会论文集[C];2010年
3 王东海;王丽英;;古籍数字资料库建设与语文词典编纂的结合[A];中国辞书学会第六届中青年辞书工作者学术研讨会论文集[C];2010年
4 李毅;顾健;顾铁军;;基于朴素贝叶斯方法的邮件样本预筛选[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
5 才让加;头旦才让;周毛先;;藏语语料库加工方法研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
6 吴金星;长青;;蒙古语语料库基本加工规范初探[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
7 姜文斌;吴金星;长青;赵理莉;刘群;那顺乌日图;;蒙古语词法分析的生成式统计建模[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
8 买买提依明·哈斯木;维尼拉·木沙江;;研究维吾尔文Web文档聚类算法设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
9 才藏太;;基于规则的汉藏机器翻译系统中二分法的句法分析方法研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
10 阿布都热依木·热合曼;艾山·吾买尔;吐尔根·依布拉音;帕里旦·吐尔逊;哈里旦木·阿布都克里木;;维吾尔语句法树库标注体系[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
2 蒋昌金;基于关键词提取的中文网页自动文摘方法研究[D];华南理工大学;2010年
3 袁彩霞;中文功能组块分析及应用研究[D];北京邮电大学;2009年
4 王红玲;基于特征向量的中英文语义角色标注研究[D];苏州大学;2009年
5 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
6 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年
7 贺瑞芳;时序多文档文摘相关技术研究[D];哈尔滨工业大学;2009年
8 孙广路;基于统计学习的中文组块分析技术研究[D];哈尔滨工业大学;2008年
9 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
10 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
中国硕士学位论文全文数据库 前10条
1 段倩倩;面向信息处理的带典型前缀派生词的识别分析[D];上海师范大学;2010年
2 胡永华;英文译文质量自动评测技术的研究[D];沈阳航空工业学院;2010年
3 方春平;基于FST技术修正中文词性标注的研究与实现[D];中国地质大学(北京);2010年
4 刘明岩;面向语义关系发现的文本挖掘研究[D];南京理工大学;2010年
5 谢静芝;面向循证医学的多文档自动文摘技术研究[D];大连海事大学;2010年
6 黄波;中文问答系统中答案抽取的研究与实现[D];吉林大学;2010年
7 刘艳娟;《现代汉语词典》研究三十年[D];山东大学;2010年
8 王俊华;基于文本的半监督领域本体构建[D];吉林大学;2010年
9 关键;面向中文文本本体学习概念抽取的研究[D];吉林大学;2010年
10 李泽中;最大熵结合词语聚类的中文词性标注研究[D];大连理工大学;2010年
中国重要报纸全文数据库 前5条
1 孟传良;略谈汉外词典的修订[N];中国图书商报;2005年
2 北京大学中文系 陆俭明;要对广大读者负责[N];中国社会科学院院报;2004年
3 陆俭明;应该启动辞书出版准入制[N];科学时报;2004年
4 记者张璋;中文自然语言资源共享开辟新路[N];科学时报;2003年
5 教育部语言文字信息管理司司长李宇明;语言文字工作应当与时俱进[N];中国教育报;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978