收藏本站
《第三届学生计算语言学研讨会论文集》2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于标注语料库的组合歧义检测与消解

孙承杰  黄昌宁  关毅  
【摘要】:本文调查了不同的汉语分词标注语料库中的组合歧义的分布情况。基于调查结果,提出了一种利用一个大规模高质量的标注语料库中的知识来进行组合歧义的检测与消解的新方法。实验表明,我们的方法可以比基于实例的方法覆盖更多的组合歧义情况,在SIGHAN bakeoff2微软亚洲研究院的测试集上,组合歧义消解的F-measure为70.9%。

手机知网App
【参考文献】
中国期刊全文数据库 前2条
1 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
2 梁南元;书面汉语自动分词系统—CDWS[J];中文信息学报;1987年02期
中国重要会议论文全文数据库 前1条
1 曲维光;董宇;陈钟;陈小荷;;基于语境计算模型的词义消歧[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
【共引文献】
中国期刊全文数据库 前10条
1 胡锡衡;;正向最大匹配法在中文分词技术中的应用[J];鞍山师范学院学报;2008年02期
2 马志强;周长胜;丁维;杨娜;;校园网搜索引擎的研究与实现[J];北京机械工业学院学报;2007年01期
3 李国和;刘光胜;吴卫江;孙红军;唐先明;韩宝东;;基于最大匹配和歧义检测的中文分词粗分方法[J];北京信息科技大学学报(自然科学版);2010年S2期
4 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
5 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
6 张利;张立勇;张晓淼;耿铁锁;岳宗阁;;基于改进BP网络的中文歧义字段分词方法研究[J];大连理工大学学报;2007年01期
7 梁晓弘;杨文安;;分词技术在信息处理中的研究综述[J];电脑知识与技术(学术交流);2007年22期
8 刘韬;;设立切分标志法在中文地址自动分词中的改进与应用[J];电脑知识与技术;2009年11期
9 王慧慧;;划分“11段”的思想在文本处理方面的研究[J];电脑知识与技术;2009年30期
10 蔡勇智;基于最大匹配分词算法的中文词语粗分模型[J];福建电脑;2005年09期
中国重要会议论文全文数据库 前10条
1 王慧慧;杨国纬;;基于事例的问答系统研究[A];贵州制约逻辑学会2005年学术年会暨首届全国性逻辑系统专题研讨会论文集[C];2005年
2 陈晓;;中文文本自动分词研究述要[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
3 孙茂松;;汉语自动分词研究的若干最新进展——清华大学相关工作简介[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
4 许超;陈小荷;;试评两种商用机译软件的汉语分析能力[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
5 黄昌宁;高剑峰;李沐;;对自动分词的反思[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 董强;郝长伶;董振东;;基于《知网》的中文语块抽取器[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
7 王厚峰;;机器翻译中汉语词节点的识别[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
8 Chunyu Kit;;An Example-based Study on Chinese Word Segmentation Using Critical Fragments[A];Proceedings of the Conference First International Joint Conference on Natural Language Processing[C];2004年
9 杨尔弘;方莹;乔羽;;汉语自动分词和词性标注评测[A];第二届全国学生计算语言学研讨会论文集[C];2004年
10 侯敏;陈琼璜;初田天;李湛;王瑜;叶立;;汉语自动分词中的上下文相关歧义字段(CSAS)研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
2 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
3 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
4 余传明;基于本体的语义信息系统研究[D];武汉大学;2005年
5 赵章界;短语结构制导的范畴表达式演算[D];中国科学院研究生院(计算技术研究所);2006年
6 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年
7 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
8 史艳岚;基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究[D];北京语言大学;2006年
9 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
10 张亮;面向开放域的中文问答系统问句处理相关技术研究[D];南京理工大学;2006年
中国硕士学位论文全文数据库 前10条
1 王有权;基于Web的智能答疑技术研究与实现[D];南京财经大学;2010年
2 杨鼎;基于朴素贝叶斯的中文文本情感倾向分类研究[D];湖南工业大学;2010年
3 巫昌凯;企业知识库系统中复杂查询系统的设计与实现[D];华南理工大学;2010年
4 李丹;基于规则与统计的汉语自动分词研究[D];长春工业大学;2010年
5 梁桢;基于尾字词典的逆向回溯中文分词技术研究[D];武汉工业学院;2010年
6 王林平;基于内容的电子邮件过滤系统的研究[D];电子科技大学;2010年
7 蔡蕊;一种新的搜索引擎分词词典的研究[D];山东大学;2010年
8 吴惠雄;基于支持向量机与聚类算法的中文文本分类研究[D];中南林业科技大学;2009年
9 刘冰凌;基于正向最大匹配算法的优化算法ImpFMMseg的实现[D];中南民族大学;2010年
10 桑亚辉;基于模板方法的汉语语句自动改写研究[D];解放军信息工程大学;2008年
【二级参考文献】
中国期刊全文数据库 前10条
1 鲁松,白硕,黄雄,张健;基于向量空间模型的有导词义消歧[J];计算机研究与发展;2001年06期
2 杨尔弘,张国清,张永奎;基于义原同现频率的汉语词义排歧方法[J];计算机研究与发展;2001年07期
3 孙茂松,黄昌宁,邹嘉彦,陆方,沈达阳;利用汉字二元语法关系解决汉语自动分词中的交集型歧义[J];计算机研究与发展;1997年05期
4 李生;张晶;赵铁军;姚建民;;词义消歧研究的现状与发展方向[J];计算机科学;2001年09期
5 王晓龙,王开铸,李仲荣,白小华;最少分词问题及其解法[J];科学通报;1989年13期
6 刘源,梁南元;汉语处理的基础工程——现代汉语词频统计[J];中文信息学报;1986年01期
7 梁南元;书面汉语自动分词系统—CDWS[J];中文信息学报;1987年02期
8 刘涌泉;再读词的问题[J];中文信息学报;1988年02期
9 李国臣,刘开瑛,张永奎;汉语自动分词及歧义组合结构的处理[J];中文信息学报;1988年03期
10 揭春雨 ,刘源 ,梁南元;论汉语自动分词方法[J];中文信息学报;1989年01期
【相似文献】
中国期刊全文数据库 前10条
1 高东平;;基于类型论的汉语分词系统TTCS[J];重庆理工大学学报(社会科学);2011年08期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要报纸全文数据库 前2条
1 田梦;软件篇软件只是工具[N];计算机世界;2007年
2 本报记者 张磊;屏蔽网络不良信息 过滤软件瑕不掩瑜[N];中国消费者报;2009年
中国博士学位论文全文数据库 前2条
1 黄魏;植物营养诊断自动应答网络专家系统研究[D];华中农业大学;2007年
2 秦颖;汉语词和短语的歧义消解研究[D];北京邮电大学;2008年
中国硕士学位论文全文数据库 前10条
1 许荣荣;中文文本自动分词技术与算法研究[D];郑州大学;2010年
2 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
3 刘宽;现代汉语自动分词歧义分析及其消歧处理研究[D];兰州理工大学;2006年
4 杨孝光;中文文本自动分类系统研究—汉语分词及分类器的设计[D];电子科技大学;2004年
5 张敏;基于Internet的个性化信息检索关键技术研究[D];燕山大学;2006年
6 陈云;基于受限汉语和模块组合的自动程序设计研究[D];重庆大学;2008年
7 付蕾;知识元标引系统的设计与实现[D];华中师范大学;2009年
8 胡业江;中文姓名自动识别技术研究[D];华侨大学;2005年
9 张敏;生物学文献的自动标引系统的研究与开发[D];东华大学;2006年
10 刘伟;基于限定领域的问句相似度[D];天津师范大学;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026