收藏本站
《内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集》2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于语料考察的“组合型歧义”与“切分变异”辨析

张霄军  董宇  陈小荷  
【摘要】:本文以学界两次对组合型歧义字串考察的矛盾结果为引子,指出在现代汉语自动分词中“组合型歧义”和“切分变异”的概念界定不清,并以例示的方式给出了各自的定义。通过四次语料考察、统计和分析,总结了汉语自动分词中组合型歧义字串和切分变异字串的常见类型,并探讨了切分变异的消解方法。

手机知网App
【参考文献】
中国期刊全文数据库 前2条
1 刘江,郑家恒,张虎;中文文本语料库分词一致性检验技术的初探[J];计算机应用研究;2005年09期
2 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
【共引文献】
中国期刊全文数据库 前10条
1 程节华;自动分词中的歧义字段分析及处理[J];安徽农业技术师范学院学报;2000年03期
2 马志强;周长胜;丁维;杨娜;;校园网搜索引擎的研究与实现[J];北京机械工业学院学报;2007年01期
3 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
4 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
5 张利;张立勇;张晓淼;耿铁锁;岳宗阁;;基于改进BP网络的中文歧义字段分词方法研究[J];大连理工大学学报;2007年01期
6 杜永萍,郑家恒;分词及词性标注一致性校对系统的设计与实现[J];电脑开发与应用;2001年10期
7 张辉,徐健;中国组织机构名自动识别系统的设计与实现[J];电脑开发与应用;2002年01期
8 刘利东;基于组合度的汉语分词决策算法研究[J];德州学院学报;2003年02期
9 王显芳,杜利民;一种能够检测所有交叉歧义的汉语分词算法[J];电子学报;2004年01期
10 王显芳,杜利民;利用覆盖歧义检测法和统计语言模型进行汉语自动分词[J];电子与信息学报;2003年09期
中国重要会议论文全文数据库 前10条
1 曾华琳;史晓东;李堂秋;;基于上下文信息提取的概率分词算法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 王慧慧;杨国纬;;基于事例的问答系统研究[A];贵州制约逻辑学会2005年学术年会暨首届全国性逻辑系统专题研讨会论文集[C];2005年
3 靳光瑾;郭曙纶;肖航;章云帆;;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[A];语言文字应用研究论文集(Ⅱ)[C];2004年
4 陈晓;;中文文本自动分词研究述要[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
5 傅思泉;;机器词典中按韵分词及虚词问题[A];江西省语言学会第五届会员大会暨2002年学术年会论文集[C];2002年
6 孙茂松;;汉语自动分词研究的若干最新进展——清华大学相关工作简介[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
7 许超;陈小荷;;试评两种商用机译软件的汉语分析能力[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
8 黄昌宁;高剑峰;李沐;;对自动分词的反思[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 董强;郝长伶;董振东;;基于《知网》的中文语块抽取器[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
10 王厚峰;;机器翻译中汉语词节点的识别[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
2 何婷婷;语料库研究[D];华中师范大学;2003年
3 张蕾;概念结构及其应用[D];西北工业大学;2001年
4 刘忠;性质语意理论的提出与自然语言理解及其实现的研究[D];华东师范大学;2004年
5 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
6 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
7 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
8 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
9 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
10 刘伟;现代汉语代词隐现的动态研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前10条
1 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
2 娄(王廷);现代汉语分词系统通用性设计及切分歧义处理[D];北京工业大学;2000年
3 吴思;聚类分析及其在农业物种信息自动提取中的应用[D];湘潭大学;2001年
4 黄艳;面向数字化产品的自然语言查询技术的研究与开发[D];浙江大学;2002年
5 缪晓阳;WebCM:一种基于搜索引擎的网络内容监控系统的研究[D];浙江大学;2002年
6 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
7 廉竹钧;汉语组合型切分歧义字段消歧方法研究[D];北京语言文化大学;2002年
8 张丽静;规则与统计相结合的兼类词处理机制[D];大连理工大学;2002年
9 蔡丽;海外华语教材词汇分析研究[D];暨南大学;2002年
10 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
【二级参考文献】
中国期刊全文数据库 前10条
1 杜永萍,郑家恒;分词及词性标注一致性校对系统的设计与实现[J];电脑开发与应用;2001年10期
2 肖云,孙茂松,邹嘉彦;利用上下文信息解决汉语自动分词中的组合型歧义[J];计算机工程与应用;2001年19期
3 郑德权,于凤,王开涛 ,赵铁军;基于汉语二字应成词的歧义字段切分方法[J];计算机工程与应用;2003年01期
4 王晓龙,王开铸,李仲荣,白小华;最少分词问题及其解法[J];科学通报;1989年13期
5 李国臣,刘开瑛,张永奎;汉语自动分词及歧义组合结构的处理[J];中文信息学报;1988年03期
6 揭春雨 ,刘源 ,梁南元;论汉语自动分词方法[J];中文信息学报;1989年01期
7 梁南元;汉语计算机自动分词知识[J];中文信息学报;1990年02期
8 何克抗,徐辉,孙波;书面汉语自动分词专家系统设计原理[J];中文信息学报;1991年02期
9 梁南元,刘源,沈旭昆,谭强,杨铁鹰;制订《信息处理用现代汉语常用词词表》的原则与问题的讨论[J];中文信息学报;1991年03期
10 韩世欣,王开铸;基于短语结构文法的分词研究[J];中文信息学报;1992年03期
【相似文献】
中国重要会议论文全文数据库 前3条
1 张霄军;董宇;陈小荷;;基于语料考察的“组合型歧义”与“切分变异”辨析[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 董宇;陈小荷;;带标注语料库中切分变异的统计分析及思考[A];第三届学生计算语言学研讨会论文集[C];2006年
3 程月;季娜;洪鹿平;;基于语料统计的以“不”开头双字分词不一致研究[A];第三届学生计算语言学研讨会论文集[C];2006年
中国硕士学位论文全文数据库 前2条
1 刘宽;现代汉语自动分词歧义分析及其消歧处理研究[D];兰州理工大学;2006年
2 刘禹孜;汉语自动分词中排除歧义字段算法的研究[D];重庆大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026