收藏本站
《全国第八届计算语言学联合学术会议(JSCL-2005)论文集》2005年
收藏 | 手机打开
二维码
手机客户端打开本文

汉语自动分词中的上下文相关歧义字段(CSAS)研究

侯敏  陈琼璜  初田天  李湛  王瑜  叶立  
【摘要】:上下文相关歧义字段(CSAS)的处理是汉语自动分词中的难题之一。本文对收集到的CSAS逐个进行了研究,提出了“人脑认定+语料库验证”的提取方法以及基本词表、校正词表和规则库互动的处理手段,其中不相邻条件匹配的越过规则可解决统计方法难以解决的问题。测试结果表明,该方法是有效的。

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
中国重要会议论文全文数据库 前1条
1 黄昌宁;高剑峰;李沐;;对自动分词的反思[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
【共引文献】
中国期刊全文数据库 前10条
1 马志强;周长胜;丁维;杨娜;;校园网搜索引擎的研究与实现[J];北京机械工业学院学报;2007年01期
2 李国和;刘光胜;吴卫江;孙红军;唐先明;韩宝东;;基于最大匹配和歧义检测的中文分词粗分方法[J];北京信息科技大学学报(自然科学版);2010年S2期
3 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
4 曾华琳;周昌乐;郑旭玲;;A New Word Detection Method for Chinese Based on Local Context Information[J];Journal of Donghua University(English Edition);2010年02期
5 张利;张立勇;张晓淼;耿铁锁;岳宗阁;;基于改进BP网络的中文歧义字段分词方法研究[J];大连理工大学学报;2007年01期
6 王慧慧;;划分“11段”的思想在文本处理方面的研究[J];电脑知识与技术;2009年30期
7 吴静,蔡砥,王铮;地理信息系统中自然语言查询的分词处理与应用[J];地球信息科学;2005年03期
8 王显芳,杜利民;一种能够检测所有交叉歧义的汉语分词算法[J];电子学报;2004年01期
9 王显芳,杜利民;利用覆盖歧义检测法和统计语言模型进行汉语自动分词[J];电子与信息学报;2003年09期
10 代建英,何中市;基于词性信息的汉语时间语词消歧算法[J];重庆大学学报(自然科学版);2005年09期
中国重要会议论文全文数据库 前10条
1 贾会强;刘晓丽;于洪志;;基于词性特征提取的藏文文本分类方法研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
2 王慧慧;杨国纬;;基于事例的问答系统研究[A];贵州制约逻辑学会2005年学术年会暨首届全国性逻辑系统专题研讨会论文集[C];2005年
3 陈晓;;中文文本自动分词研究述要[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
4 傅思泉;;机器词典中按韵分词及虚词问题[A];江西省语言学会第五届会员大会暨2002年学术年会论文集[C];2002年
5 侯敏;;汉语自动分析中的若干问题与对策[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 许超;陈小荷;;试评两种商用机译软件的汉语分析能力[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
7 黄昌宁;高剑峰;李沐;;对自动分词的反思[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
8 王厚峰;;机器翻译中汉语词节点的识别[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 杨尔弘;方莹;乔羽;;汉语自动分词和词性标注评测[A];第二届全国学生计算语言学研讨会论文集[C];2004年
10 郭慧志;王强军;刘华;张普;;大规模动态流通语料库的构建[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 张海军;基于大规模语料的中文新词识别技术研究[D];中国科学技术大学;2011年
2 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
3 黄水清;非相关文献知识发现方法及在农业经济学中的应用[D];南京农业大学;2010年
4 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
5 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
6 张蕾;概念结构及其应用[D];西北工业大学;2001年
7 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
8 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
9 李良炎;基于词联接的自然语言处理技术及其应用研究[D];重庆大学;2004年
10 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前10条
1 杨鼎;基于朴素贝叶斯的中文文本情感倾向分类研究[D];湖南工业大学;2010年
2 梁桢;基于尾字词典的逆向回溯中文分词技术研究[D];武汉工业学院;2010年
3 王林平;基于内容的电子邮件过滤系统的研究[D];电子科技大学;2010年
4 蔡蕊;一种新的搜索引擎分词词典的研究[D];山东大学;2010年
5 吴惠雄;基于支持向量机与聚类算法的中文文本分类研究[D];中南林业科技大学;2009年
6 王荔;统计全切分中文分词系统的研究与实现[D];西安电子科技大学;2009年
7 朱擎量;基于GIS的徐汇区警用视频监控系统开发[D];华东师范大学;2011年
8 刘冬平;面向中文歌词的音乐情感分类研究[D];广东工业大学;2011年
9 郑秀玲;“不X是”字串分词歧解及消歧策略[D];上海师范大学;2011年
10 任晓霞;BBS舆情智能分析系统研究与实现[D];沈阳理工大学;2011年
【二级参考文献】
中国期刊全文数据库 前3条
1 冯志伟;汉字和汉语的计算机处理[J];当代语言学;2001年01期
2 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
3 孙茂松,左正平,黄昌宁;消解中文三字长交集型分词歧义的算法[J];清华大学学报(自然科学版);1999年05期
【相似文献】
中国期刊全文数据库 前10条
1 赵伟;张学;安诚;;基于统计和规则的中文姓名识别[J];信息与电脑(理论版);2011年05期
2 王广正;王喜凤;;一种基于规则优先级的词性标注方法[J];安徽工业大学学报(自然科学版);2008年04期
3 王凡秀;王自强;;汉语自动分词技术研究[J];计算机与数字工程;2008年11期
4 孙茂松,肖明,邹嘉彦;基于无指导学习策略的无词表条件下的汉语自动分词[J];计算机学报;2004年06期
5 王广正;王喜凤;;基于知网语义相关度计算的词义消歧方法[J];安徽工业大学学报(自然科学版);2008年01期
6 赵伟,戴新宇,尹存燕,陈家骏;一种规则与统计相结合的汉语分词方法[J];计算机应用研究;2004年03期
7 高红;黄德根;杨元生;;一种与分词一体化的中文人名识别方法[J];计算机工程;2006年19期
8 王锡江;王启祥;陈家骏;;基于邻接知识的汉语自动分词系统[J];计算机研究与发展;1992年11期
9 蒋斌;杨超;赵欢;;基于二字词位图表的汉语自动分词词典机制[J];湖南大学学报(自然科学版);2006年01期
10 吴东峥;;基于统计的开放式汉语自动分词[J];福建电脑;2009年03期
中国重要会议论文全文数据库 前10条
1 侯敏;陈琼璜;初田天;李湛;王瑜;叶立;;汉语自动分词中的上下文相关歧义字段(CSAS)研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 许小星;亢世勇;孙茂松;刘金凤;;语料库语义成分标注的若干问题[A];第三届学生计算语言学研讨会论文集[C];2006年
3 马永腾;亢世勇;;非典型成员的语义标注策略和问题[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 董娜;林碧琴;丁丰;;机器翻译中若干问题的探讨[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
5 林哲民;;为微型语料库标记词类使用田野调查人员记录及基于转换的自动学习[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 何伟;侯敏;文采菊;;流行语时空监测模型研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 梁飞;吕洪波;姚锦峰;;舆情分析中语料库降维[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
8 许小星;亢世勇;;基于标注语料库的主谓谓语句的语义分析[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
9 朱凯;周杰;何婷婷;;因特网语料自动下载分析软件的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
10 杨二宝;吕学强;朱靖波;姚天顺;;一种汉英翻译模板提取方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国重要报纸全文数据库 前8条
1 闫宏志;全文翻译技术发展脉络[N];中国计算机报;2003年
2 ;轻松跨越语言障碍[N];中国电脑教育报;2004年
3 ;智能接口六大技术[N];计算机世界;2001年
4 ;翻译软件编辑选择奖获奖产品展示[N];中国计算机报;2002年
5 ;翻译软件:实用翻译+语音翻译[N];中国计算机报;2002年
6 记者 王燕元;首信融RONEASE进军电子商务[N];中国贸易报;2008年
7 姚双云 华中师范大学语言与语言教育研究中心;虚词知识库:中文信息处理的基石[N];中国社会科学报;2011年
8 李人凡;传统书业数字出版的障碍和突破[N];中国新闻出版报;2011年
中国博士学位论文全文数据库 前10条
1 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年
2 巢文涵;基于双语语料库的机器翻译关键技术研究[D];国防科学技术大学;2008年
3 孙广路;基于统计学习的中文组块分析技术研究[D];哈尔滨工业大学;2008年
4 钱龙华;命名实体间语义关系抽取研究[D];苏州大学;2009年
5 余振山;自然语言文本中数字水印的设计与研究[D];中国科学技术大学;2009年
6 张京楣;基于统计方法的文本风格分析研究[D];山东大学;2012年
7 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
8 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
9 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年
10 李志国;面向分布式文本知识管理的中文分词与文本分类研究[D];重庆大学;2008年
中国硕士学位论文全文数据库 前10条
1 岳炳词;面向语言学研究的大规模汉语生语料库检索工具CCRLT[D];北京工业大学;2001年
2 刘杰;基于唐诗语料词的提取与统计分析的研究[D];吉林大学;2006年
3 宋礼鹏;大规模语料库分词质量评价方法研究[D];山西大学;2004年
4 葛运东;跨语言信息检索查询翻译技术研究[D];苏州大学;2010年
5 关宏超;基于统计的开放式汉语自动分词[D];大连理工大学;2002年
6 程洁;语音翻译词典的设计实现与系统评估[D];哈尔滨工程大学;2004年
7 苗玺;中文语料库切分不一致字串分类校验方法研究[D];山西大学;2006年
8 罗云飞;中文人称代词指代消解系统的研究与实现[D];山西大学;2005年
9 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
10 段恩泽;基于统计的汉语自动分词系统[D];电子科技大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026