收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

汉语自动分词中的上下文相关歧义字段(CSAS)研究

侯敏  陈琼璜  初田天  李湛  王瑜  叶立  
【摘要】:上下文相关歧义字段(CSAS)的处理是汉语自动分词中的难题之一。本文对收集到的CSAS逐个进行了研究,提出了“人脑认定+语料库验证”的提取方法以及基本词表、校正词表和规则库互动的处理手段,其中不相邻条件匹配的越过规则可解决统计方法难以解决的问题。测试结果表明,该方法是有效的。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵伟;张学;安诚;;基于统计和规则的中文姓名识别[J];信息与电脑(理论版);2011年05期
2 王广正;王喜凤;;一种基于规则优先级的词性标注方法[J];安徽工业大学学报(自然科学版);2008年04期
3 王凡秀;王自强;;汉语自动分词技术研究[J];计算机与数字工程;2008年11期
4 孙茂松,肖明,邹嘉彦;基于无指导学习策略的无词表条件下的汉语自动分词[J];计算机学报;2004年06期
5 王广正;王喜凤;;基于知网语义相关度计算的词义消歧方法[J];安徽工业大学学报(自然科学版);2008年01期
6 赵伟,戴新宇,尹存燕,陈家骏;一种规则与统计相结合的汉语分词方法[J];计算机应用研究;2004年03期
7 高红;黄德根;杨元生;;一种与分词一体化的中文人名识别方法[J];计算机工程;2006年19期
8 王锡江;王启祥;陈家骏;;基于邻接知识的汉语自动分词系统[J];计算机研究与发展;1992年11期
9 蒋斌;杨超;赵欢;;基于二字词位图表的汉语自动分词词典机制[J];湖南大学学报(自然科学版);2006年01期
10 吴东峥;;基于统计的开放式汉语自动分词[J];福建电脑;2009年03期
11 王希杰;赵晓凡;;浅谈汉语自动分词的几种方法[J];价值工程;2011年13期
12 殷建平;汉语自动分词方法[J];计算机工程与科学;1998年03期
13 刘迁;贾惠波;;中文信息处理中自动分词技术的研究与展望[J];计算机工程与应用;2006年03期
14 梁南元;书面汉语自动分词综述[J];计算机应用与软件;1987年03期
15 文庭孝,邱均平,侯经川;汉语自动分词研究展望[J];现代图书情报技术;2004年07期
16 邱均平,文庭孝,周黎明;汉语自动分词与内容分析法研究[J];情报学报;2005年03期
17 高红;黄德根;杨元生;;汉语自动分词中中文地名识别[J];大连理工大学学报;2006年04期
18 孙巍;;一种面向中文信息检索的汉语自动分词方法[J];现代图书情报技术;2006年07期
19 刘龙飞;陈斌;党荣;;基于CNET模型的无词典汉语自动分词算法研究[J];计算机应用与软件;2007年10期
20 陈斌;;基于数学设计的计算机自动分词算法[J];江西科学;2009年05期
中国重要会议论文全文数据库 前10条
1 侯敏;陈琼璜;初田天;李湛;王瑜;叶立;;汉语自动分词中的上下文相关歧义字段(CSAS)研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
2 许小星;亢世勇;孙茂松;刘金凤;;语料库语义成分标注的若干问题[A];第三届学生计算语言学研讨会论文集[C];2006年
3 马永腾;亢世勇;;非典型成员的语义标注策略和问题[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 董娜;林碧琴;丁丰;;机器翻译中若干问题的探讨[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
5 林哲民;;为微型语料库标记词类使用田野调查人员记录及基于转换的自动学习[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 何伟;侯敏;文采菊;;流行语时空监测模型研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 梁飞;吕洪波;姚锦峰;;舆情分析中语料库降维[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
8 许小星;亢世勇;;基于标注语料库的主谓谓语句的语义分析[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
9 朱凯;周杰;何婷婷;;因特网语料自动下载分析软件的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
10 杨二宝;吕学强;朱靖波;姚天顺;;一种汉英翻译模板提取方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前10条
1 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年
2 巢文涵;基于双语语料库的机器翻译关键技术研究[D];国防科学技术大学;2008年
3 孙广路;基于统计学习的中文组块分析技术研究[D];哈尔滨工业大学;2008年
4 钱龙华;命名实体间语义关系抽取研究[D];苏州大学;2009年
5 余振山;自然语言文本中数字水印的设计与研究[D];中国科学技术大学;2009年
6 张京楣;基于统计方法的文本风格分析研究[D];山东大学;2012年
7 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
8 张友华;面向智能服务的Web内容计算研究与应用[D];中国科学技术大学;2006年
9 姜维;统计中文词法分析及其强化学习机制的研究[D];哈尔滨工业大学;2007年
10 李志国;面向分布式文本知识管理的中文分词与文本分类研究[D];重庆大学;2008年
中国硕士学位论文全文数据库 前10条
1 岳炳词;面向语言学研究的大规模汉语生语料库检索工具CCRLT[D];北京工业大学;2001年
2 刘杰;基于唐诗语料词的提取与统计分析的研究[D];吉林大学;2006年
3 宋礼鹏;大规模语料库分词质量评价方法研究[D];山西大学;2004年
4 葛运东;跨语言信息检索查询翻译技术研究[D];苏州大学;2010年
5 关宏超;基于统计的开放式汉语自动分词[D];大连理工大学;2002年
6 程洁;语音翻译词典的设计实现与系统评估[D];哈尔滨工程大学;2004年
7 苗玺;中文语料库切分不一致字串分类校验方法研究[D];山西大学;2006年
8 罗云飞;中文人称代词指代消解系统的研究与实现[D];山西大学;2005年
9 全昌勤;基于语料库的汉语词义消歧方法研究[D];华中师范大学;2005年
10 段恩泽;基于统计的汉语自动分词系统[D];电子科技大学;2005年
中国重要报纸全文数据库 前8条
1 闫宏志;全文翻译技术发展脉络[N];中国计算机报;2003年
2 ;轻松跨越语言障碍[N];中国电脑教育报;2004年
3 ;智能接口六大技术[N];计算机世界;2001年
4 ;翻译软件编辑选择奖获奖产品展示[N];中国计算机报;2002年
5 ;翻译软件:实用翻译+语音翻译[N];中国计算机报;2002年
6 记者 王燕元;首信融RONEASE进军电子商务[N];中国贸易报;2008年
7 姚双云 华中师范大学语言与语言教育研究中心;虚词知识库:中文信息处理的基石[N];中国社会科学报;2011年
8 李人凡;传统书业数字出版的障碍和突破[N];中国新闻出版报;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978