收藏本站
《语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集》2003年
收藏 | 手机打开
二维码
手机客户端打开本文

机器翻译中汉语词节点的识别

王厚峰  
【摘要】:汉语词节点的识别包括纯切分歧义消解、命名实体识别和缩略语的辨识等,被认为是中文信息处理的困难问题。为了考察难点所在,我们测试了两个机器翻译系统识别词节点的性能。结果表明,命名实体和缩略语识别错误是词节点识别错误的主要来源。本文对此作了评估和讨论。

手机知网App
【参考文献】
中国期刊全文数据库 前1条
1 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
【共引文献】
中国期刊全文数据库 前10条
1 马志强;周长胜;丁维;杨娜;;校园网搜索引擎的研究与实现[J];北京机械工业学院学报;2007年01期
2 张利;张立勇;张晓淼;耿铁锁;岳宗阁;;基于改进BP网络的中文歧义字段分词方法研究[J];大连理工大学学报;2007年01期
3 罗智勇;宋柔;;现代汉语通用分词系统中歧义切分的实用技术[J];计算机研究与发展;2006年06期
4 付德宇;代成琴;;一个面向文本分类的中文特征词自动抽取方法[J];计算机工程与应用;2006年15期
5 黄建中,王肖雷;Katz平滑算法在中文分词系统中的应用[J];计算机工程;2004年S1期
6 佘莉,符红光,方海光;几何命题处理中的中文分词技术[J];计算机工程;2005年18期
7 陈耀东,王挺;基于有向图的双向匹配分词算法及实现[J];计算机应用;2005年06期
8 徐华中;徐刚;;一种新的汉语自动分词算法的研究和应用[J];计算机与数字工程;2006年02期
9 杨尔弘;方莹;刘冬明;乔羽;;汉语自动分词和词性标注评测[J];中文信息学报;2006年01期
10 冯冲;陈肇雄;黄河燕;关真珍;;基于Multigram语言模型的主动学习中文分词[J];中文信息学报;2006年01期
中国重要会议论文全文数据库 前9条
1 王慧慧;杨国纬;;基于事例的问答系统研究[A];贵州制约逻辑学会2005年学术年会暨首届全国性逻辑系统专题研讨会论文集[C];2005年
2 陈晓;;中文文本自动分词研究述要[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
3 许超;陈小荷;;试评两种商用机译软件的汉语分析能力[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
4 黄昌宁;高剑峰;李沐;;对自动分词的反思[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 杨尔弘;方莹;乔羽;;汉语自动分词和词性标注评测[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 侯敏;陈琼璜;初田天;李湛;王瑜;叶立;;汉语自动分词中的上下文相关歧义字段(CSAS)研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 孙承杰;黄昌宁;关毅;;基于标注语料库的组合歧义检测与消解[A];第三届学生计算语言学研讨会论文集[C];2006年
8 张霄军;董宇;陈小荷;;基于语料考察的“组合型歧义”与“切分变异”辨析[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 石子夜;;置信分词——面向中分信息检索的分词模式[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
2 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
3 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
4 赵章界;短语结构制导的范畴表达式演算[D];中国科学院研究生院(计算技术研究所);2006年
5 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
6 史艳岚;基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究[D];北京语言大学;2006年
7 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
8 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年
9 高红;基于统计语言模型的汉语浅层分析研究[D];大连理工大学;2007年
10 何琳;古农学本体的半自动构建及检索研究[D];南京农业大学;2007年
中国硕士学位论文全文数据库 前10条
1 廉竹钧;汉语组合型切分歧义字段消歧方法研究[D];北京语言文化大学;2002年
2 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
3 王蕾;基于动态流通语料库的信息技术领域术语通用化研究[D];北京语言文化大学;2003年
4 许林杰;中文文本分词研究[D];山东师范大学;2003年
5 王丁;基于中文文本分类的自动诊病系统[D];哈尔滨理工大学;2003年
6 宋礼鹏;大规模语料库分词质量评价方法研究[D];山西大学;2004年
7 杨孝光;中文文本自动分类系统研究—汉语分词及分类器的设计[D];电子科技大学;2004年
8 王源媛;中文未登录名词短语的识别方法研究[D];重庆大学;2004年
9 刘江;大规模汉语语料库分词一致性检验技术研究[D];山西大学;2005年
10 赵艳芳;面向Internet的个性化信息服务的研究[D];云南师范大学;2005年
【二级参考文献】
中国期刊全文数据库 前10条
1 王晓龙,王开铸,李仲荣,白小华;最少分词问题及其解法[J];科学通报;1989年13期
2 李国臣,刘开瑛,张永奎;汉语自动分词及歧义组合结构的处理[J];中文信息学报;1988年03期
3 揭春雨 ,刘源 ,梁南元;论汉语自动分词方法[J];中文信息学报;1989年01期
4 梁南元;汉语计算机自动分词知识[J];中文信息学报;1990年02期
5 何克抗,徐辉,孙波;书面汉语自动分词专家系统设计原理[J];中文信息学报;1991年02期
6 梁南元,刘源,沈旭昆,谭强,杨铁鹰;制订《信息处理用现代汉语常用词词表》的原则与问题的讨论[J];中文信息学报;1991年03期
7 韩世欣,王开铸;基于短语结构文法的分词研究[J];中文信息学报;1992年03期
8 曹焕光,郑家恒;自动分词软件质量的评价模型[J];中文信息学报;1992年04期
9 徐秉铮,詹剑,贺前华;基于神经网络的分词方法[J];中文信息学报;1993年02期
10 沈达阳,孙茂松,黄昌宁;汉语分词系统中的信息集成和最佳路径搜索方法[J];中文信息学报;1997年02期
【相似文献】
中国期刊全文数据库 前10条
1 刘哲;;数据清洗技术在网络教学评价体系中的应用[J];网络与信息;2011年08期
2 王俊生;施运梅;张仰森;;基于Hadoop的分布式搜索引擎关键技术[J];北京信息科技大学学报(自然科学版);2011年04期
3 王凤玲;;基于缩略语分析的中文报道关系识别研究[J];计算机工程;2011年18期
4 贾丙静;吴长勤;葛华;;Web文本聚类的研究与实现[J];长春师范学院学报;2011年06期
5 蒋艳荣;刘习文;陈耿涛;;基于Viterbi改进算法的高棉语分词研究[J];计算机工程;2011年15期
6 ;汉字数字的用法[J];中国医药导报;2011年16期
7 ;汉字数字的用法[J];中国医药导报;2011年22期
8 ;汉字数字的用法[J];中国医药导报;2011年20期
9 史成娣;钟传欣;杭桂生;;科技论文中英文关键词的规范表达[J];中国科技期刊研究;2005年06期
10 ;2012中国平板显示学术会议征稿细则[J];现代显示;2011年09期
中国重要会议论文全文数据库 前10条
1 王厚峰;;机器翻译中汉语词节点的识别[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 ;缩略语[A];2010中国牛业进展[C];2010年
3 ;缩略语说明[A];全国男男性行为人群艾滋病防治工作经验交流暨《朋友》项目十周年庆典与贝利—马丁奖颁奖大会文集[C];2008年
4 徐进;;俄语军事缩略语知识库的构建[A];第五届全国青年计算语言学研讨会论文集[C];2010年
5 焦妍;王厚峰;;基于机器学习方法与搜索引擎验证的缩略语预测[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 徐润华;陈小荷;;一种利用注疏的《左传》分词新方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 李怡平;吴飞;;多语言环境下的分布式互联网分词平台[A];第十六届全国数据库学术会议论文集[C];1999年
8 刘友强;李斌;奚宁;陈家骏;;基于双语平行语料的中文缩略语提取方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
9 余富林;;英语缩略语词典的现状与对策[A];中国辞书学会双语词典专业委员会第三届年会暨学术研讨会论文集[C];1998年
10 赵伟;路永刚;吴琼;;一种新的基于BMM和RMM分词方法的研究与实现[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
中国重要报纸全文数据库 前10条
1 高英东;《英汉缩略语大词典》[N];中国图书商报;2003年
2 ;英文缩略语 让谁辛苦让谁忙[N];人民日报;2002年
3 香港中国传统文化研究院院长 李土生;缩略语与洋命名——汉语的“骨质增生”[N];社会科学报;2008年
4 ;企业信息化常见缩略语汇总(一)[N];财会信报;2007年
5 ;企业信息化常见缩略语汇总(二)[N];财会信报;2007年
6 寿栋;四种让SOA关注业务的途径[N];计算机世界;2007年
7 李土生;当心!汉语正遭受“外来污染”[N];中国信息报;2008年
8 徐迅雷;国统局是什么局来着[N];中华工商时报;2004年
9 ;品牌命名四忌[N];中国工商报;2004年
10 高岚;海量在线做搜索引擎“卖水人”[N];中国计算机报;2004年
中国博士学位论文全文数据库 前10条
1 侯锋;中文报业出版的文字质量智能辅助控制技术研究[D];国防科学技术大学;2010年
2 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
3 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
4 林彤;恶性黑素瘤致病机制的研究[D];中国协和医科大学;2003年
5 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
6 刘志生;东汉碑刻复音词研究[D];华东师范大学;2005年
7 蒋昌金;基于关键词提取的中文网页自动文摘方法研究[D];华南理工大学;2010年
8 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
9 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
10 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
中国硕士学位论文全文数据库 前10条
1 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
2 陈思;中文文本投诉信息自动分类系统研究[D];东北师范大学;2010年
3 赵春红;外包数据库模型中文本数据完整性检测方案的研究[D];燕山大学;2010年
4 卢育红;半结构化药物数据智能分类技术研究与系统实现(全日制专业学位)[D];北京交通大学;2011年
5 卢忠良;基于多类的汉语文本自动分类研究[D];中国人民解放军国防科学技术大学;2002年
6 苗玺;中文语料库切分不一致字串分类校验方法研究[D];山西大学;2006年
7 张楚屏;从分词的静词作用看分词在计算机英语中的翻译方法[D];华中科技大学;2006年
8 黄勇杰;基于统计NLP技术的甲骨卜辞的分析研究[D];华东师范大学;2010年
9 王驰;基于海量网络舆情信息的热点发现[D];电子科技大学;2011年
10 李润;汉语缩略语及其词频分析[D];安徽大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026