收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

中文自动分词的一些问题

郑泽之  
【摘要】:自动分词是中文信息处理系统的基础,有着极其广泛的实际应用。为了了解自动分词在当前实际应用中的情况,作者使用第三代智能分词系统3GWS 对2006年3月《人民日报》的300个新闻文本进行了分词词性标注加人工校对,并对分词结果中的错误做了分析和归纳。实验结果显示:专名错误还是比较多的;切分标注不一致性的问题也比较明显;缩略词、言语词、术语词、字母词等需要及时收入底表。词性标注仍然是一个比较突出的问题,当前应该重视开发面向不同层次不同领域的动态更新的切分标注软件。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 潘璠;冯跃进;;学习者语料库与外语教学研究[J];外语教育;2003年00期
2 陈晓红;二语习得错误分析与疏导性处理[J];山西广播电视大学学报;2005年01期
3 潘璠;刘力;;学习者语料库与外语教学研究[J];北京第二外国语学院学报;2006年04期
4 庄亮;;学习者错误与错误分析在二语习得中的作用[J];经济与社会发展;2007年05期
5 李琼;李志;;基于词性信息自动识别和标注非分句[J];长春工程学院学报(社会科学版);2011年01期
6 乔艳;;错误分析及其对第二语言教学的启示[J];西南民族大学学报(人文社科版);2007年S1期
7 吴伟;;过去时态中的汉英中介语错误[J];湖北经济学院学报(人文社会科学版);2008年05期
8 田雪松;;中介语浅析[J];长春理工大学学报(社会科学版);2006年04期
9 崔立斌;;韩国学生汉语介词学习错误分析[J];语言文字应用;2006年S2期
10 杨奔;;探讨错误分析在普通话语音教学中的运用[J];教育与职业;2006年24期
11 邵黎黎;;中介语的特点及错误分析[J];信阳农业高等专科学校学报;2008年04期
12 郭熙煌;试论对比语言学的理论基础与意义[J];湖北大学学报(哲学社会科学版);1996年02期
13 周秋琴;第二语言习得过程中的错误探源及其学习策略[J];华南热带农业大学学报;2002年04期
14 李庆杰,常丽娟;第二语言习得过程中的错误分析及其对策[J];黑龙江教育学院学报;2005年01期
15 汪卫红;黄波;;二语习得中错误分析研究探索[J];科教文汇(中旬刊);2008年02期
16 侯祥瑞;孟坤;;语言教学中对错误的处理[J];科技咨询导报;2007年22期
17 鲍勤;错误分析理论对外语教学的启示[J];云南师范大学学报(教育科学版);1999年06期
18 李坤鹏;;外语口语错误分析及纠错策略[J];考试周刊;2008年43期
19 仲晶瑶;;对比分析、错误分析及中介语研究[J];黑龙江社会科学;2010年01期
20 李德华;;新疆少数民族学生汉语是非问句习得考察[J];吉林广播电视大学学报;2010年07期
中国重要会议论文全文数据库 前10条
1 郑泽之;;中文自动分词的一些问题[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 钱揖丽;张虎;;汉语分词及词性标注自动校验方法研究[A];第一届学生计算语言学研讨会论文集[C];2002年
3 徐艳华;;面向自动分词的三音节新词语构词法研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 李小明;王亚莉;易立夫;杨静;孙金城;;自动分词中的单字虚词处理[A];新世纪的现代语音学——第五届全国现代语音学学术会议论文集[C];2001年
5 赵大明;;关于《现代汉语规范字典》的词性标注[A];中国辞书论集1999[C];1999年
6 邢富坤;宋柔;;自动词性标注中语法因素和词汇因素对英汉语的不同影响[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 林红;胡欣;;最大熵模型的应用[A];新世纪气象科技创新与大气科学发展——中国气象学会2003年年会“地球气候和环境系统的探测与研究”分会论文集[C];2003年
8 高璐;陈琪;李永宏;于洪志;;藏语语音合成中本文分析的若干问题研究[A];第九届中国语音学学术会议论文集[C];2010年
9 陈文亮;朱靖波;吕学强;姚天顺;;词性标注规则的获取和优化[A];第一届学生计算语言学研讨会论文集[C];2002年
10 郭锐;;语文词典的词性标注问题[A];中国辞书学文集[C];1998年
中国博士学位论文全文数据库 前9条
1 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
2 陈芷;汉西附着现象的平行研究[D];上海外国语大学;2009年
3 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
4 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
5 屈刚;英汉双语短语对齐[D];上海交通大学;2007年
6 韩秀娟;基于动态流通语料库的通用词语用字研究及字词语关系考察[D];北京语言大学;2007年
7 宋刚;普通话儿童早期动词习得:范畴、论元结构与句法线索[D];北京语言大学;2009年
8 王洁;汉语中介语偏误的计算机处理方法研究[D];北京语言大学;2008年
9 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前10条
1 王荫秀;外语教学中错误分析的多维模式[D];西南师范大学;2002年
2 刘玉山;错误分析和外语教学与学习[D];山东师范大学;2003年
3 汪春娣;[D];安徽大学;2003年
4 陈蕾;格理论及其教学启示[D];合肥工业大学;2009年
5 王振环;学习策略在中介语错误分析中的应用[D];西北大学;2007年
6 张扬;从句中语用迁移问题研究[D];东北林业大学;2006年
7 于君星;语言能力、交际策略的使用及其校正[D];华东师范大学;2007年
8 邹秋娟;大学生写作中的语言错误分析及其启示[D];中国海洋大学;2005年
9 江世勇;外语学习者错误及其处理的多维探讨[D];重庆师范大学;2005年
10 薛凤环;一语对二语写作词汇搭配错误的负迁移—一项基于语料库的研究[D];贵州大学;2007年
中国重要报纸全文数据库 前4条
1 教育部语信司;语言资源监测与服务论坛举行[N];语言文字周报;2010年
2 教育部语信司;国家语言资源监测与研究中心召开2007数据发布专题研讨会[N];语言文字周报;2008年
3 教育部语言文字信息管理司司长李宇明;语言文字工作应当与时俱进[N];中国教育报;2001年
4 语言所 董琨;错误百出 贻笑大方[N];中国社会科学院院报;2004年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978