收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

汉语分词及词性标注自动校验方法研究

钱揖丽  张虎  
【摘要】:大规模的标注语料库是语料库语言学发展的重要基础。随着许多科学研究的进一步开展,我们对语料的加工质量提出了更高的要求。本文采用基于上下文搭配的规则和统计相结合的自动校验方法,对机器切分标注语料进行处理,并把自动校验过程中获取的信息,应用于语料库的构建,即采用滚动式的方法,建立大规模的、具有更高加工质量的标注语料库。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李海波;;手工分词和词性标注的问题[J];现代语文(语言研究版);2010年07期
2 马宏基;;对外汉语教材中兼类词的标注问题[J];科学决策;2008年10期
3 潘彦彩;;《现代汉语词典》(第5版)词性标注指瑕[J];语文知识;2011年01期
4 ;要目回溯[J];辞书研究;2007年01期
5 宛志文;;虚词词性标注的统一性和释义方式[J];辞书研究;1985年02期
6 苏宝荣;汉语语文辞书的词性标注及其对释义的影响[J];辞书研究;2002年02期
7 程荣;;汉语辞书中词性标注引发的相关问题[J];中国语文;1999年03期
8 赛麦提·麦麦提明;;现代维吾尔语同形词词性自动标注探析[J];语言与翻译;2006年03期
9 王伟丽;;浅谈外向型汉语学习词典的词性标注[J];语文学刊;2009年08期
10 马楠;;词典词性标注的单位问题[J];辞书研究;2009年03期
11 李志江;关于语文辞书词性标注的探讨[J];语文建设;1999年05期
12 王鸿滨;从《左传》主题句中“以”的词性判定看语文词典词性标注问题[J];玉林师范学院学报;2001年04期
13 李慧贤;《现代汉语规范字典》词性标注指瑕[J];辞书研究;2002年02期
14 应利;叶秋生;;《现代汉语词典》(第5版)几个属性词标注存疑[J];乐山师范学院学报;2007年04期
15 古丽拉·阿东别克;达吾勒·阿布都哈依尔;木合亚提·尼亚孜别克;刘晓洁;;现代哈萨克语词级标注语料库的构建研究[J];新疆大学学报(自然科学版);2009年04期
16 李肖婷;;HSK初中等大纲动名双音兼类词考察[J];咸宁学院学报;2010年02期
17 郑献芹;;《现代汉语词典》(第5版)词性标注失当举隅[J];新乡学院学报(社会科学版);2010年05期
18 杨翠兰;汉语成语的语法功能研究[J];烟台教育学院学报;2005年03期
19 马楠;;由语文词典词性标注引发的思考[J];甘肃高师学报;2007年03期
20 张恒君;;“连续”词性辨析[J];河北科技师范学院学报(社会科学版);2009年04期
中国重要会议论文全文数据库 前10条
1 钱揖丽;张虎;;汉语分词及词性标注自动校验方法研究[A];第一届学生计算语言学研讨会论文集[C];2002年
2 赵大明;;关于《现代汉语规范字典》的词性标注[A];中国辞书论集1999[C];1999年
3 邢富坤;宋柔;;自动词性标注中语法因素和词汇因素对英汉语的不同影响[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 高山;张艳;徐波;宗成庆;韩兆兵;;基于三元统计模型的汉语分词及标注一体化研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
5 林红;胡欣;;最大熵模型的应用[A];新世纪气象科技创新与大气科学发展——中国气象学会2003年年会“地球气候和环境系统的探测与研究”分会论文集[C];2003年
6 徐艳华;;面向自动分词的三音节新词语构词法研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 李晶;陈鄞;杨沐昀;徐冰;;关于在分词系统中引入领域词典的研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
8 陈文亮;朱靖波;吕学强;姚天顺;;词性标注规则的获取和优化[A];第一届学生计算语言学研讨会论文集[C];2002年
9 李红印;;颜色词的收词、释义和词性标注[A];中国辞书论集2001[C];2001年
10 郑泽之;;中文自动分词的一些问题[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前9条
1 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
2 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
3 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
4 屈刚;英汉双语短语对齐[D];上海交通大学;2007年
5 韩秀娟;基于动态流通语料库的通用词语用字研究及字词语关系考察[D];北京语言大学;2007年
6 王洁;汉语中介语偏误的计算机处理方法研究[D];北京语言大学;2008年
7 宋刚;普通话儿童早期动词习得:范畴、论元结构与句法线索[D];北京语言大学;2009年
8 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
9 杨建国;基于动态流通语料库(DCC)的汉语熟语单位研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前10条
1 樊立三;现代汉语语文辞书词性标注研究[D];鲁东大学;2006年
2 图格木勒;蒙古语语言资源库建设相关技术研究[D];内蒙古大学;2007年
3 刘曼;对外汉语教学中的词类体系和词性标注[D];辽宁师范大学;2004年
4 齐艳艳;《现代汉语词典》单音节副词词性标注、释义及条目分立考察[D];北京语言大学;2004年
5 段倩倩;面向信息处理的带典型前缀派生词的识别分析[D];上海师范大学;2010年
6 普布旦增;藏文自动分词技术方法研究[D];西藏大学;2010年
7 袁伟;现代汉语词典标注词性之比较与批评[D];苏州大学;2006年
8 牛书田;对外汉语教材中的词汇处理分析研究[D];山东大学;2008年
9 谢小凤;现代诗歌节奏的计算机自动分析[D];广西民族大学;2012年
10 刘阳;“隐性小词表+专业小词库”的自动分词技术研究[D];湖南师范大学;2007年
中国重要报纸全文数据库 前4条
1 教育部语信司;语言资源监测与服务论坛举行[N];语言文字周报;2010年
2 语言所 董琨;错误百出 贻笑大方[N];中国社会科学院院报;2004年
3 教育部语言文字信息管理司司长李宇明;语言文字工作应当与时俱进[N];中国教育报;2001年
4 教育部语信司;国家语言资源监测与研究中心召开2007数据发布专题研讨会[N];语言文字周报;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978