收藏本站
《第一届学生计算语言学研讨会论文集》2002年
收藏 | 手机打开
二维码
手机客户端打开本文

词性标注规则的获取和优化

陈文亮  朱靖波  吕学强  姚天顺  
【摘要】:本文提出一种词性标注规则自动学习算法。通过对规则进行评价、优化,有效提高标注正确率和标注效率。系统对PFR标注语料库(98年1月)进行标注,相对于NA假设的词性兼类消歧模型标注结果,封闭测试正确率提高了5.53%,开放测试提高了4.57%。

手机知网App
【参考文献】
中国期刊全文数据库 前4条
1 魏欧,孙玉芳;基于非监督训练的汉语词性标注的实验与分析[J];计算机研究与发展;2000年04期
2 李晓黎,史忠植;用数据采掘方法获取汉语词性标注规则[J];计算机研究与发展;2000年12期
3 周明,吴进,黄昌宁;用于词性标注的一种快速学习算法──对Brill的基于变换算法的一项改进[J];计算机学报;1998年04期
4 魏欧,吴健,孙玉芳,sonata.iscas.ac.cn;基于统计的汉语词性标注方法的分析与改进[J];软件学报;2000年04期
【共引文献】
中国期刊全文数据库 前10条
1 胡锡衡;;垃圾邮件过滤系统模型的研究与设计[J];鞍山师范学院学报;2009年02期
2 赵红丹;王希杰;;基于隐马尔科夫模型的词性标注[J];安阳师范学院学报;2010年05期
3 高波,眭莉;基于粗糙集的网页训练样本集的分类属性的选择[J];常州工学院学报;2004年02期
4 钱揖丽,郑家恒;中文文本词性自动校对系统的实现[J];电脑开发与应用;2004年01期
5 陈敏杰;;问答系统中问题分析模块的实现[J];经营管理者;2009年13期
6 胡锡衡;;径向基函数在文本分类中的应用[J];鞍山师范学院学报;2011年02期
7 王忠林;赵启阳;尹宝林;;基于确定信息的直接语法分析[J];中北大学学报(自然科学版);2008年02期
8 王广正;王喜凤;;一种基于规则优先级的词性标注方法[J];安徽工业大学学报(自然科学版);2008年04期
9 魏欧,孙玉芳;基于非监督训练的汉语词性标注的实验与分析[J];计算机研究与发展;2000年04期
10 王东海;赵伟;陈洁;梁贺;;基于隐Markov模型汉语词性自动标注的若干分析与改进[J];长春工业大学学报(自然科学版);2007年01期
中国重要会议论文全文数据库 前6条
1 隋岩;张普;;基于“动态流通语料库”进行“有效字符串”提取的初步研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
2 张艳;徐波;;基于转换的错误学习方法的汉语词性自动标注研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
3 吴云鹏;昝红英;;基于错误驱动的现代汉语方位词用法规则的自动更新[A];第五届全国青年计算语言学研讨会论文集[C];2010年
4 赵伟;王美艳;刘闯;;基于古汉语语料数据库词的划分方法研究与探索[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
5 艳红;王斯日古楞;;蒙古文词语切分在自动词性标注中的应用[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
6 于江德;王希杰;樊孝忠;;汉语词法分析中上文和下文孰重孰轻[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
中国博士学位论文全文数据库 前3条
1 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
2 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
3 李晓黎;WEB信息检索与分类中的数据采掘研究[D];中国科学院研究生院(计算技术研究所);2001年
中国硕士学位论文全文数据库 前10条
1 苏俊峰;基于HMM的藏语语料库词性自动标注研究[D];西北民族大学;2010年
2 黄元萃;汉语基本名词短语的自动识别模型[D];大连理工大学;2001年
3 张丽静;规则与统计相结合的兼类词处理机制[D];大连理工大学;2002年
4 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
5 钱揖丽;中文文本分词及词性标注自动校对方法研究[D];山西大学;2003年
6 黄海英;基于概念空间的文本分类的应用研究[D];广西师范大学;2002年
7 段建勇;现代汉语词性细分类标注研究[D];山西大学;2004年
8 禤毅良;电子商务智能推荐系统研究[D];广东工业大学;2004年
9 张虎;汉语语料库词性标注一致性检查及自动校对方法研究[D];山西大学;2005年
10 温锐;中文命名实体识别及其关系抽取研究[D];苏州大学;2005年
【二级参考文献】
中国期刊全文数据库 前3条
1 周强;;基于语料库和面向统计学的自然语言处理技术[J];计算机科学;1995年04期
2 周强;规则和统计相结合的汉语词类标注方法[J];中文信息学报;1995年03期
3 魏欧,吴健,孙玉芳,sonata.iscas.ac.cn;基于统计的汉语词性标注方法的分析与改进[J];软件学报;2000年04期
【相似文献】
中国期刊全文数据库 前10条
1 李海波;;手工分词和词性标注的问题[J];现代语文(语言研究版);2010年07期
2 黄昌宁,孙茂松;中文信息处理最新成果的检阅——记新加坡中文电脑国际会议ICCC’96[J];当代语言学;1996年04期
3 刘云;俞士汶;;“句管控”与中文信息处理[J];汉语学报;2004年02期
4 温锁林;;从词性标注看小句的中枢地位[J];汉语学报;2004年01期
5 刘云;;“中文信息处理”课程教学改革探索[J];江汉大学学报(社会科学版);2008年01期
6 李琼;李志;;基于词性信息自动识别和标注非分句[J];长春工程学院学报(社会科学版);2011年01期
7 张普;中文信息处理专题研究 主持人的话[J];语言文字应用;2000年02期
8 孙茂松;语言计算:信息科学技术中长期发展的战略制高点[J];语言文字应用;2005年03期
9 黄昌宁;统计语言模型能做什么?[J];语言文字应用;2002年01期
10 马宏基;;对外汉语教材中兼类词的标注问题[J];科学决策;2008年10期
中国重要会议论文全文数据库 前10条
1 陈文亮;朱靖波;吕学强;姚天顺;;词性标注规则的获取和优化[A];第一届学生计算语言学研讨会论文集[C];2002年
2 赵大明;;关于《现代汉语规范字典》的词性标注[A];中国辞书论集1999[C];1999年
3 邢富坤;宋柔;;自动词性标注中语法因素和词汇因素对英汉语的不同影响[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 林红;胡欣;;最大熵模型的应用[A];新世纪气象科技创新与大气科学发展——中国气象学会2003年年会“地球气候和环境系统的探测与研究”分会论文集[C];2003年
5 罗雪兵;黄德根;周惠巍;李丽双;;基于组合方法的组块识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
6 李红印;;颜色词的收词、释义和词性标注[A];中国辞书论集2001[C];2001年
7 钱揖丽;张虎;;汉语分词及词性标注自动校验方法研究[A];第一届学生计算语言学研讨会论文集[C];2002年
8 靳光瑾;郭曙纶;肖航;章云帆;;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[A];语言文字应用研究论文集(Ⅱ)[C];2004年
9 郭锐;;语文词典的词性标注问题[A];中国辞书学文集[C];1998年
10 毛永波;;辞书的词义解释和词性标注[A];中国辞书学文集[C];1998年
中国重要报纸全文数据库 前10条
1 北京师范大学,辽宁师范大学 刁晏斌;引入现代汉语史的观念[N];社会科学报;2007年
2 教育部语言文字信息管理司司长、党支部书记 李宇明;不断完善语言文字规范体系,构建和谐语言生活[N];中国教育报;2007年
3 教育部语信司;《规范汉字表》课题通过结项鉴定[N];语言文字周报;2006年
4 黑龙江省语言文字工作委员会 孟广智;与时俱进开发汉语拼音功能[N];黑龙江日报;2008年
5 于伟;推进语言文字规范化标准化信息化[N];中国教育报;2006年
6 王铁琨;中国辞书的“强国梦”还有多远[N];中华读书报;2006年
7 张青;基于汉字的汉语信息语法研究[N];中华读书报;2008年
8 本报评论员;大力推行汉语拼音[N];人民日报;2003年
9 赤峰市语委;为什么要开展城市语言文字工作评估[N];赤峰日报;2006年
10 ;中国文化发展史上的一件大事[N];中国教育报;2003年
中国博士学位论文全文数据库 前10条
1 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
2 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
3 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
4 周卫华;面向中文信息处理的现代汉语动宾语义搭配研究[D];华中师范大学;2007年
5 屈刚;英汉双语短语对齐[D];上海交通大学;2007年
6 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
7 朱聪慧;汉英动词次范畴相关技术的研究[D];哈尔滨工业大学;2009年
8 冯敏萱;论汉英平行语料的平行处理[D];南京师范大学;2006年
9 李琼;汉语复句书读前后语言片段的非分句识别[D];华中师范大学;2008年
10 吕艳辉;基于语料库的现代汉语手部动词研究[D];山东大学;2008年
中国硕士学位论文全文数据库 前10条
1 傅成宏;现代汉语兼语结构的自动识别[D];南京师范大学;2007年
2 樊立三;现代汉语语文辞书词性标注研究[D];鲁东大学;2006年
3 刘桂梅;周有光语文改革思想研究[D];山东师范大学;2005年
4 图格木勒;蒙古语语言资源库建设相关技术研究[D];内蒙古大学;2007年
5 钱小飞;含“的”最长名词短语的自动识别[D];南京师范大学;2007年
6 柏晓鹏;汉语中介语文本词语级错误的自动查错研究及其实现—AECIT[D];南京师范大学;2007年
7 罗万;基于生成性词库分词技术的汉语拼音自动转换研究[D];湖南师范大学;2009年
8 刘曼;对外汉语教学中的词类体系和词性标注[D];辽宁师范大学;2004年
9 谢小凤;现代诗歌节奏的计算机自动分析[D];广西民族大学;2012年
10 齐艳艳;《现代汉语词典》单音节副词词性标注、释义及条目分立考察[D];北京语言大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026