收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于组合方法的组块识别

罗雪兵  黄德根  周惠巍  李丽双  
【摘要】:给出了一种词性扩展与 voting 法结合的汉语组块识别方法(简称组合方法)。首选比较了特殊隐马尔可夫、SVM、CRF 三种统计学习方法在组块识别上的效果。为了改善识别效果,对语料中的特殊符号、并列关系以及较粗的词性进行了词性扩展,并采用了一种基于标点符号分割段的 voting 方法。实验表明,三个基本模型中 CRF 识别效果最好,而组合方法能进一步提高组块识别的精确率、召回率、F 值。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 孙茂松;语言计算:信息科学技术中长期发展的战略制高点[J];语言文字应用;2005年03期
2 张普;中文信息处理专题研究 主持人的话[J];语言文字应用;2000年02期
3 刘云;;“中文信息处理”课程教学改革探索[J];江汉大学学报(社会科学版);2008年01期
4 齐言;《信息处理用现代汉语港台词语集》通过专家技术鉴定[J];语文建设;1992年09期
5 葛伟;;从计算机自动分词的障碍谈汉语书面语改革[J];语文学刊;2008年02期
6 丁俊苗;;面向中文信息处理的标点符号研究[J];江苏广播电视大学学报;2008年06期
7 年玉萍;;中文信息处理与现代汉语语法[J];时代文学(下半月);2009年01期
8 谭晓平;;从中文信息处理角度看《新著国语文法》[J];三峡大学学报(人文社会科学版);2010年02期
9 王宁;;多音节新词语构词规则初探[J];现代语文(语言研究版);2011年04期
10 吕叔湘;怎样解决中文信息处理中的繁简对换问题[J];语文建设;1991年04期
11 胡瑞昌;时代呼唤着“中文信息处理用拼音文字”国家标准的出台[J];嘉应大学学报;1996年04期
12 黄昌宁,孙茂松;中文信息处理最新成果的检阅——记新加坡中文电脑国际会议ICCC’96[J];当代语言学;1996年04期
13 张普;中文信息处理专题研究 6 语义研究[J];语言文字应用;1998年02期
14 ;中文信息处理中的语言难题征答[J];语言文字应用;1998年04期
15 郭曙纶;汉语计算语义理论及其原则[J];韶关学院学报;2002年06期
16 张剑;论用HNC理论进行中文信息处理与知识处理[J];湘南学院学报;2004年06期
17 孙道功;;20世纪90年代以来计算语言学的成就及其反思[J];语文学刊;2006年17期
18 翁宏伟;;中文信息处理中歧义及歧义自动识别方法的比较[J];现代语文(语言研究版);2006年12期
19 周卫华;;从中文信息处理的角度看动宾语义关系的分类[J];湖北社会科学;2007年05期
20 沈威;;“句管控”理论在分词和标注中的应用[J];语言研究;2010年01期
中国重要会议论文全文数据库 前10条
1 罗雪兵;黄德根;周惠巍;李丽双;;基于组合方法的组块识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 钟立军;李茹;彭洪保;;基于汉语多词块的语料库研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
3 陈文亮;朱靖波;吕学强;姚天顺;;词性标注规则的获取和优化[A];第一届学生计算语言学研讨会论文集[C];2002年
4 孙宏林;俞士汶;;浅层句法分析方法概述[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
5 李毅;亢世勇;孙茂松;孙道功;;基于奥运语料的语义成分标注规范[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 李竹;;中文信息处理与现代汉语词类研究[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
7 陈晓;靳光瑾;黄昌宁;;基于字的分词方法的实验研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
8 乐明;冯志伟;;RST的理论发展和工程应用综述[A];第二届全国学生计算语言学研讨会论文集[C];2004年
9 徐德宽;;现代汉语双宾构造中两个宾语的题元角色[A];第六届汉语词汇语义学研讨会论文集[C];2005年
10 俞士汶;王治敏;朱学锋;;文学语言与自然语言理解研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年
2 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
3 周卫华;面向中文信息处理的现代汉语动宾语义搭配研究[D];华中师范大学;2007年
4 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
5 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
6 李琼;汉语复句书读前后语言片段的非分句识别[D];华中师范大学;2008年
7 吕艳辉;基于语料库的现代汉语手部动词研究[D];山东大学;2008年
8 陈慧;基于DCC动态流通语料库的中文组织名考察与研究[D];北京语言大学;2008年
9 尹蔚;多维视域下的有标选择复句研究[D];华中师范大学;2008年
10 罗进军;有标假设复句研究[D];华中师范大学;2007年
中国硕士学位论文全文数据库 前10条
1 傅成宏;现代汉语兼语结构的自动识别[D];南京师范大学;2007年
2 刘桂梅;周有光语文改革思想研究[D];山东师范大学;2005年
3 钱小飞;含“的”最长名词短语的自动识别[D];南京师范大学;2007年
4 柏晓鹏;汉语中介语文本词语级错误的自动查错研究及其实现—AECIT[D];南京师范大学;2007年
5 罗万;基于生成性词库分词技术的汉语拼音自动转换研究[D];湖南师范大学;2009年
6 孙昂;基于句法分析和机器学习的中文自动问答系统研究[D];清华大学;2007年
7 洪鹿平;汉语复句关系自动判定研究[D];南京师范大学;2008年
8 骆彬;汉语新词语辅助识别系统的研制[D];中国社会科学院研究生院;2003年
9 陈林;基于特征提取和机器学习的现代汉语人称指示代词消解研究[D];清华大学;2007年
10 陈锋;对外汉语教材编写辅助系统的设计与实现[D];南京师范大学;2008年
中国重要报纸全文数据库 前10条
1 北京师范大学,辽宁师范大学 刁晏斌;引入现代汉语史的观念[N];社会科学报;2007年
2 教育部语言文字信息管理司司长、党支部书记 李宇明;不断完善语言文字规范体系,构建和谐语言生活[N];中国教育报;2007年
3 教育部语信司;《规范汉字表》课题通过结项鉴定[N];语言文字周报;2006年
4 于伟;推进语言文字规范化标准化信息化[N];中国教育报;2006年
5 黑龙江省语言文字工作委员会 孟广智;与时俱进开发汉语拼音功能[N];黑龙江日报;2008年
6 王铁琨;中国辞书的“强国梦”还有多远[N];中华读书报;2006年
7 张青;基于汉字的汉语信息语法研究[N];中华读书报;2008年
8 ;中国文化发展史上的一件大事[N];中国教育报;2003年
9 本报评论员;大力推行汉语拼音[N];人民日报;2003年
10 赤峰市语委;为什么要开展城市语言文字工作评估[N];赤峰日报;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978