收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

汉语base NP识别:错误驱动的组合分类器方法

徐昉  宗成庆  
【摘要】:本文采用一种新的错误驱动的组合分类器方法来实现汉语base NP(base noun phrase)识别。本文首先对汉语和英语 base NP识别技术现状进行了综述和分析,明确了汉语base NP的含义,提出了错误驱动的组合分类器方法,然后,在对比两种不同类型的分类器——基于转化的方法和条件随机场分类结果的基础上,再利用支持向量机学习其中的错误规律,对两种分类器产生的不同结果进行纠错,从而达到提高系统整体性能的效果。在宾州汉语树库转化得到的base NP语料集上进行汉语base NP识别交叉验证的实验,与使用基于转化的方法,条件随机场以及支持向量机的方法相比较,实验结果都有所提高,F值达到了89.72%,相对于文中其他方法,最大提高了2.35%。

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 黄成哲,张晓光,李向宏,王丁;英文句子边界自动识别[J];微处理机;2003年01期
2 阴晋岭;王惠临;;词性标注的方法研究——结合条件随机场和基于转换学习的方法进行词性标注[J];现代图书情报技术;2009年03期
3 李荣;郑家恒;;汉语NP识别方法的实验比较研究[J];河南师范大学学报(自然科学版);2007年03期
4 张春祥;梁颖红;于林森;;从双语语料中获取翻译模板[J];计算机工程与应用;2010年01期
5 李荣;郑家恒;;三种方法的NP识别比较实验研究[J];通化师范学院学报;2007年04期
6 张春祥;梁颖红;于林森;;基于错误驱动的翻译模板自动获取[J];计算机科学;2010年07期
7 徐昉;宗成庆;王霞;;中文Base NP识别:错误驱动的组合分类器方法[J];中文信息学报;2007年01期
8 王蕾;李培峰;朱巧明;杨季文;;一种基于框架结构的专有名词自动识别方法[J];计算机工程与科学;2007年07期
9 黄德根,岳函,李丽双;开放式汉语自动分词的学习机制[J];小型微型计算机系统;2005年08期
10 王蕾;杨季文;;汉语未登录词识别现状及一种新识别方法介绍[J];计算机应用与软件;2007年08期
11 王蕾;朱巧明;李培峰;杨季文;;基于实例和错误驱动的规则学习方法及其应用[J];计算机应用与软件;2008年01期
12 邬桐;周雅倩;黄萱菁;吴立德;;自动构建时间基元规则库的中文时间表达式识别[J];中文信息学报;2010年04期
13 王达;张坤;;基于支持向量机和转换的错误驱动学习方法的组块识别[J];南阳师范学院学报;2009年06期
14 王昀,苑春法;基于转换的时间-事件关系映射[J];中文信息学报;2004年04期
15 杨莉;葛建新;;解释与智能系统[J];计算机科学;1994年02期
16 夏新松;肖建国;;一种新的错误驱动学习方法在中文分词中的应用[J];计算机科学;2006年03期
17 梁妍;朱耀庭;;错误驱动学习在未登录词词性标注中的应用[J];计算机工程与设计;2008年06期
18 李群;;文本分词的自动校对[J];渤海大学学报(自然科学版);2006年03期
19 ;硬件[J];电脑爱好者;2008年22期
20 宋立峰;;中文分词算法在专利文献中的应用研究[J];海峡科学;2011年07期
中国重要会议论文全文数据库 前10条
1 徐昉;宗成庆;;汉语base NP识别:错误驱动的组合分类器方法[A];第三届学生计算语言学研讨会论文集[C];2006年
2 吴云鹏;昝红英;;基于错误驱动的现代汉语方位词用法规则的自动更新[A];第五届全国青年计算语言学研讨会论文集[C];2010年
3 朱莉;孟遥;赵铁军;李生;;英语句子边界的识别[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
4 张艳;徐波;;基于转换的错误学习方法的汉语词性自动标注研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
5 刘方舟;周游;陶建华;;用CART模型指导TBL算法预测语调短语[A];第十一届全国人机语音通讯学术会议论文集(二)[C];2011年
6 刘方舟;周游;陶建华;;用CART模型指导TBL算法预测语调短语[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
7 潘文锋;王斌;于满泉;谭松波;;Winnow算法在垃圾邮件过滤中的应用[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
8 王晶;郑德权;赵铁军;王忠建;;基于TBL的日文名实体识别后处理技术[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
9 袁彩霞;王小捷;;基于受限最大熵模型的汉语词性标注的研究[A];第三届学生计算语言学研讨会论文集[C];2006年
10 陈琳;;类别学习中的阻碍效应研究[A];第十二届全国心理学学术大会论文摘要集[C];2009年
中国博士学位论文全文数据库 前1条
1 贺瑞芳;时序多文档文摘相关技术研究[D];哈尔滨工业大学;2009年
中国硕士学位论文全文数据库 前10条
1 王蕾;基于转换学习的专有名词识别[D];苏州大学;2006年
2 王莹;基于错误驱动的汉语词性标注研究[D];北京邮电大学;2007年
3 邬桐;中文时间表达式识别研究[D];复旦大学;2010年
4 成姣;日语依存句法分析技术研究[D];沈阳航空航天大学;2011年
5 胡永华;英文译文质量自动评测技术的研究[D];沈阳航空工业学院;2010年
6 李丹;基于规则与统计的汉语自动分词研究[D];长春工业大学;2010年
7 祖丽皮亚·买买提明;维吾尔语基本动词短语自动识别研究[D];北京邮电大学;2012年
8 李波;基于自主推理的中文命名实体识别方法研究[D];西北大学;2012年
9 周溢辉;基于规则与统计的语气词用法自动识别研究[D];郑州大学;2011年
10 王金勇;基于动词次范畴化的汉语句法分析后处理方法的研究[D];黑龙江大学;2011年
中国重要报纸全文数据库 前2条
1 高树林 于东;专家坐堂之整机·外设[N];电脑报;2004年
2 小丽;扫描仪常见故障[N];山西科技报;2000年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978