汉语base NP识别:错误驱动的组合分类器方法
【摘要】:本文采用一种新的错误驱动的组合分类器方法来实现汉语base NP(base noun phrase)识别。本文首先对汉语和英语 base NP识别技术现状进行了综述和分析,明确了汉语base NP的含义,提出了错误驱动的组合分类器方法,然后,在对比两种不同类型的分类器——基于转化的方法和条件随机场分类结果的基础上,再利用支持向量机学习其中的错误规律,对两种分类器产生的不同结果进行纠错,从而达到提高系统整体性能的效果。在宾州汉语树库转化得到的base NP语料集上进行汉语base NP识别交叉验证的实验,与使用基于转化的方法,条件随机场以及支持向量机的方法相比较,实验结果都有所提高,F值达到了89.72%,相对于文中其他方法,最大提高了2.35%。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||
|
|
|||||||||||||||||||||
|
|
|||||
|