一种改进的中文层次句法分析模型研究
【摘要】:首先提出了层次句法分析模型,该模型先对输入句子进行词性标注和基本组块识别,紧接着循环多次进行复杂组块识别直至得到根结点。该方法本质上属于一种基于移进-归约序列的句法分析模型,因此具有此类模型的各类优点;然后,本文分析了移进-归约句法分析模型中存在的潜在问题,并通过在产生式(LHS→RHS)概率模型中引入RHS的分值,进一步提高系统性能。基于CTB2.0的实验表明,在正确分词情况下,RHS分值的引入进一步提高了层次分析模型的性能(对长度≤40的句子F1值提高1.2),F1值达到81.2。
【相似文献】 | ||
|
|||||
|
|
|||
|