汉语自动分词中的上下文相关歧义字段(CSAS)研究
【摘要】:上下文相关歧义字段(CSAS)的处理是汉语自动分词中的难题之一。本文对收集到的CSAS逐个进行了研究,提出了“人脑认定+语料库验证”的提取方法以及基本词表、校正词表和规则库互动的处理手段,其中不相邻条件匹配的越过规则可解决统计方法难以解决的问题。测试结果表明,该方法是有效的。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||
|
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||
|