基于特征项权重改进的关联文本分类
【摘要】:ARC-BC是目前已知的分类效果最好的关联规则分类算法.但是,无论是ARC-BC还是其他的文本关联分类算法都是以规则的置信度为分类准则,完全忽略了特征项的权重,这导致了关联文本分类算法的性能较差.为此利用特征项权重定义了规则和文本的匹配度,以之作为关联分类器的分类标准,并在ARC-BC的基础上进行改进,提出了新的关联文本分类算法FWARC(feature weight—basedARC).实验结果表明,FWARC是行之有效的,能够提高分类器的分类能力.
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|