一种基于语义概念的中文文本分类方法
【摘要】:本文从Web文本自动分类的需求出发,针对基于VSM(VectorSpaceModel)模型的分类处理中词的无关性假设及词的维数过高等问题,结合Hownet,提出一种基于语义概念的中文文本分类方法。通过语义概念分析可以达到对传统词特征向量的排歧和降维,并在此基础上对文本进行分类处理。本文提出并实现一个基于SVM(SupportVectorMachines)中文文本分类的原型系统,对中等规模的文本语料库的实验表明,本系统是有效的。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||
|