基于核主成分分析的文本分类
【摘要】:主成分分析是模式识别中经典的降维技术。本文尝试把它的一个变种算法——核主成分分析,与k-NN分类模型结合,应用到文本分类中。核主成分分析方法通过选择合适的核函数,利用词之间的高阶的关系进行特征抽取。实验结果表明,核主成分分析在英文语料reuters21578上达到了潜在语义索引分类性能,而在中文863评测语料上微平均F1值比潜在语义索引高2%。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||
|
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||
|