一种多维数据的离群点检测算法
【摘要】:现有的离群点检测算法大多对于低维数据的检测是有效的,且只能发现离群点,而不能对其含义进行解释。提出一种多维数据的离群点检测算法,该算法中离群点的定义是基于主次属性的。该算法首先使用k-均值聚类算法,将数据集划分成子数据块,在每个子数据块中根据基于主次属性的离群点的定义来识别出离群点,并能判定是否是噪声。该定义体现了"局部"的概念,所以能很好地解释离群点的含义。最后通过仿真实验说明该算法对多维数据的离群点检测是高效的。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||
|