FSC——利用频繁项集挖掘估算视图大小
【摘要】:OLAP系统中经常要在大规模数据库上进行复杂查询.为了提高查询响应速度,往往要事先物化一些视图.在考虑选择物化哪些视图时,必须首先解决视图大小的估算问题.目前,对于视图大小的估算,主要有两种方法:一种是利用概率模型和数学估算的方法;另一种是假定数据符合某种特定的分布模型.通过采样确定模型的参数,并将其推广到整个数据集进行估算.提出了一种视图估算的新方法FSC,引入了频繁项集挖掘的思想,在扫描两次数据库后可以得到cube中所有视图大小的估算值.实验证明,与同类算法相比,FSC的精度有较大地提高,特别是针对倾斜度较大的数据集.
【相似文献】 | ||
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|
|
|||||||||||||||||||||
|