基于k-近邻法的雷暴预报
【摘要】:本文将模式识别方法中的k-近邻法应用在南京地区雷暴预报中,为雷暴预报提供新的预报方法。k-近邻法目前已应用在了对降水、云量和温度等方面的研究,并取得了较好的预报效果。k-近邻法的基本思想是,大量历史样本集中的每个样本都作为一个模板,利用未知样本与每个模板做比较,找到最为相似(即为近邻)的k个模板,根据这k个模板的类别判断未知样本的类别,本研究将这一基本思想运用在对雷暴天气的识别中。首先,利用江苏省2008、2009和2010年6-8月闪电定位资料确定雷暴过程,并利用同一时段的探空资料计算了47个常用对流参数,分别分析了47个参数与雷暴活动的相关性,筛选出17个与雷暴相关性较好的对流参数(相关系数大于0.3)作为雷暴的预报因子。在此基础上,采用逐步选择法进一步筛选出大气可降水量pw、抬升指数li、瑞士雷暴指数swiss、低空3-6km风速差SPD 63、莱克力指数Tm j5个预报因子。其次,将未知样本依据这5个预报因子映射到一个5维的空间中,利用欧氏距离法计算与未知样本最为相似的k个近邻样本,并根据k个样本的类别判断未知样本的类别。k的取值应为奇数,从而避免出现两种类别个数相等时无法决策的情况。通过选取不同的k值对历史样本进行预报,根据TS技术评分结合虚警率和失误率选取最优的k值。结果表明,当k值为3时,历史样本的预报技术评分TS可达0.6759,并且虚警率和失误率最低。然后,通过独立样本检验k-近邻法的预报效果,在k值为3的情况下,雷暴预报的TS技术评分为0.60,预报准确率为79.22%,失误率为21.79%,虚警率为19.73%。最后,将赵旭寰利用神经网络法和张祎利用支持向量机建立的雷暴预报模型的预报结果与本文利用k-近邻法建立的雷暴预报模型的预报效果进行了对比,结果表明,在TS评分相当的情况下,k-近邻法与支持向量机相比具有较低的失误率和较高的击中率及预报准确率,而神经网络的失误率、击中率和预报准确率均优于k-近邻法,但神经网络具有较高的虚警率。由此可见k-近邻法对雷暴天气具有较好的预报效果。在下一步的研究中,可以考虑使用k-近邻法的衍生算法作为预报方法,并继续扩大样本,提高预测的准确性和增强模型的稳定性。