收藏本站
《2015年(第四届)全国大学生统计建模大赛论文》2015年
收藏 | 手机打开
二维码
手机客户端打开本文

医保欺诈行为的主动发现

金华  黄陆志  邵悦涵  赵文斐  
【摘要】:本文的数据来源于2015年深圳杯数学建模竞赛的A题。数据共有6个表格,包含了2014年1月1日到2014年1月31日内到深圳医院就医的病人资料以及他们详细的就医行为记录。数据集中未提供相关属性说明该参保人是否存在医保欺诈的行为。本文首先对所提供的数据进行了预处理(包括数据集成,数据清洗和数据整合),结合处理后的数据,对数据进行统计汇总、可视化分析。在对数据有初步的掌握下,为了识别数据集中可能存在的医保欺诈记录,本文根据以下三个步骤建立了识别预测模型:步骤一中首先通过两步聚类法,根据病人的就医行为,选取年龄、就医费用、就医次数等相关属性,对就医人群进行聚类,然后运用多维空间基于聚类的诊断方法判别出各类的异常点,找出存在异常就医行为的病人记录。步骤二在步骤一中所识别出来存在异常就医行为病人的基础上,对其进行K-means聚类分析,找出不同类群的异常就医行为的病人行为特征,并定义医保欺诈手段,从而识别出存在医疗保险欺诈的类群,并从中定义了本文研究医保欺诈的三种手段,即包括参保人频繁到医院就医,超量购药;购买的药物类型与所属的年龄段不相符;几名参保人组成一个团伙,经常在同一时间到医院频繁刷卡,开取昂贵药,且开取的药物药效相似。步骤三根据步骤二中对病人是否存在医保欺诈行为的判断结果,运用C5.0决策树算法,建立了一个识别某位病人在一段时间内是否存在医保欺诈行为的判别分类模型。综合以上三个步骤,结合SPSS Modeler14.1、SQL Server 2008 R2等软件,对医保数据进行了多角度的分析,并给出了基于参保人行为特征的医保欺诈行为主动发现的模型,找出数据集中可能出现的欺诈记录。
【作者单位】:华南师范大学 华南师范大学数学科学学院
【分类号】:F842.684;F224

中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026