收藏本站
《2017年(第五届)全国大学生统计建模大赛获奖论文选》2017年
收藏 | 手机打开
二维码
手机客户端打开本文

基于XGBoost的信用评分预测模型

陈耀飞  陈逸杰  李铭  
【摘要】:2017年央行将防范金融风险作为今年的第三大任务,在此背景下,作为一个金融市场发展尚未成熟的国家,做好信用评估势在必得。信用评分模型在传统金融业已经较为成熟,但是随着大数据时代的到来和互联网金融的转型,大数据思维下的信用评分模型也要随之改变。平安集团下的前海征信企业有着大量的用户个人信用相关信息。对其提供的4万条脱敏数据,本文使用大数据技术进行分析和研究。由于数据量庞大、缺失值多、稀疏度和维度高等特点,本文首先采用个案剔除和均值填充的组合方法处理缺失值,然后利用Boruta特征选择法来降维。接着运用XGBoost算法集成CART弱学习器,建立信用评分模型,期间选择AUC值作为评优准则,设定目标函数为logistic函数,并对样本进行子采样和对目标函数加入正则化系数来防止模型过拟合。最终通过对比传统Logistic回归法和GBDT算法,发现XGBoost的测试AUC最好(AUC=0.7040),训练耗时最短(Time=18.59s),体现该模型的优越性。此外模型得到了各变量的相对重要性排序,User Inofo_130,User Inofo_113和User Inofo_197等特征变量相对重要性最高,需要进行重点业务分析。本文为前海征信企业提供了大数据技术下的信用评分模型,并且选取了重要业务变量,具有较强的实用性和推广性。
【作者单位】:南京邮电大学
【分类号】:F832.4

【相似文献】
中国期刊全文数据库 前10条
1 李庆;Liang Steven Y.;;非凸罚正则化稀疏低秩矩阵的大型减速机圆锥滚子轴承微弱故障诊断[J];机械工程学报;年期
2 魏彩锋;孙永聪;曾宪华;;图正则化字典对学习的轻度认知功能障碍预测[J];智能系统学报;2019年02期
3 汪丽华;涂铮铮;王泽梁;;基于流形正则化随机游走的图像显著性检测[J];激光与光电子学进展;年期
4 李彦;邓承志;汪胜前;朱慧琦;;基于简单L_(1/2)稀疏正则化的高光谱混合像元分解[J];江西科技师范大学学报;2016年06期
5 郭威;徐涛;汤克明;于建江;;具有广义正则化与遗忘机制的在线贯序超限学习机[J];控制与决策;2017年02期
6 郭威;徐涛;于建江;汤克明;;二维分割贯序正则化超限学习机[J];控制与决策;2017年09期
7 陈晓;张磊;郭曼;葛坤朋;王彦国;;大地电磁测深和重力数据同步正则化联合反演[J];科学技术与工程;2016年08期
8 田福志;洪祖江;张纯;宋固全;;L_(1/2)范数正则化模型修正方法在结构损伤识别中的应用[J];南昌大学学报(理科版);2016年02期
9 于涛;;双感应测井资料自适应正则化反演[J];东北石油大学学报;2016年03期
10 徐玉聪;赵宁;秦策;王锐;张召彬;;大定源瞬变电磁一维自适应正则化反演[J];地质与勘探;2015年02期
中国重要会议论文全文数据库 前10条
1 陈耀飞;陈逸杰;李铭;;基于XGBoost的信用评分预测模型[A];2017年(第五届)全国大学生统计建模大赛获奖论文选[C];2017年
2 毛玉明;郭杏林;吕洪彬;;动载荷反演问题的正则化求解[A];第18届全国结构工程学术会议论文集第Ⅰ册[C];2009年
3 汪驰升;丁晓利;单新建;;大地测量数据地震滑动分布反演的非均匀正则化研究[A];2015中国地球科学联合学术年会论文集(二十四)——专题56空间大地测量与地壳动力学[C];2015年
4 王彦飞;;地球物理数值反演问题的最优化和正则化理论与方法[A];中国地球物理学会第二十七届年会论文集[C];2011年
5 傅向华;王志强;赵良辉;杜文峰;;基于拉普拉斯流形正则化的半监督图像检索[A];第四届和谐人机环境联合学术会议论文集[C];2008年
6 解凯;吕妍昱;;一种高效的正则化参数估计算法[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(上册)[C];2008年
7 张意;张卫华;陈虎;周激流;;基于分数阶自适应正则化的统计迭代重建方法[A];第十四届中国体视学与图像分析学术会议论文集[C];2015年
8 张煜东;吴乐南;;基于CTLS与各向异性正则化的光流估计方法[A];第十四届全国图象图形学学术会议论文集[C];2008年
9 曹艳平;季湘樱;冯西桥;;压痕实验确定黏弹性材料的正则化松弛模量[A];中国力学学会学术大会'2009论文摘要集[C];2009年
10 刘晓芳;徐文龙;陈永利;;基于非二次正则化的并行磁共振图像保边性重建[A];浙江生物医学工程学会第九届年会论文汇编[C];2011年
中国博士学位论文全文数据库 前10条
1 丁转莲;基于图正则化的复杂网络社团检测研究[D];安徽大学;2018年
2 王梅;正则化路径上的支持向量机模型组合[D];天津大学;2013年
3 吴磊;(?)_p正则化问题的算法研究[D];湖南大学;2013年
4 薛晖;分类器设计中的正则化技术研究[D];南京航空航天大学;2008年
5 徐晓琳;面向大规模数据分析与分类的正则化回归算法[D];安徽大学;2017年
6 王文娟;地球物理反演中病态矩阵方程正则化解算方法研究[D];成都理工大学;2010年
7 王振杰;大地测量中不适定问题的正则化解法研究[D];中国科学院研究生院(测量与地球物理研究所);2003年
8 巴拉卡,雅各布Maiseli(Baraka Jacob Maiseli);基于正则化的非线性扩散模型的超分辨率方法[D];哈尔滨工业大学;2015年
9 刘小兰;基于图和熵正则化的半监督分类算法[D];华南理工大学;2011年
10 刘兵;基于聚类与流形正则化的分类方法研究[D];中国矿业大学;2013年
中国硕士学位论文全文数据库 前10条
1 孙琦;基于正则化滤波和奇异值分解的条纹模式方向估计和滤波方法研究[D];山东大学;2018年
2 郭善亮;自正则化随机和的鞍点近似[D];苏州大学;2017年
3 翟冬灵;基于图正则化降维的人脸识别算法研究[D];扬州大学;2017年
4 谢林林;一种快速求解L_(1/2)正则化问题的新算法[D];大连理工大学;2014年
5 林文东;基于统一框架结构的正则化地球物理反演研究[D];东华理工大学;2014年
6 陶一鑫;基于正则化的投资组合分析[D];浙江工商大学;2014年
7 冯宝宾;不适定问题的正则化解算方法设计及应用[D];成都理工大学;2010年
8 张际雄;正则化回归算法学习速度的一种估计[D];杭州师范大学;2011年
9 王严;多种波动方程正则化反演的效果比较[D];哈尔滨工程大学;2015年
10 张振月;基于范数正则化回归的人脸识别[D];山东大学;2016年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026