收藏本站
《2015年(第四届)全国大学生统计建模大赛论文》2015年
收藏 | 手机打开
二维码
手机客户端打开本文

个人信用风险评估方法的研究——基于lending club数据

刘晶  谭峰  柴容倩  
【摘要】:信用风险的评价方法不断推陈出新,管理技术正日臻完善,许多定量技术、支持工具和软件已付诸商业应用。由于我国商业银行和金融市场尚处转轨和新兴发展阶段,缺乏对个人信用风险评估的基础理论的深究,个人征信系统的发展十分滞后和缓慢,严重阻碍了中国社会经济的健康持续发展。因此,个人信用风险的评估方法的探讨成为了热点话题。鉴此,本文以lending club公司2014年1月1日到2015年3月31日的借款人数据为源数据,首先根据spearman秩相关性检验和主成分分析法从众多变量中筛选出解释能力比较强的变量,然后依据筛选出的变量建立随机森林模型、判别分析模型和logistic回归模型,通过这三类模型判断准确性的比较,力图构建更为有效的个人信用风险评估方法,从而为该平台及出借人决策提供科学依据。实证结论如下:第一,主成分筛选变量后可以减少模型变量个数起到降维的作用,但是在对随机森林模型来说,由于其并非线性模型,而且筛选变量造成了信息的损失,经过线性组合的特征并不一定能给模型带来更好的效果。第二,通过训练集10000个数据样本测试出三个模型的预测能力。其中,随机森林模型和logistic模型的预测准确度比较高,分别为:81.87%和70.89%。而判别分析的结果相对较低为:65.92%。第三,通过测试集2325个样本检验三个模型的预测能力。总体来看随机森林模型和logistic模型对测试集的预测准确度相近,远远高于判别分析的结果。最后,通过预测的结果,和对模型分析之后得出三个模型的预测准确率分别为:随机森林模型的判断准确率最高,而判别分析模型的准确率最低。即:随机森林的准确率logistic模型的准确率判别分析模型的准确率。其中,随机森林模型判别的准确率又和其特征的选取有一定的关系。综上所述,本文在建立P2P信贷风险评价模型相比较中认为,随机森林模型会更加准确和可靠。
【作者单位】:四川大学
【分类号】:F832.4

手机知网App
【相似文献】
中国期刊全文数据库 前3条
1 孟杰;;随机森林模型在财务失败预警中的应用[J];统计与决策;2014年04期
2 刘微;罗林开;王华珍;;基于随机森林的基金重仓股预测[J];福州大学学报(自然科学版);2008年S1期
3 钱争鸣;李海波;于艳萍;;个人住房按揭贷款违约风险研究[J];经济研究;2010年S1期
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026