当前位置:论文写作 > 优秀论文 > 文章内容

信用卡和随机森林毕业论文格式范文 关于信用卡和随机森林方面开题报告范文2万字有关写作资料

主题:信用卡和随机森林 下载地址:论文doc下载 原创作者:原创作者未知 评分:9.0分 更新时间: 2024-03-01

信用卡和随机森林论文范文

《基于随机森林的信用卡违约预测》

本文是信用卡和随机森林专升本论文范文与信用卡类毕业论文范文.

摘 要:近些年信用卡的违约情况呈现逐年上升的趋势,使商业银行面临严重的经营风险,商业银行若想在信用卡业务中获得利润,必须控制信用卡的违约率.关于信用卡违约的研究主要围绕信用评级展开,鉴于传统单一分类器预测模型拟合不足或过拟合的缺陷,提出改进后的随机森林预测模型,并在实证分析中与KNN、逻辑回归、决策树和GBDT相比较.模型提高了信用卡违约识别率,降低了违约风险,对提高商业银行的风险管控能力具有积极意义.

关键词:信用卡违约;逻辑回归;GBDT;ROC曲线;随机森林

中图分类号:TP391 文献标识码:A 文章编号:2096-4706(2020)03-0001-05

Abstract:In recent years,the default situation of credit cards has been increasing year by year,which makes commercial Banks face serious operational risks. If commercial banks want to gain profits from credit card business,they must control the default rate of credit cards. The research on credit card default mainly focuses on credit rating. In view of the deficiency or over fitting of the traditional single classifier prediction model,an improved stochastic forest prediction model is proposed and compared with KNN,logistic regression,decision tree and GBDT in the empirical analysis. The model improves the credit card default recognition rate and reduces the default risk,which is of positive significance to improve the risk control ability of commercial Banks.

Keywords:credit card default;logistic regression;GBDT;ROC curve;random forest

0 引 言

隨着近些年我国金融体制的改革发展以及支付方式的变革,信用卡在支付领域扮演着越来越重要的角色.从中国信用卡行业市场现状可以发现,信用卡累计发卡量以及信用卡人均持卡量逐年增长,与此同时,信用卡应偿信贷余额以及授信使用率也在逐步提高,这也导致消费额和透支额的扩大,不可避免地会产生一定的风险.因此,如何有效地利用信用卡用户产生的数据,通过数据挖掘找到降低违约风险的方法,显得尤为重要.

对于信用卡违约的研究,比较常用的方法是建立信用评分模型,也就是根据过去的用户信贷记录、以及是否违约情况,来预测将来是否会违约.国外对于这方面的研究较早也比较成熟,早在1999年,Brause[1]等就提出了将关联规则和神经网络结合起来预测信用卡欺诈,2018年,Mohamad Jeragh和Mousa AlSulaimi[2]研究了一种基于自动编码器和支持向量机(OSVM)相结合的新型无监督学习模型,效果也得以改善.国内关于这方面的研究起步较晚,不过发展迅速.2004年邹权[3]采用决策树和逻辑回归进行分析和评分,以此对接受的申请者给出不同的信用政策,2018年张双全[4]在传统智能算法的基础上结合模糊集理论、平均影响值法和支持向量机技术,得出改进的智能算法——IFBPNN模型,结论表明该模型相比传统模型预测效果更好.

纵观当前的研究现状,违约预测模型评估通常采用单一的分类器,较容易出现过拟合问题,拟合效果不是很理想.本文通过研究学习曲线,从树的数量、最大深度、叶节点最小样本数和最佳分割时的特征数4个方面,改进传统的随机森林模型,并与K近邻算法(KNN)、逻辑回归、决策树(CART)和梯度提升决策树(GBDT)这4种单一拟合效果较好的算法相比较分析,研究发现改进后的模型相比其他模型效果较好,提高了用户信用卡违约预测的精度和识别率,某种程度上对提高商业银行的风险管控能力具有积极意义.

笔者所学专业为计算机技术,研究方向为数据挖掘,在当前学习阶段主修机器学习、人工智能等方面的课程,并有一定的实践基础,与本文涉及到的研究方法相关,希望对该方面的研究有一定贡献.

1 随机森林预测模型

1.1 算法原理

基本思想:随机森林算法的基本思想基于集成学习(ensemble),也就是使用一系列学习器进行学习,并使用某种规则整合各学习结果,从而获得比单个学习器更好的学习效果的一种机器学习方法.通过取长补短,克服了一些算法的局限性.

随机森林算法的基本原理主要基于Bootstrapping中的Bagging.首先利用Bootstrap抽样方法从原始数据集中抽取M个样本,然后在每个样本上训练分类器ai(x),建立M个决策树模型,再对每个单独分类器的输出取均值形成组合分类器,最后进行预测决定最终分类结果[5],即a(x)等于 ,如图1所示.

1.2 算法流程

上文汇总,上述文章是关于信用卡方面的相关大学硕士和信用卡和随机森林本科毕业论文以及相关信用卡和随机森林论文开题报告范文和职称论文写作参考文献资料.

信用卡和随机森林引用文献:

[1] 信用卡和随机森林毕业论文格式范文 关于信用卡和随机森林方面开题报告范文2万字
[2] 随机森林和k近邻算法论文写作参考范文 随机森林和k近邻算法方面毕业论文怎么写8000字
[3] 因子分析和随机森林论文写作参考范文 因子分析和随机森林方面在职毕业论文范文5000字
《信用卡和随机森林毕业论文格式范文 关于信用卡和随机森林方面开题报告范文2万字》word下载【免费】
信用卡和随机森林相关论文范文资料