预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

P2P市场借款成功率影响因素研究——基于随机森林和Logistic回归模型 随着互联网金融的快速发展,在线P2P借贷平台已经成为了一种新型的借贷方式。P2P借贷平台通过将借款人和投资人进行撮合,极大地方便了大众的借贷需求,同时也让投资人在获得一定收益的同时支持了实体经济发展。然而,随着近年来一些P2P平台出现的问题,人们对P2P借贷平台的风险也越来越关注。其中借款人还款能力的影响因素就是关注的重点之一。 对于P2P平台,借款人的还款能力是重中之重,否则平台的风险就会极高。在借款人还款能力影响因素方面,很多发达国家已经有了成熟的研究和模型,而我国相关研究相对较少。因此,本研究通过随机森林和Logistic回归模型探讨P2P市场借款成功率的影响因素,并为P2P平台提供参考意见。 一、数据来源和样本选取 本研究选取了浙江省网贷风险控制联合会出具的2016年度P2P网络借贷信息中介机构运营数据作为样本。数据集中包含了借款人的个人信息、借款细节、收入支出情况、风控等信息。在数据预处理中,我们选择了一些比较重要的变量作为影响因素,包含了借款人年龄、性别、教育程度、婚姻状况、工作类型、月收入、征信评级等因素。 二、随机森林模型 随机森林是目前比较流行的一种机器学习算法,能够处理多维的高维数据并减少过拟合现象的出现。本研究通过随机森林模型来分析借款人还款能力的影响因素,以及各因素的权重和重要性。 我们采用了随机森林分类器算法,采用了10折交叉验证,最终选出的因子有11个。其中,排名前三的因素依次是征信评级、工作类型和月收入。这三个因素的影响力度超过了其他因素,说明这些因素对借款人的偿还能力具有非常大的影响力。 三、Logistic回归模型 在随机森林的基础上,我们进一步采用了Logistic回归模型进行深度研究。该模型能够对影响因素进行多维度拆分,定量分析各因素在影响借款人还款能力上的作用程度,是一种常用的经典统计学习工具。 本研究中的Logistic回归模型,我们选择了10个重要的影响因素和一个二元变量作为自变量,其中二元变量指的是是否超期还款。模型分析结果表明,征信评级、借款金额、使用途径、借款期限、收入情况、年龄、性别等变量都对借款人还款能力具有显著影响。其中征信评级的影响力度最大,其他因素依次为借款金额、借款期限、收入情况、年龄等。 四、结论 本研究采用了随机森林和Logistic回归模型两种方法,对P2P借贷平台中借款人还款成功率的影响因素进行了探讨。研究结果表明,征信评级是影响借款人借还款能力的首要因素,其次是工作类型和月收入。而在整个模型中,借款人的年龄、性别、教育程度、婚姻状况等个人信息变量的影响程度比较小。 本研究的结论可以为P2P平台在借贷审核和风险控制上提供一系列参考意见。在审核中,可以优先从借款人的征信状况、工作类型和月收入等几方面入手,给出更科学合理的审核意见和方案。同时,在风险控制上,平台可以从不同角度出发,制定预防措施和应急方案,最大程度地减少坏账发生的概率。 最后,本研究仅基于2016年的借贷数据,样本时限相对较短,样本总量也有限,因此可能无法全面反映借款人还款能力影响因素的特征和变化趋势。后续的研究中,我们将会继续完善并扩大数据样本,使结果更加准确可靠。