预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

Logistic回归在住房抵押贷款数据中的应用的中期报告 1.研究目标 本次研究的目标是探索利用Logistic回归对住房抵押贷款数据进行分类分析的可行性以及预测能力。 2.数据来源 本次研究所采用的数据来自某银行住房抵押贷款的数据集。其中包含着申请者个人信息、信用记录、家庭情况、抵押物信息、贷款金额等详细信息。 3.数据预处理 在进行分类分析之前,需要对原始数据进行一些处理,主要包括: (1)缺失值处理:检查每个变量是否存在缺失值,对缺失值进行处理,可以选择平均值、中位数、众数等进行填充; (2)异常值处理:检测是否存在异常值,可以采用箱线图或者3σ原则进行检测,对于异常值可以选择删除或者替换为平均值或中位数; (3)变量选择:选择与分类变量相关性较高的自变量进行分析,可以采用Pearson相关系数矩阵进行检测,对于不相关的自变量可以剔除。 4.模型建立 根据经验,本次研究中选择了MaritalStatus、CreditScore、LoanAmount、LoanTerm、PropertyAge等变量作为自变量,LoanStatus作为因变量,采用Logistic回归模型进行建立,并进行模型参数优化。 5.模型评估 为了评估模型的预测能力,本次研究采用了混淆矩阵以及ROC曲线进行评估。同时还计算了准确率、召回率、F1值等评价指标,通过这些指标对模型的分类能力进行评估。 6.结论 本次研究表明,采用Logistic回归模型对住房抵押贷款数据进行分类分析是可行的,且具有较好的预测能力。同时,建立合适的模型需要充分考虑自变量的选择和模型参数的优化。