1.Lending Club数据处理初步处理
-
1.1 借贷状态数据处理
1、借贷状态分为:Fully Paid:,Charged Off和Current,Default等。
2、处理的规则:如果借贷状态为Fully Paid, 结果返回0,否则返回1,实现的代码如下图所示: -
1.2 借贷期限预处理
1、在Lending club数据中,借贷期限的数据内容为:‘n/a’,‘1 year’,‘2 years’,’>2 years’,'10+ years’等,需要根据不容期限,将期限转化为对应的数字。
2、处理的规则如下:
‘< 1 year’ -> 0.5
‘n/a’ -> 0.5
‘2 years’ -> 2
‘10+ years’ -> 10
根据对应的转换规则,转化的实现代码如下图所示:
2 探索性数据分析的方法
-
2.1 数字化探索-查看数据基本信息和统计信息