之前打过2个比赛:1.二手车交易预测 2.工业蒸汽预测 这次参加的这个风控预测都是抱着学习的心态来参加。
赛题理解
依据赛制是否预测用户贷款是否违约为任务,这个目的本质上是个二分类问题(后面根据模型再讨论),不过因为不了解相关内容,所以查了下相关资料发现了相关概念,这里存在样本不平衡的问题,所以再评分标准就需要使用下面AUC的概念。
AUC:被定义为ROC曲线下与坐标轴围成的面积,显然这个面积的数值不会大于1。又由于ROC曲线一般都处于y=x这条直线的上方,所以AUC的取值范围在0.5和1之间。AUC越接近1.0,检测方法真实性越高;等于0.5时,则真实性最低,无应用价值。
糙点的理解就是一个曲线围城的面积。
这里,尝试写下相关信息