这次已经是我第n次参加datawhale活动了,每次任务都比较贴合实际生产生活,选题都比较有代表性。硕士毕业后第一次(纪念下)

赛题以预测金融风险为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过
120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20
万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postCode和title等信息进行脱敏。

train文件情况

Datawhale零基础入门金融风控 task-1 初识数据

Datawhale零基础入门金融风控 task-1 初识数据

竞赛采用AUC作为评价指标。AUC(Area Under Curve)被定义为 ROC曲线 下与坐标轴围成的面积。

8种评分指标

Datawhale零基础入门金融风控 task-1 初识数据

Datawhale零基础入门金融风控 task-1 初识数据

Datawhale零基础入门金融风控 task-1 初识数据

Datawhale零基础入门金融风控 task-1 初识数据

交作业啦~希望这次可以按时按需交作业 哈哈哈哈哈

 

 

 

 

 

相关文章:

  • 2021-05-03
  • 2021-07-06
  • 2021-06-08
  • 2021-04-02
  • 2021-06-14
  • 2021-08-01
  • 2021-12-21
  • 2021-05-18
猜你喜欢
  • 2021-06-28
  • 2021-12-05
  • 2021-09-24
  • 2021-04-07
  • 2021-08-23
  • 2021-05-13
  • 2021-11-04
相关资源
相似解决方案