箱型图分析原理及Python例程

 一、箱型图分析原理

箱型图可以通过程序设置一个识别异常值的标准,即大于或小于箱型图设定的上下界的数值则识别为异常值,箱型图如下图所示:

异常数据处理——箱型图分析原理

首先我们定义下上四分位和下四分位:

上四分位我们设为 U,表示的是所有样本中只有1/4的数值大于U ,即从大到小排序时U处于25%处;
同理,下四分位我们设为 L,表示的是所有样本中只有1/4的数值小于L,即从大到小排序时L处于75%处。

然后我们定义上界和下界:

我们设上四分位与下四分位的插值为IQR,即:IQR=U-L

上界设为 U+1.5IQR ,下界设为: L - 1.5IQR

箱型图选取异常值比较客观,在识别异常值方面有一定的优越性。

相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2021-05-03
  • 2021-11-25
  • 2021-05-16
  • 2021-12-18
  • 2022-12-23
猜你喜欢
  • 2022-12-23
  • 2021-06-09
  • 2022-12-23
  • 2021-05-13
  • 2022-12-23
  • 2021-09-04
  • 2021-05-26
相关资源
相似解决方案