【问题标题】:I have a 3D dataset of coordinates x,y,z. How do I check if the dataset is normally distributed?我有一个坐标 x,y,z 的 3D 数据集。如何检查数据集是否为正态分布?
【发布时间】:2024-04-28 01:20:03
【问题描述】:

数据集很大,超过 15000 行。

一行 x,y,z 在 3D 图上绘制一个点。

我需要缩放数据,到目前为止我使用的是 RobustScaler(),但我想确保数据集要么是正态分布的,要么不是。

【问题讨论】:

标签: python multidimensional-array


【解决方案1】:

Matplotlib 直方图 [plt.hist()] 可用于检查数据分布。如果图中最高峰居中,则数据集呈正态分布。

【讨论】:

  • 它不适用于 3d 数据。我错了吗?
  • 如果你认为每一个x、y、z轴都是一个独立的数据列,那么使用一维直方图san。假设其中任何一个 (x,y,z) 不服从正态分布,那么组合也不服从正态分布。