【发布时间】:2022-01-11 17:58:03
【问题描述】:
如何规范化数据集?
数据集由 int 和 float 组成(它们也有负值),大约有 36 列(变量),分布不同。
我想对它们进行转换,以便为回归模型的应用提供正态分布。
我尝试了box-cox 和yeo-jansen,但在第一种情况下我遇到了负值问题,而在第二种情况下我遇到了这个错误:
"RuntimeWarning: divide by zero encountered in log".
【问题讨论】:
-
你试过Numpy吗?
标签: python normalization