【发布时间】:2022-01-13 05:07:25
【问题描述】:
我将测量值存储在如下所示的数据框中。 这些是 PM 的测量值。传感器在 x1..x56 条件下测量柱指示器中包含的 pm1、pm2.5、pm5、pm10 中的四个,并给出柱面积和计数的测量值。问题是在某些情况下(列 x1..x56)传感器没有捕获所有 PM。而且我希望列条件(x1..x56)的每个组合都在列指示器中包含所有 4 个 PM 值。如果传感器没有捕捉到它(如果 Xs 的某种组合没有 PM 值)我应该添加它,并且面积和计数列应该是 0。
x1 x2 x3 x4 x5 x6 .. x56 indicator area count
0 0 0 0 0 0 .. 0 pm1 10 56
0 0 0 0 0 0 .. 0 pm10 9 1
0 0 0 0 0 0 .. 0 pm5 1 454
.............................................
1 0 0 0 0 0 .. 0 pm1 3 4
ssl ax w 45b g g .. gb pm1 3 4
1 wdf sw d78 b fd .. b pm1 3 4
在此示例中,对于全零的第一个组合,缺少 pm2.5,因此我应该添加它并将其面积和计数设为 0。第二个组合(以 1 开头的组合)类似。所以我完成后我的虚拟示例应该是这样的:
x1 x2 x3 x4 x5 x6 .. x56 indicator area count
0 0 0 0 0 0 .. 0 pm1 10 56
0 0 0 0 0 0 .. 0 pm10 9 1
0 0 0 0 0 0 .. 0 pm5 1 454
0 0 0 0 0 0 .. 0 pm2.5 0 0
.............................................
1 0 0 0 0 0 .. 0 pm1 3 4
1 0 0 0 0 0 .. 0 pm10 0 0
1 0 0 0 0 0 .. 0 pm5 0 0
1 0 0 0 0 0 .. 0 pm2.5 0 0
ssl ax w 45b g g .. gb pm1 3 4
ssl ax w 45b g g .. gb pm10 0 0
ssl ax w 45b g g .. gb pm5 0 0
ssl ax w 45b g g .. gb pm2.5 0 0
1 wdf sw d78 b fd .. b pm1 3 4
1 wdf sw d78 b fd .. b pm10 0 0
1 wdf sw d78 b fd .. b pm5 0 0
1 wdf sw d78 b fd .. b pm2.5 0 0
我该怎么做?提前致谢!
【问题讨论】:
-
请提供可重复的示例。另外,如果有帮助,请查看此answer
-
反之亦然吗?对于每个
pmxx,您是否需要所有xs 组合?
标签: pandas data-cleaning