【发布时间】:2021-12-04 06:31:14
【问题描述】:
我遇到了一个看似简单但找不到合适解决方案的问题。
考虑给定的 Pandas 数据框df,由多个列 A1、A2 等组成,并让 Ai 为其填充的列之一,例如:
| Ai |
|---|
| 25 |
| 30 |
| 30 |
| NaN |
| 12 |
| 15 |
| 15 |
| NaN |
我想删除df 中Ai 值介于NaN 和其值“进一步变化”之间的所有行,这样我的输出(对于Ai 列)将是:
| Ai |
|---|
| 25 |
| NaN |
| 12 |
| NaN |
任何关于如何做到这一点的想法将不胜感激。非常感谢您。
【问题讨论】:
-
您能否更详细地描述“在 NaN 与其值的“进一步变化”之间”的含义?根据您的输出,您似乎正在删除具有重复值的行。
-
当然,抱歉含糊不清。原则上,我有一个包含许多缺失值的数据集,我根据某些条件回填。因此,在输出中有许多重复的值,但我想删除位于
Ai列中的 NaN 和另一个值之间的行。它们不一定是重复的(例如考虑序列 30,26,NaN;我只想删除 26)。
标签: python pandas delete-row