【发布时间】:2020-12-16 23:31:21
【问题描述】:
我一直坚持这一点,所以希望有人能提供更好的指导。 我目前有一个看起来像这样的数据框(只有更多的行):
|"released_date"| "status" |
+-------------+--------+
| 12/12/20 |released|
+-------------+--------+
| 10/01/20 | NaN |
+-------------+--------+
| NaN | NaN |
+-------------+--------+
| NaN. |released|
+-------------+--------+
我想做df['status'].fillna('released' if df.released_date.notnull())
又名,只要 df.released_date 不是空值,df 的 status 列中的任何 Nan 值都用“released”填充。
我在执行此操作时不断收到各种错误消息,尽管有不同的变体,首先上面的代码是一个语法错误,我想这是因为 notnull() 返回一个布尔数组?
我觉得对此有一个简单的答案,但不知何故我没有看到它。我没有发现任何像这样的问题,我试图根据数据框中的空值来组织一些东西,这让我想知道我的方法首先是否不理想?如果无论如何只返回布尔数组,如何在不使用 isnull() 或 notnull() 的情况下根据不同列中的空值过滤数据框列中的值?使用 == Null 似乎也不起作用...
【问题讨论】:
-
天哪,df 格式看起来很粗糙。但希望这是有道理的
标签: dataframe replace null multiple-columns missing-data