【发布时间】:2022-01-04 16:07:04
【问题描述】:
我有一个数据框,我需要创建另一个数据框,其中仅包含特定列中缺少的记录。
“缺失”表示它可以为空、“N/A”、“NODATA”或在某些情况下为其他固定值(我需要一个函数,这样我就可以简单地传递一个适合这种情况的列表)。
我可以按值过滤它,所以找到了 N/As 和 NODATA 记录,但它看不到空的记录。
我尝试了多种方法,是否可以这样做(所以空值是列表的一部分),还是我需要单独过滤空并将其合并到列表中?
def GetEmpty(df, on, items_list=['']):
column = df[on]
boolean_series = column.isin(items_list)
empty_df = df[boolean_series]
return empty_df
empty_df = GetEmpty(df, 'Isin', ['','N/A', 'NODATA'])
编辑:数据框:
System Book Isin ID
0 ABC DEF XYZ A
1 ABC DEF NaN B
2 ABC DEF ABC C
3 ABC DEF NODATA D
【问题讨论】:
-
你能展示你的数据框样本吗?