【发布时间】:2021-02-14 06:47:42
【问题描述】:
您好,我是 pandas 的新手,正在为操作而苦苦挣扎。 我有一个包含大量列的数据框 df,我只想保留计数超过 5000 个值的列数。
我尝试了下面的循环,但它不起作用。有什么简单的方法可以做到这一点?还有我可以创建一个函数来将其应用于我想保留只有 n 个值或更多值的列的任何数据框吗?
for column in df.columns:
if df[column].count() > 5000:
column = column
else:
df[column].drop()
谢谢
【问题讨论】:
-
“计数”到底是什么意思?你的意思是非 NaN 值?那么非缺失值呢?
-
是的,非 NaN 值。因此,例如,当您执行 df.describe() 时,我想过滤掉所有计数少于 5000 的列。
标签: python pandas dataframe data-cleaning