【问题标题】:How to remove rows with null values from a column?如何从列中删除具有空值的行?
【发布时间】:2022-08-13 03:12:02
【问题描述】:

我的列中有空值的小数据框。

Movie Duration
Avatar 178
Spectre
John Carter 132
Tangled
Titanic 195

我可以使用此命令一次删除一列的空值行 -

df.drop(df[df[\'duration\'].isnull() ].index)

但是,假设我有一个包含数百列空行值的大型数据框,那么一次删除一列的空行值是不可能的。

在这种情况下我应该采取什么方法?

  • 一个简单的df.dropna(0) 就足够了吗?但是拥有一个大型数据集并删除所有具有最少单个 NULL 值的行可能会让您根本没有数据集
  • 因此,在这种情况下,我的数据清理方法应该是什么(删除空行值)。
  • 顺便说一句,您的问题被否决的一个原因可能是您使用了图片和/或链接。在代码块中包含代码/数据集使问题更容易和更快地理解
  • 如果您不需要任何缺少值的行,这很好。 (在您的问题中添加清洁的原因也有助于获得答案)。如果您因为计算或算法不起作用而想要删除空值,请考虑使用列平均值或静态数字(如 0 或 1)填充 Null 值。清理的类型始终取决于您想处理数据

标签: python pandas dataframe data-cleaning


【解决方案1】:

正如@Omniswitcher 评论的那样,df.drop() 将起作用。

pd.read_excel('Movie.xlsx').dropna(axis=0)

输出:

【讨论】:

  • 没有时间自己重新创建/尝试,感谢您的确认!
猜你喜欢
  • 1970-01-01
  • 2012-02-25
  • 1970-01-01
  • 1970-01-01
  • 2020-07-06
  • 2018-12-21
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多