【发布时间】:2016-11-06 03:16:51
【问题描述】:
我想根据特定条件从 DataFrame 中选择列。我知道可以通过循环来完成,但我的 df 非常大,因此效率至关重要。列选择的条件是只有非 nan 条目或只有 nan 的序列后跟只有非 nan 条目的序列。
这是一个例子。考虑以下 DataFrame:
pd.DataFrame([[1, np.nan, 2, np.nan], [2, np.nan, 5, np.nan], [4, 8, np.nan, 1], [3, 2, np.nan, 2], [3, 2, 5, np.nan]])
0 1 2 3
0 1 NaN 2.0 NaN
1 2 NaN 5.0 NaN
2 4 8.0 NaN 1.0
3 3 2.0 NaN 2.0
4 3 2.0 5.0 NaN
从中,我只想选择第 0 列和第 1 列。关于如何在不循环的情况下有效地执行此操作有什么建议吗?
【问题讨论】:
标签: python-3.x pandas dataframe