【发布时间】:2020-01-03 20:23:20
【问题描述】:
我在数据框中有一个巨大的稀疏数据集,并且一直在使用 df.to_sparse 但它很快就会被弃用所以想切换到 pd.Series(pd.SparseArray()) 但不确定如何为整个数据框?
我的最终 df 是 100K 行和 49K 列,因此需要一种自动化方式。
【问题讨论】:
-
来自文档:
Note There’s no performance or memory penalty to using a Series or DataFrame with sparse values, rather than a SparseSeries or SparseDataFrame.pandas.pydata.org/pandas-docs/stable/user_guide/…
标签: python pandas sparse-matrix