【发布时间】:2020-04-10 19:02:09
【问题描述】:
假设我有一个 pandas DataFrame data,我想将它拆分为特定的列 col,根据
def split_by_column(data, column):
chunk_list = [(k,g) for k, g in data.groupby(column)]
return dict(chunk_list)
collection = split_by_column(data, 'col')
这样我以后可以很容易地访问这个集合并将函数应用到这个集合中。
例如,如果我有一个对象同时具有 data 和 collection 作为实例变量,我是否在内存中有两个单独的数据副本或字典包含对数据中适当夹头的引用?
【问题讨论】:
-
非常好的问题。这部分解决了这个问题:stackoverflow.com/questions/52711823/…
标签: python pandas pandas-groupby