【发布时间】:2026-02-02 17:20:10
【问题描述】:
我想知道是否有人知道根据 Dask 中列的值写出一组文件的正确方法。换句话说,如果我想根据列中的值对一堆列进行分组并将其写入 CSV。我一直在尝试将 groupby-apply 范例与 Dask 一起使用,但问题是它不返回 dask.dataframe 对象,因此我应用它的函数使用了 Pandas API。
有没有更好的方法来处理我正在尝试做的事情?一个可扩展的解决方案将不胜感激,因为我正在处理的一些数据非常大。
谢谢!
【问题讨论】:
标签: dask dask-distributed