【发布时间】:2017-08-20 21:41:33
【问题描述】:
假设我有一组 dask 数组,例如:
c1 = da.from_array(np.arange(100000, 190000), chunks=1000)
c2 = da.from_array(np.arange(200000, 290000), chunks=1000)
c3 = da.from_array(np.arange(300000, 390000), chunks=1000)
是否可以从它们创建一个 dask 数据框?在熊猫中我可以说:
data = {}
data['c1'] = c1
data['c2'] = c2
data['c3'] = c3
df = pd.DataFrame(data)
dask 有类似的方法吗?
【问题讨论】:
-
我怀疑您可以结合使用
dd.from_dask_array和dd.concat(..., axis=1)。