【发布时间】:2019-10-18 08:34:30
【问题描述】:
我需要遍历 dask 数据框中的唯一值。我使用 .unique() 来获取列的唯一值,但现在我得到了一个无法用于迭代的 dask 对象。我需要知道如何将这些唯一值从这个 dask 对象中获取到一个列表(或类似的东西)中,以便我可以使用这些值来遍历 dask 数据框。
df = dd.read_csv('file.csv')
df.column1.unique()
for unique_value in column1_array:
print(unique_value)
这是我得到的错误: NotImplementedError: Series getitem in 仅支持具有匹配分区结构的其他系列对象
【问题讨论】: