【发布时间】:2021-12-28 17:39:00
【问题描述】:
我正在将一些熊猫系列和熊猫数据框转换为考拉以实现可扩展性。但是在我使用np.where() 的地方,我试图传递考拉数据帧,就像之前传递熊猫数据帧一样。但是我收到了一个错误 PandasNotImplementedError。
我该如何克服这个错误?我试过ks.where(),但没用。
这是我正在使用 pandas 编写的代码模型。
import pandas as pd
import numpy as np
pdf = np.where(condition, action1, action2)
如果我使用 toPandas() 或 from_pandas() 将 koalas 转换回 pandas,代码就可以工作,但由于性能和可扩展性的原因,我不能使用 pandas。如果可能的话,请建议我在 Koalas 中使用一种替代方法,或者为 numpy 提供一个替代库,它可以很好地与 koalas 配合使用。
【问题讨论】:
-
this answer能帮到你吗?
标签: python pandas dataframe numpy spark-koalas