【发布时间】:2017-09-15 20:52:37
【问题描述】:
Spark Scala API 有一个 Dataset#transform 方法,可以轻松链接自定义 DataFrame 转换,如下所示:
val weirdDf = df
.transform(myFirstCustomTransformation)
.transform(anotherCustomTransformation)
我没有看到与 pyspark in the documentation 等效的 transform 方法。
是否有 PySpark 方法来链接自定义转换?
如果没有,如何对pyspark.sql.DataFrame 类进行猴子修补以添加transform 方法?
更新
从PySpark 3.0开始,变换方法是added to PySpark。
【问题讨论】:
标签: apache-spark pyspark apache-spark-sql apache-spark-dataset