【发布时间】:2020-07-05 09:41:10
【问题描述】:
我的算法取决于到达数据的顺序,它反映在数据框行的顺序中。
第 0 行 - t_0 |第 1 行 - t_1 | .... |第 N 行 - t_N
我的代码:
df_res=df.withColumn('algo_res',temporalAlgo_UDF(F.col('value')))
如何强制执行程序逐行应用算法(没有并行性)?
谢谢,
马克
【问题讨论】:
标签: python apache-spark pyspark spark-structured-streaming