【发布时间】:2020-10-05 17:30:31
【问题描述】:
我正在使用 spark 结构化流。我有一个数据框并添加了一个新列“current_ts”。
inpuDF.withColumn("current_ts", lit(System.currentTimeMillis()))
这不会用当前纪元时间更新每一行。它会在触发作业时更新相同的 epcoh 时间,从而导致 DF 中的每一行都具有相同的值。这适用于正常的火花作业。这是 spark 结构化流的问题吗?
【问题讨论】:
-
嗨@Nats,你能做到这一点吗?我有类似的要求。
标签: apache-spark spark-structured-streaming