【发布时间】:2018-03-02 19:10:35
【问题描述】:
对于火花流,有没有办法只为当前窗口维护状态?我知道updateStateByKey 有效,但除非我们清除它,否则它会永远保持状态。是否可以存储和重置每个窗口的状态?
提供更多上下文。我正在尝试将一种类型的对象转换为窗口流中的另一种类型。但是,转换如下:
对象 1 是调用或响应。
在我们同时看到调用和响应之前,对象 2 不被认为是完整的。
但是,由于对象的响应可能在单独的批次中,我需要跨批次维护状态。
但我只想保持当前窗口的状态。有什么方法可以通过 spark 实现这一点。
谢谢!
【问题讨论】:
标签: java apache-spark spark-streaming