【发布时间】:2016-10-02 08:53:28
【问题描述】:
我在我的 spark 流应用程序中看到一些失败的批次,因为与内存相关的问题,例如
无法计算拆分,未找到块 input-0-1464774108087
,我想知道是否有一种方法可以在不干扰当前正在运行的应用程序的情况下重新处理这些批次,一般来说,不必是完全相同的例外。
提前致谢 普雷迪普
【问题讨论】:
-
在执行过程中你不是已经对它们进行了重新处理吗?你在检查日志吗?
-
当我看到 spark UI 时,在流媒体下,我看到了一些活动批次,当我点击其中一些时,我看到了上述异常,这意味着这些批次在处理时出错了流式应用程序,这些批处理是我要处理和清理的批处理,并且不会因为异常而丢失任何数据。希望对您有所帮助。
-
您的流媒体工作“落后”了吗?您的“计划延迟”和“活动任务”如何?
-
另外,您使用的是什么流媒体源?
-
调度延迟非常小,有问题,我们知道为什么,但是如何重新处理它们是个问题。来源是apache NIFI
标签: apache-spark spark-streaming