【发布时间】:2017-02-20 06:07:03
【问题描述】:
是否可以限制 Kafka 消费者为 Spark Streaming 返回的批次大小?
我之所以问,是因为我得到的第一批记录有数亿条记录,并且需要很长时间来处理和检查它们。
【问题讨论】:
-
您当前的批处理间隔是多少?如果它更多尝试减少批处理间隔,那么您可以获得更少的数据。
-
忽略了你的问题,你提到了第一批..
标签: apache-spark apache-kafka spark-streaming kafka-consumer-api