【发布时间】:2021-08-09 01:27:39
【问题描述】:
我在分布式模式(2 个实例)中使用弹性搜索接收器连接器。有 8 个任务和大约 20 到 25 个主题要下沉到弹性搜索。
即使没有要接收的记录,worker java 进程使用 xmx(4GB) 时也会显示 100% 的 CPU 使用率。
记录的端到端传输正常进行,但高 CPU 使用率是一个问题。
尝试了各种与时间相关的消费者设置(批量大小、最大轮询间隔)甚至启用了死信队列的容错,但都没有帮助。
我的设置:
connector config
{
“name”: “elasticsearch-sink”,
"config”: {
“connector.class”: “io.confluent.connect.elasticsearch.ElasticsearchSinkConnector”,
“tasks.max”: “8”,
“topics.regex”:"(mytopics_\d+$)",
“key.ignore”: “true”,
“schema.ignore”: “true”,
“connection.url”: “http://eshost:esport”,
“type.name”: “kafka-connect”
}
}
工人设置:
bootstrap.servers=localhost:9094,localhost:9095
group.id=test-cluster
key.converter=org.apache.kafka.connect.storage.StringConverter
value.converter=org.apache.kafka.connect.json.JsonConverter
key.converter.schemas.enable=false
value.converter.schemas.enable=false
offset.storage.topic=connect-offsets
offset.storage.replication.factor=3
config.storage.topic=connect-configs
config.storage.replication.factor=3
status.storage.topic=connect-status
status.storage.replication.factor=3
status.storage.partitions=8
rest.port=9034
plugin.path=/pluginpath
log4j.rootLogger=DEBUG, stdout
我正在服务器级设置(64GB RAM 和 8 个 vCPU 内核)上尝试它,并且与 Kafka Broker 以及 Elasticsearch 服务器主机的连接良好。
任何指针都会有所帮助。
提前致谢。
【问题讨论】:
标签: apache-kafka apache-kafka-connect