【发布时间】:2015-03-29 23:21:02
【问题描述】:
我在由 3 个节点组成的集群中运行 Datastax Enterprise。它们都在相同的硬件下运行:2 核 Intel Xeon 2.2 Ghz、7 GB RAM、4 TB Raid-0
这应该足以运行一个轻负载的集群,存储少于 1 GB 的数据。
大多数情况下,一切都很好,但似乎有时 OpsCenter 中与修复服务相关的运行任务有时会卡住;这会导致该节点不稳定并增加负载。
但是,如果节点重新启动,卡住的任务不会出现,负载又回到正常水平。
由于我们的集群中没有太多数据,我们使用opscenterd.conf 中定义的min_repair_time 参数来延迟修复服务,使其不会过于频繁地完成。
标记为“完成”并显示 100% 进度的任务并没有消失,这确实有点奇怪,是的,我们已经等了好几个小时才让它们消失,但是他们不会;我们发现解决此问题的唯一方法是重新启动节点。
编辑:
这是nodetool compactionstats的输出
编辑 2:
我在 Datastax Enterprise v. 4.6.0 和 Cassandra v. 2.0.11.83 下运行
编辑 3:
这是来自运行正常的节点上的dstat 的输出
这是来自 dstat 的输出,在一个带有卡住压缩的节点上
编辑 4:
来自iostat 节点上的输出,在压缩压缩时,请参阅高“iowait”
【问题讨论】:
-
两个 cmets 1) datastax 支持怎么说? 2) 7GB 的 RAM 似乎不是很多
-
我一直在以比以前更差的规格运行 Cassandra,没有遇到任何问题。我认为这不是导致挂起的原因
-
你在 nodetool compactionstats 和 compactionhistory 中看到的相同吗?
-
您可以在新编辑中自己查看。似乎在执行 compactionstats 命令时也会显示该任务。
-
请问您使用的是什么版本的 OpsCenter 和 DSE?
标签: cassandra datastax-enterprise datastax opscenter