【发布时间】:2020-01-12 23:45:26
【问题描述】:
我们将生产中的 DSE 分为两个数据中心。除了 Cassandra 数据存储之外,一个数据中心正在做 Spark,一个是 SOLR。
最近我们观察到节点频繁宕机,以至于我们几乎需要花费全部时间来观察和启动 DSE 过程。
到目前为止,我们尝试删除一些旧数据,我们已经创建了一个 c# 控制台应用程序,它以 pegging 方式获取数据并将其从生产节点中删除,只是减少了节点的存储负载。
但是,我观察到一些可能会影响性能的变化,但我对此并不完全确定。
已移动机器域:我们正在更改整个组织的域。作为该过程的一部分,一些机器的域已经发生变化,而一些正在进行中。当来自同一数据中心的两台机器位于不同的域中时,当涉及到机器间通信时,它会影响内部流程吗?
频繁的数据删除进程运行:正如我提到的,我们创建了一个删除旧数据的进程,但是当我们删除数据时,它会将这些数据转换为墓碑,并且可以减慢压缩过程,这可以繁忙的 DSE 时间较长,同时可能是 scala 作业试图与客户端请求一起运行。这可能是 DSE 进程挂起。如果是这种情况,最好删除旧数据
总数据负载与节点数:截至目前,我们有近 6tb 的数据(复制因子为 3)和 15 个 DSE 节点(9 个用于 ANALYTICS,6 个用于 SOLR)。我们是否需要添加一些额外的机器来处理节点
【问题讨论】:
-
您也可以在community.datastax.com 上提问 - 有来自Datastax Support 等的人。
标签: apache-spark cassandra datastax-enterprise