【发布时间】:2015-12-05 16:03:00
【问题描述】:
我和我的公司购买了大约 80,000 美元的硬件来完成一个目标。我们在 Cassandra 集群的多个应用程序数据库中每秒大约有 22,000 次写入。我们构建了 2 个双 3.5Ghz Xeons 节点、128GB RAM、Areca 1883,所有这些都是顶级的高吞吐量。我们还有一个用于 Commitlog/saved_caches 的 SSD RAID 10 阵列,因此不会延迟。
我们遇到的问题是数据量。在大约 4 天内,我们收集了 1.8TB 的数据。我们无意发布数据。然后我们得到了一个 JBOD 机箱并放入 6TB Platter 驱动器,每个 10 个,总共 20 个,大约 110TB 的空间。单次复制运行良好,问题是当我们运行双次复制时。
我们很乐意添加更多节点,我们知道这是正确的方法,但在 20,000 美元一个节点上它的成本很高。我的问题是,如果我们的写入速度是问题,那么在每台机器上增加 10 个驱动器应该允许双倍的写入速度,这是真的吗?
有没有人发生过一些类似的事情并对 Cassandra.yaml 进行了一些调整?
当我们进行双重复制时,我们确实运行了一段时间 htop,CPU 似乎确实有点密集(平均读取 24%,但看起来非常接近最大值)。 RAM 已全部使用,128GB。
任何关于此事的想法都会被考虑和调查。
谢谢,
肯
【问题讨论】:
标签: cassandra datastax datastax-enterprise