【发布时间】:2018-10-29 15:26:22
【问题描述】:
对于我们真正的高流量网站,我们设置了自己的跟踪解决方案。我们在峰值时每秒记录 >1k 次展示。为此,我们正在使用最新的 Cassandra 3。
现在我们要对这些数据进行实时监控。问题是,实际记录的数据的结构不好,无法从中生成统计信息。所以我想到了 Cassandra 中的一个新表,它有一个匹配的分区/主键,并且由一个额外的 INSERT 填充。但我不确定这是否是卡桑德拉的杀手。正如我所说,只有实时统计数据很重要,所以我想为这个监控表中的所有数据添加一个 TTL,比如说 60 秒。这应确保自动删除旧数据。
但是谁能说这是否会导致如此高的流量出现问题,因为每分钟有这么多的删除?由于我们仅从该监控表中选择最后 5-10 秒,因此 SELECT 中的墓碑可能不是问题,但我认为可能存在大量压缩和 GC 破坏性能!?
【问题讨论】:
-
为什么需要这么小的TTL?例如,您不能将信息保留 1 天吗?此外,无论如何您都会进行压缩,因为您在表中插入了很多内容。
标签: cassandra cassandra-3.0 ttl