【问题标题】:Is subtract (-) from cassandra collection creates a tombstone?从 cassandra 集合中减去 (-) 是否会创建墓碑?
【发布时间】:2019-05-17 00:32:34
【问题描述】:

在阅读了 cassandra 中的墓碑和集合之后,我明白正确的方法是使用加法 (+) 和加减法 (-) 运算符。

我读过的所有地方都给我的印象是使用此运算符而不是覆盖集合不应该创建任何墓碑。

在做了一些测试和读取 sstables 之后,似乎在添加时,没有创建任何墓碑

但是在做减法时,我会注意到 sstable 获得了 delete_info 记录。这条记录不同于删除整个单元格的记录(而不仅仅是一组中的一个条目),所以我不确定它是否是墓碑?

6545d91# sstabledump mc-23-big-Data.dbata/cs/customers-49e96fc0011f11e985316d2c86
WARN  11:17:05,402 Only 52.363GiB free across all data volumes. Consider adding more capacity to your cluster or removing obsolete snapshots
[
  {
    "partition" : {
      "key" : [ "da8b9f4e-b063-4254-aee6-acba55b35d83" ],
      "position" : 0
    },
    "rows" : [
      {
        "type" : "row",
        "position" : 143,
        "clustering" : [ "da8b9f4e-b063-4254-aee6-acba55b35d83", "da8b9f4e-b063-4254-aee6-acba55b35d83" ],
        "liveness_info" : { "tstamp" : "2018-12-16T10:47:19.434990Z" },
        "cells" : [
          { "name" : "payments", "deletion_info" : { "marked_deleted" : "2018-12-16T11:00:27.524999Z", "local_delete_time" : "2018-12-16T11:00:27Z" } },
          { "name" : "payments", "path" : [ "da8b9f4e-b063-4254-aee6-acba55b35d81" ], "value" : "", "tstamp" : "2018-12-16T11:15:17.989Z" },
          { "name" : "payments", "path" : [ "da8b9f4e-b063-4254-aee6-acba55b35d82" ], "deletion_info" : { "local_delete_time" : "2018-12-16T11:16:34Z" },
            "tstamp" : "2018-12-16T11:16:34.929999Z"
          }
        ]
      }
    ]
  }

底线,我的问题是,单元格中的这条记录是否是墓碑? 如果可以,是否可以避免?

 { "name" : "payments", "path" : [ "da8b9f4e-b063-4254-aee6-acba55b35d82" ], "deletion_info" : { "local_delete_time" : "2018-12-16T11:16:34Z" },
            "tstamp" : "2018-12-16T11:16:34.929999Z"
  }

【问题讨论】:

  • 那是一块墓碑。根据我的阅读和测试,对集合的任何操作都会导致墓碑生成,因为“弄清楚发生了什么变化”太耗时了。相反,cassandra 将删除并替换该值(即插入和更新,我没有测试 + 和 - 操作)。 “deletion_info”表示它是一个墓碑。

标签: cassandra


【解决方案1】:

关于:

{ "name" : "payments", "path" : [ "da8b9f4e-b063-4254-aee6-acba55b35d82" ],
  "deletion_info" : { "local_delete_time" : "2018-12-16T11:16:34Z" },
  "tstamp" : "2018-12-16T11:16:34.929999Z"
}

减法确实创建了一个墓碑,以向存储引擎指示集合中该元素(已删除)的状态。这样删除优先于该路径上该特定元素的任何先前(较旧的时间戳数据)添加。

此外,当您将整个集合作为 cql 语句的一部分提供时,这也会创建一个墓碑,这可能就是该墓碑所代表的含义:

{ "name" : "payments", 
  "deletion_info" : { "marked_deleted" : "2018-12-16T11:00:27.524999Z",
  "local_delete_time" : "2018-12-16T11:00:27Z" } 
}

因为 Cassandra 不采用 read-before-write,它只是为该列中的所有元素创建一个墓碑,以使所有可能的现有写入无效。

如果您想完全避免墓碑,请考虑使用Frozen Collections。对于冻结的集合,您每次都需要提供完整的集合值,并且集合的所有元素都存储在一个单元格中。因此,更新集合时无需创建墓碑。

使用冻结集合的明显缺点是,如果没有先 SELECTing 现有内容并在 INSERT/UPDATE 中提供新集合,则无法从集合中追加/删除元素。这样做的一个缺点是您可能不得不担心管理并发写入。

或者,如果您想避免使用非冻结集合创建墓碑,请不要使用 INSERT 完整集合(即 INSERT INTO ks.tbl (k, c) VALUES (0, [1,2,3])。而是使用追加,即 UPDATE ks.tbl SET c = c + [1,2,3] WHERE k = 0

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2023-03-18
    • 2023-03-08
    • 2021-04-22
    • 2017-02-09
    • 2015-06-14
    • 2016-05-31
    • 1970-01-01
    • 2017-08-16
    相关资源
    最近更新 更多