【问题标题】:Insert Data using Spark in Cassandra在 Cassandra 中使用 Spark 插入数据
【发布时间】:2021-03-16 18:56:38
【问题描述】:

我正在使用 spark 和 datastax spark 连接器在 Cassandra 中写入 12 亿行数据(两列)。我有两个 DC 设置,我将使用 local_quorum 编写。我在两个 DC 中都有 3 次复制。是否会因其他 DC 而引入延迟。插入数据时我还应该记住哪些其他事项。我在单个 DC 上测试过,结果令人满意。

【问题讨论】:

    标签: apache-spark cassandra spark-cassandra-connector


    【解决方案1】:

    无论如何,写入都会发送到其他 DC,但由于您使用的是 LOCAL_QUORUM,Spark 不会等待来自该 DC 中节点的确认,因此它不应该影响延迟。我唯一要监控的事情 - 如果另一个 DC 很远,和/或链接速度很慢,那么发生写入的节点可能会开始收集提示,如果发生这种情况,那么这可能会稍微影响性能,因为提示需要待远程节点返回后写入并重播。

    【讨论】:

      猜你喜欢
      • 2017-05-06
      • 2017-01-07
      • 1970-01-01
      • 2016-07-18
      • 2016-05-14
      • 1970-01-01
      • 2018-03-11
      • 2014-03-24
      • 2015-12-30
      相关资源
      最近更新 更多