【问题标题】:Coordinator node timed out on Cassandra cqlsh shellCassandra cqlsh shell 上的协调器节点超时
【发布时间】:2017-08-21 10:07:10
【问题描述】:

我是 cassandra 的新手,正在尝试在两台 Mac 机器上进行多节点设置。它不是datastax casandra。 比如我的IP是10.100.1.12,其他机器IP是10.100.1.15。我在这台机器上的 cassandra.yaml 文件中更改了以下属性:

10.100.1.15:

  • 种子:“127.0.0.1,10.100.1.12,10.100.1.15”
  • listen_address: 10.100.1.15
  • rpc_address: 10.100.1.15
  • endpoint_snitch:GossipingPropertyFileSnitch

10.100.1.12:

  • 种子:“127.0.0.1,10.100.1.12,10.100.1.15”

  • listen_address:10.100.1.12

  • rpc_address:10.100.1.12

  • endpoint_snitch:GossipingPropertyFileSnitch

    cassandra 运行良好 cqlsh 也使用命令打开 bin/cqlsh 10.100.1.12

但是当我试图检索表的数量时,它会向我显示错误:

ReadTimeout:来自服务器的错误:code=1200 [协调节点超时等待副本节点的响应] message="操作超时 - 仅收到 0 个响应。" info={'received_responses': 0, 'required_responses': 1, '一致性': 'ONE'}

我尝试将 read_request_timeout_in_ms 属性从 5000 更改为 20000,但我仍然遇到相同的错误。谁能帮助我做错了什么?

表架构如下:

cqlsh:app_auditor> describe table traffic_data;

CREATE TABLE app_auditor.traffic_data (
    current_time bigint PRIMARY KEY,
    appid bigint,
    attributes map<text, text>,
    device bigint,
    flow_type text,
    message_time bigint
) WITH bloom_filter_fp_chance = 0.01
    AND caching = {'keys': 'ALL', 'rows_per_partition': 'NONE'}
    AND comment = ''
    AND compaction = {'class': 'org.apache.cassandra.db.compaction.SizeTieredCompactionStrategy', 'max_threshold': '32', 'min_threshold': '4'}
    AND compression = {'chunk_length_in_kb': '64', 'class': 'org.apache.cassandra.io.compress.LZ4Compressor'}
    AND crc_check_chance = 1.0
    AND dclocal_read_repair_chance = 0.1
    AND default_time_to_live = 0
    AND gc_grace_seconds = 86400
    AND max_index_interval = 2048
    AND memtable_flush_period_in_ms = 0
    AND min_index_interval = 128
    AND read_repair_chance = 0.0
    AND speculative_retry = '99PERCENTILE';

我使用的计数查询是 从 traffic_data 中选择 count(*);

【问题讨论】:

  • 您绝对不希望 127.0.0.1 在您的种子列表中。只有 2 个监听地址。当两个节点都启动并运行时,nodetool ring 的结果是什么?
  • 可以执行普通查询吗?
  • 我可以执行描述查询,例如描述键空间和表。 nodetool 状态如下:Datacenter: datacenter1 ======================= Status=Up/Down |/ State=Normal/Leaving/Joining/Moving --地址加载令牌拥有主机 ID 机架 UN 10.100.1.12 472.14 KiB 256 ? 2c09d826-387a-49d6-a99a-c538fcb159cb rack1 UN 10.100.1.15 887.97 KiB 256 ? b945b293-2f54-4440-afa0-d0536bed3230 rack1
  • 显示您的表架构和查询。我认为这是因为您的计数查询

标签: cassandra


【解决方案1】:

在 Cassandra 中,count(*) 非常昂贵,cassandra 需要扫描所有节点的所有行才能给你计数,这就是它给你超时异常的原因。

而不是使用 count(*) 维护一个计数器表,如下所示:

CREATE TABLE traffic_counter (
    type int PRIMARY KEY,
    traffic_count counter
);

当一个数据插入到traffic_data数据中时,增加traffic_count的值

UPDATE traffic_counter SET traffic_count = traffic_count + 1 WHERE type = 0;

现在您可以非常有效地选择流量计数。

SELECT traffic_count FROM traffic_counter WHERE type = 0;

【讨论】:

  • 我在创建语句中也遇到了同样的错误。即使我从表 traffic_data 限制 1 中选择 *,它也显示相同的错误。我只显示一条记录。
  • 属性数据量大吗?
  • 现在表格是空的。它应该获取 0 个计数。
  • 从你的种子中删除 127.0.0.1,然后重启 Cassandra
  • 我也这样做了。但我想它给我必须用于我的项目的表带来了问题。对于其他虚拟和测试表,它工作正常。不确定是什么问题
猜你喜欢
  • 2016-01-16
  • 2015-08-15
  • 2013-02-20
  • 2015-08-25
  • 2019-07-16
  • 2015-01-10
  • 2014-10-05
  • 2015-12-28
  • 2021-01-12
相关资源
最近更新 更多