【问题标题】:Cassandra 1.2: how to get the real load on each virtual nodeCassandra 1.2:如何获得每个虚拟节点上的实际负载
【发布时间】:2014-05-23 21:53:41
【问题描述】:

我有一个 Cassandra 1.2 集群,我正在使用虚拟节点和 ByteOrderedPartitioner。我知道不建议这样做,因为我需要确保数据的键均匀分布在键空间中,以便正确分配每个物理节点上的负载。我遇到的问题是我找不到查看每个虚拟节点上实际负载的方法。如果我像这样使用 nodetool:

nodetool status

我收到这样的输出:

Datacenter: datacenter1
=======================
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
--  Address        Load       Tokens  Owns   Host ID                               Rack
UN  XXX.XXX.XXX.XXX 14.73 GB   256     11.3%  a4d365ca-f21b-4418-ab0e-656520d931b5  rack1
UN  XXX.XXX.XXX.XXX  8.51 GB   256     10.6%  f587fe0b-e765-4c02-bd50-cef9758e9a6b  rack1
UN  XXX.XXX.XXX.XXX 10.92 GB   256     10.3%  6160ca91-1e07-47ec-8fa9-ef886c140e91  rack1
UN  XXX.XXX.XXX.XXX  9.62 GB   256     10.0%  9c4a8476-1de2-455b-956a-c4cea31675bf  rack1
UN  XXX.XXX.XXX.XXX 11.11 GB   256     11.2%  61639d9c-ad49-4f38-86b3-cd48e0c90c49  rack1
UN  XXX.XXX.XXX.XXX  7.86 GB   256     35.1%  195b6f79-7d68-4a98-8a9b-55bd0dd699e2  rack1
UN  XXX.XXX.XXX.XXX 11.29 GB   256     11.4%  0ac03b6a-0a0e-4f83-8b9e-2f16d4db47ab  rack1

这意味着分布不是那么好,但我想查看虚拟节点上的实际分布,我遇到的问题是运行:

nodetool ring

给我很多条目,每个虚拟节点一个(总共 256 个)在我运行命令的节点中,但信息几乎没有用,因为每个虚拟节点的负载看起来都一样(实际大小是与物理节点上的总信息相比是不真实的)

XXX.XXX.XXX.XXX  rack1       Up     Normal  11.29 GB        11.45%              Token(bytes[2daad5a3e325e152d7be5bc2d5f87fef])
XXX.XXX.XXX.XXX  rack1       Up     Normal  11.29 GB        11.45%              Token(bytes[2ffef9060e59c1c922a1ecf8e2643794])
XXX.XXX.XXX.XXX  rack1       Up     Normal  11.29 GB        11.45%              Token(bytes[31041cc591d63d91a67a21ecf44a57c2])
XXX.XXX.XXX.XXX  rack1       Up     Normal  11.29 GB        11.45%              Token(bytes[31bbcaafcdcb2ecc3a4ef3fb3af4b82b])
XXX.XXX.XXX.XXX  rack1       Up     Normal  11.29 GB        11.45%              Token(bytes[324e972b43b63d63df4255e459fed524])
XXX.XXX.XXX.XXX  rack1       Up     Normal  11.29 GB        11.45%              Token(bytes[3353224ae20e902e5b2b243c8fc5ff97])
XXX.XXX.XXX.XXX  rack1       Up     Normal  11.29 GB        11.45%              Token(bytes[350ed29fa9a1a377b8014beef1d160f0])
XXX.XXX.XXX.XXX  rack1       Up     Normal  11.29 GB        11.45%              Token(bytes[3553ad83beaf91d98a692e22718e321d])
XXX.XXX.XXX.XXX  rack1       Up     Normal  11.29 GB        11.45%              Token(bytes[35893a82c84982c467251115a7406f00])
XXX.XXX.XXX.XXX  rack1       Up     Normal  11.29 GB        11.45%              Token(bytes[37fad1c7dbd8d66d75747699ce4d6d2e])
XXX.XXX.XXX.XXX  rack1       Up     Normal  11.29 GB        11.45%              Token(bytes[388bcf470bd5c97e1f3cb45c01bd1f2c])
XXX.XXX.XXX.XXX  rack1       Up     Normal  11.29 GB        11.45%              Token(bytes[38a0cdc654a9934e5a16e5242c26fc5f])
XXX.XXX.XXX.XXX  rack1       Up     Normal  11.29 GB        11.45%              Token(bytes[393b8185b527f036cd44f5f6791484b9])
XXX.XXX.XXX.XXX  rack1       Up     Normal  11.29 GB        11.45%              Token(bytes[39ae4356a22bbb5ea20d5c6fc83cd2de])
XXX.XXX.XXX.XXX  rack1       Up     Normal  11.29 GB        11.45%              Token(bytes[39dd01bb66beeeb46627f0303671c30d])
XXX.XXX.XXX.XXX  rack1       Up     Normal  11.29 GB        11.45%              Token(bytes[3a49f707a7cea045935524900094c4e4])
XXX.XXX.XXX.XXX  rack1       Up     Normal  11.29 GB        11.45%              Token(bytes[3a58eba6a5730a75fd899cf77c93d6cb])

我的问题是,是否有其他工具/方法可以获取 Cassandra 集群中每个虚拟节点的实际负载?

提前致谢!

【问题讨论】:

  • 听起来很像您想使用 RandomPartitioner。这使您可以均匀地分配密钥。您是否手动选择了令牌?选择随机令牌(这是虚拟节点的默认设置)通常不会为 ByteOrderedPartitioner 提供良好的分布。

标签: cassandra cassandra-cli


【解决方案1】:

当您在没有键空间的情况下运行 nodetool ring 时,它会根据 SimpleStrategy 来检查负载以进行复制。如果您为 NetworkTopologyStrategy 正确分配了令牌,这将看起来“关闭”。

由于复制策略决定负载,并且每个键空间可以有不同的复制策略,因此您需要将键空间名称作为第二个参数传入,以查看每个键空间的真实负载分布。

如果您使用 NetworkTopologyStrategy,nodetool ring <keyspace> 将考虑数据中心和机架位置来确定您的令牌分配,并为您提供准确的负载值。

【讨论】:

    【解决方案2】:

    您是否尝试过 Cassandra OpsCenter? http://www.datastax.com/what-we-offer/products-services/datastax-opscenter

    我不确定(从未尝试过)是否可以专门获取每个虚拟节点的实际负载,但它是监控和管理数据库的好工具

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2015-03-17
      • 2014-03-08
      • 1970-01-01
      • 1970-01-01
      • 2011-11-11
      • 1970-01-01
      • 2018-10-20
      • 2019-04-28
      相关资源
      最近更新 更多