cassandra + pig 宽柱

【问题标题】：cassandra + pig with wide columnscassandra + pig 宽柱
【发布时间】：2012-05-22 21:24:02
【问题描述】：

我目前正在开发一个推荐应用程序，并且我正在使用 cassandra 与 hadoop 和 pig 进行 map/reduce 工作。为了利用列名属性，我们的团队决定使用无值列和聚合列名来存储数据，例如，特定内容的所有命中都存储在具有单行的列族中，并且每一列都是针对内容使用以下结构：

rowkey = 'single_row' {
    id_content:hit_date, -
    .
    .
    .
}

使用这种模式，我们可以获得宽行而不是窄行；问题是，我需要如何操作 Pig 中的数据才能使用此模式将数据存储在 cassandra 中？

【问题讨论】：

【解决方案1】：

我不确定您是否使用复合列，或者您是否只是连接 id_content 和 hit_date。

对于普通（即非复合）列，架构为：

(key, {(col_name, col_value), ...})

对于复合列，我认为架构如下：

(key, {((col_name_part_1, col_name_part_2), col_value), ...})

此评估（针对复合列）基于阅读在https://issues.apache.org/jira/browse/CASSANDRA-3684 上提交的补丁

【讨论】：