【发布时间】:2012-05-22 21:24:02
【问题描述】:
我目前正在开发一个推荐应用程序,并且我正在使用 cassandra 与 hadoop 和 pig 进行 map/reduce 工作。 为了利用列名属性,我们的团队决定使用无值列和聚合列名来存储数据,例如,特定内容的所有命中都存储在具有单行的列族中,并且每一列都是针对内容使用以下结构:
rowkey = 'single_row' {
id_content:hit_date, -
.
.
.
}
使用这种模式,我们可以获得宽行而不是窄行;问题是,我需要如何操作 Pig 中的数据才能使用此模式将数据存储在 cassandra 中?
【问题讨论】:
标签: cassandra apache-pig