【发布时间】:2015-06-17 12:50:22
【问题描述】:
我们大量使用 Cassandra 宽行来存储时间序列,因为它们非常适合该用例。
create table user_events (
user_id text,
timestmp timestamp,
event text,
primary key((user_id), timestmp));
假设我想使用 spark 进行以下聚合:选择上个月至少有 1 个事件的所有 user_id。
最有效的方法是什么?
【问题讨论】: