【发布时间】:2012-04-22 19:44:15
【问题描述】:
大数据 = 1TB,每年增长 10%。 模型很简单。一张有 25 列的表。 没有与其他表的连接..
我希望对 25 列的子集进行简单的查询过滤..
我猜想在过滤列上有索引的传统 SQL 存储是必要的。 Hadoop 是矫枉过正,没有意义,因为这是一个实时服务。蒙哥?像 pentaho 这样的双引擎?
有什么建议吗?
【问题讨论】:
-
任何商业数据仓库解决方案都可以,例如查看 DB2 产品
-
那你到底是为了什么?效果好吗?
-
我最终使用了elasticsearch.org太棒了!
标签: postgresql hadoop nosql analytics business-intelligence