【发布时间】:2014-07-13 13:58:03
【问题描述】:
我正在为销售人员开发一个应用程序。我无法弄清楚如何在我的应用程序中管理大数据。以下是场景。
我根据以下标准划分了位置。
Country => State => City => Territory => Area => Outlet。
我管理日常销售的表结构大致如下。
插座 ID - 1,2,3,4,5,6 ...
用户 ID - EMP001,EMP002,EMP003,EMP004,EMP005,EMP006 ...
产品 ID - 78,54,21,11,09,83 ..
数量 - 12,34,67,43,70,03 ..
日期和时间 - 01/05/2014 – 11.00,01/05/2014 – 12.00,01/05/2014 – 14.00 ..
和其他文件。 基于上述数据结构,将有许多实时查看的报告。
我们每天有 100 万行插入。我已经将 Casandra 缩小为 NO-SQL 数据库。
现在我需要一个可以查询和管理实时分析的数据库。听说过这些开源工具,例如 - Hbase、Pig、Hive、Presto DB、Impala、Sharp、Shark 等。
目前我无法判断哪个最适合我的实时分析和预测产品销售应用程序。
我们将非常感谢您的帮助和指导。
谢谢
【问题讨论】:
标签: cassandra hbase apache-pig presto shark-sql