【问题标题】:Big data handling using cassandra in real time使用 cassandra 实时处理大数据
【发布时间】:2014-07-13 13:58:03
【问题描述】:

我正在为销售人员开发一个应用程序。我无法弄清楚如何在我的应用程序中管理大数据。以下是场景。

我根据以下标准划分了位置。

Country => State => City => Territory => Area => Outlet。

我管理日常销售的表结构大致如下。

插座 ID - 1,2,3,4,5,6 ...

用户 ID - EMP001,EMP002,EMP003,EMP004,EMP005,EMP006 ...

产品 ID - 78,54,21,11,09,83 ..

数量 - 12,34,67,43,70,03 ..

日期和时间 - 01/05/2014 – 11.00,01/05/2014 – 12.00,01/05/2014 – 14.00 ..

和其他文件。 基于上述数据结构,将有许多实时查看的报告。

我们每天有 100 万行插入。我已经将 Casandra 缩小为 NO-SQL 数据库。

现在我需要一个可以查询和管理实时分析的数据库。听说过这些开源工具,例如 - Hbase、Pig、Hive、Presto DB、Impala、Sharp、Shark 等。

目前我无法判断哪个最适合我的实时分析和预测产品销售应用程序。

我们将非常感谢您的帮助和指导。

谢谢

【问题讨论】:

    标签: cassandra hbase apache-pig presto shark-sql


    【解决方案1】:

    Presto + Cassandra 非常适合您。 Cassandra + Shark 也可以。

    【讨论】:

    • 我想和 Presto 一起去,但除了 Presto 网站,我没有找到太多信息。
    猜你喜欢
    • 2015-07-17
    • 2012-10-17
    • 2011-11-06
    • 1970-01-01
    • 2012-11-01
    • 1970-01-01
    • 2021-05-14
    • 2018-08-31
    • 1970-01-01
    相关资源
    最近更新 更多