【发布时间】:2013-10-05 14:55:37
【问题描述】:
我在开发环境中有一个 linux(ubuntu) 服务器,我也计划在生产环境中使用一个服务器。
我有从 Nutch 2.2.1 生成的爬网数据,我想存储在 HBase 0.90.6 中。因为,我不打算使用多台机器,(我只有一个服务器)在我的情况下,哪种 HBase 模式最适合生产环境 - 伪或完全分布式?
【问题讨论】:
我在开发环境中有一个 linux(ubuntu) 服务器,我也计划在生产环境中使用一个服务器。
我有从 Nutch 2.2.1 生成的爬网数据,我想存储在 HBase 0.90.6 中。因为,我不打算使用多台机器,(我只有一个服务器)在我的情况下,哪种 HBase 模式最适合生产环境 - 伪或完全分布式?
【问题讨论】:
伪分布式模式会更好,因为在独立模式下使用本地 FS。这意味着您无法利用 HDFS+MR 组合提供的并行性。
【讨论】: