立方体设计 - ROLAP 考虑因素与 MOLAP答案

【问题标题】：Cube design - ROLAP considerations vs. MOLAP立方体设计 - ROLAP 考虑因素与 MOLAP
【发布时间】：2009-11-13 19:31:55
【问题描述】：

在设计 ROLAP 多维数据集而不是 MOLAP 时，是否有人有资源列出了要考虑的事项（我在 Pentaho 中做这件事，但我想其他实现的原理并没有什么不同）。例如，我在想这样的事情：

【问题讨论】：

【解决方案1】：

我是印度尼西亚的 Pentaho 实现者。首先，您当然应该尝试通过所涉及的代理键来聚合所有度量值组。

在 Mondrian 中，您可以使用额外的聚合表“缓存”一些计算。你可以在 Pentaho Aggregate Designer 中完成。但在那之后，您将需要在数据仓库/ETL 阶段进行额外的工作。

问候，

菲利斯

【讨论】：

【解决方案2】：

首先 - 设计相似，但它们由不同的性能和可扩展性策略驱动。

其次 - etl 过程几乎相同。除了 - 由于关系数据库中的可伸缩性特性，您通常会在 rolap 多维数据集中看到比 molap 多维数据集更多的数据。您经常会看到一个 rolap 立方体在一个非 rolap 数据库（仓库，甚至事务数据库），它不仅仅支持 rolap。

最后，如果数据量很大，通常会生成聚合表。这种聚合可以通过很多不同的方式完成，但我想说它通常不是由您的 ETL 流程驱动的，除非您缺乏管理单独的异步流程的能力，或者拥有使运行期间汇总作业不切实际的数据量。

【讨论】：

在这种情况下 - 更多信息：为此目的创建一个通用聚合器类非常容易。如果您每小时运行一次 ETL，那么您可以使用 ETL 生成每小时级别的聚合。如果您将 etl 生成的每小时聚合放入临时表并将结果合并到主表中，它将提供截至当前小时的聚合。然后，如有必要，您还可以有一个单独的流程，以进一步将这些数据汇总到每日级别。

【解决方案3】：

感谢 Feris 的链接和输入，但最后我还是选择了这本书：

我仔细阅读了Mondrian 站点+文档，但该书似乎更全面。

【讨论】：