【发布时间】:2019-02-27 20:32:41
【问题描述】:
我有一个 100GB 的 CSV 文件(2 亿行 X 60 列),用于通过提取在 Tableau Desktop 中创建仪表板。我一直面临性能问题,当我选择/取消选择任何维度过滤器时,刷新仪表板大约需要 2 分钟。使用 Tableau Server 可以解决这个问题吗?如果是,我应该配置多少个节点以及每个节点的配置是什么?
缓存设置也有问题吗?
我还考虑将这些数据放入像 Redshift 这样的列式数据库中,然后使用实时连接,以便使用 Redshift 查询引擎而不是 Tableau。对于这种小型数据集,这是不是有点矫枉过正?
【问题讨论】:
-
这不是一个小数据集,尤其是在您使用本地存储时。你试过谷歌的 BigQuery 吗?这具有非常低的启动成本,并且可以对此类数据集非常敏感。
标签: amazon-redshift tableau-api