【发布时间】:2021-10-04 14:49:27
【问题描述】:
我有一张几 TB 大小的 Snowflake 桌子。我现在要决定是在变量列中包含字段还是将其作为独立列。字段的数据类型是简单的字符串。
我通过从变量列中查询此字段(在 where 子句中)与直接作为单独列进行查询来评估和比较性能。统计数据显示,从变量内部查询比从常规列查询慢 40%-60%。
在 Snowflake 文档中找不到任何说明查询 varchar 变体较慢的内容。对此的任何想法都非常感谢。我需要在此基础上做出一些重要的决定,并对桌子的最终用户进行教育
提前致谢
【问题讨论】:
-
我建议查看两个查询的查询配置文件,看看有什么不同。 docs.snowflake.com/en/user-guide/ui-query-profile.html 我正在与一个客户合作,该客户拥有带有变体的大型表,他们将一些列式数据存储在标准列中,并将“不太常用”的数据存储在变体中,效果很好并且性能很好。
-
感谢 Rich 的投入。我确实认为这也是要走的路。经常查询的数据最好放在标准列中
标签: snowflake-cloud-data-platform