【发布时间】:2018-11-12 13:38:08
【问题描述】:
BigQuery 如何计算要为嵌套列处理的数据大小?
我有想要加载到 BigQuery 的数据,但我不确定应该使用的架构。
我拥有的数据(其中包括)以下列:
timestampsessionId-
event(必填) event.id-
event.details(可以为空的记录) event.details.typeevent.details.name-
event.attributes(重复记录) event.attributes.keyevent.attributes.value
我的问题:
-
如果我只查询
event.id,是否也会扫描其他event.*列中的数据?选择 event.id FROM
table_name
BigQuery UI 显示现有表上这些查询的扫描数据大小没有差异(该表没有不可重复的嵌套列)。
SELECT attrs.name FROM `other_table_name`, UNNEST(attributes) AS attrs
SELECT attrs.name, attrs.value FROM `other_table_name`, UNNEST(attributes) AS attrs
- 是否因为 UNNEST 操作而扫描了两个
attributes.*列?
很遗憾,来自 Google 的(详细)信息没有回答这些问题,因为它没有提到带有 query pricing 的嵌套列,并且在描述 data sizes 时过于模糊
【问题讨论】:
标签: google-bigquery