【发布时间】:2026-02-05 13:00:01
【问题描述】:
我有一张如下所示的表格:
我正在寻找一个表格,它给出了l_0, l_1, l_2, l_3 字段中元素的频率计数。
例如,输出应如下所示:
| author_id | year | l_o.name | l_0.count| l1.name | l1.count | l2.name | l2.count| l3.name | l3.count|
| 2164089123 | 1987 | biology | 3 | botany | 3 | | | | |
| 2595831531 | 1987 | computer science | 2 | simulation | 2 | computer simulation | 2 | mathematical model | 2 |
编辑:
在某些情况下,数组字段可能包含不止一种类型的元素。例如l_0 可以是['biology', 'biology', 'geometry', 'geometry']。在这种情况下,字段l_0, l_1, l_2, l_3 的输出将是一个嵌套重复字段,其中包含l_0.name 中的所有元素以及l_0.count 中的所有相应计数。
【问题讨论】:
-
目前还不清楚每个重复字段的具体内容是什么!每个字段总是相同的元素还是可以是多个?如果是多个 - 结果应该是什么样子?
-
每个字段的元素并不总是相同。对于多个元素,对象的计数应该是具有元素名称和元素计数的重复嵌套对象。
标签: google-bigquery bigquery-standard-sql