【问题标题】：Create a column of UUIDs in Google BigQuery在 Google BigQuery 中创建一列 UUID
【发布时间】：2018-10-02 00:25:53
【问题描述】：

Google BigQuery 不支持 UUID 作为数据类型。那么，哪个选项更好地存储它：

【问题讨论】：

【解决方案1】：

编辑：BigQuery 现在支持function called GENERATE_UUID。这将返回一个STRING，其中包含五组中的 32 个十六进制数字，由连字符分隔，格式为 8-4-4-4-12。

原创内容：

一些权衡的讨论：

使用`STRING`

UUID 与其他系统中的表示兼容，例如，如果您导出为 CSV，然后想要与其他地方的导出合并。
UUID 与 BigQuery 的 probably UUID implementation 兼容。您将能够使用函数生成相同形式的 UUID（当实现该特性时）。
如果您稍后决定将 UUID 表示为 BYTES，则可以使用 UDF 进行转换。
缺点：比较可能不如 BYTES 快，具体取决于操作员，因为字符串比较必须考虑 UTF-8 编码。（听起来这对您来说不是问题）。
缺点：存储成本较高。（听起来这对您来说不是问题）。

使用`BYTES`

【讨论】：

TLDR：使用 STRING，因为 Google 实现了返回 STRING 类型的 GENERATE_UUID：cloud.google.com/bigquery/docs/reference/standard-sql/…
您应该在何时/何地运行GENERATE_UUID() 语句？我假设在表已经创建之后的某种ALTER TABLE 语句中，对吗？