【发布时间】:2022-01-08 01:41:17
【问题描述】:
有一个用例将 Excel 文件(.xls、.xlsx)加载到 Snowflake 中。
使用 SnowSQL PUT 命令,我可以将文件加载到 Stage(用户阶段),并且到目前为止它工作正常。下一步是使用 COPY INTO 命令从 User Stage 加载到 Snowflake Table。问题是 Snowflake 中没有可用的 FILE_FORMAT 来指定 XLS 类型数据。
我不想将 XLS 转换为 CSV 格式,这是 FILE_FORMAT 类型的可用选项。 任何线索如何在不修改源 Excel 文件的情况下做到这一点?
【问题讨论】:
-
使用 Excel 的 File->Save As->File Format,可以轻松地将 Excel 文件转换为 CSV。但是,是的,这意味着来自源文件。我认为以后不可能在 Snowflake 内完成。例如,您还可以使用 Python 将 xls 文件读入数据帧并将其加载到雪花中,但同样来自源代码。
-
Sergiu 提到的 HI 一种选择是将其保存为 CSV 并加载到 Snowflake,有什么理由不想转换为 CSV 吗?
-
@hkandpal:一个 excel 文件中有多个工作表,大约 500 多个文件需要上传到 Snowflake。在 csv 中转换它们是非常手动且容易出错的过程。此外,Excel 中有 unicode 字符,并且在转换过程中也存在丢失 En-Dash 等特殊字符的风险。转换后验证这么多文件又是一项艰巨的任务。
标签: excel snowflake-cloud-data-platform xls