【发布时间】:2019-12-04 07:37:42
【问题描述】:
如何加载 Parquet 数据以从 Google 云存储中触发并将其保存到 BigQuery?
【问题讨论】:
-
很好哈哈。
标签: apache-spark google-bigquery google-cloud-storage
如何加载 Parquet 数据以从 Google 云存储中触发并将其保存到 BigQuery?
【问题讨论】:
标签: apache-spark google-bigquery google-cloud-storage
要将数据从 Google Cloud Storage 加载到 Spark:
df=spark.read.parquet("gs://<path to parquet file>")
你可以在做必要的转换后以类似的方式编写(将gs添加到文件名的开头)
您可以通过以下链接将 parquet 中的云存储中的数据从 parquet 加载到 BigQuery:
https://cloud.google.com/bigquery/docs/loading-data-cloud-storage-parquet
【讨论】: