【发布时间】:2019-07-31 02:54:20
【问题描述】:
描述我正在做的最简单的方法基本上是遵循本教程:Import a CSV file into a Cloud Bigtable table,但在他们开始数据流作业的部分中,他们使用 Java:
mvn package exec:exec \
-DCsvImport \
-Dbigtable.projectID=YOUR_PROJECT_ID \
-Dbigtable.instanceID=YOUR_INSTANCE_ID \
-Dbigtable.table="YOUR_TABLE_ID" \
-DinputFile="YOUR_FILE" \
-Dheaders="YOUR_HEADERS"
有没有办法在 python 中执行此特定步骤?我能找到的最接近的是 apache_beam.examples.wordcount 示例 here,但最终我希望看到一些代码,我可以在其中使用 Python 将一些自定义添加到 Dataflow 作业中。
【问题讨论】:
标签: python google-cloud-platform google-cloud-dataflow google-cloud-bigtable