【发布时间】:2020-06-04 18:15:22
【问题描述】:
我正在尝试使用 write_truncate 截断 Bigquery 中的表,但它没有发生,而是像 write_append 一样工作。它正在附加数据但不截断表格。
有人可以帮忙解决这个问题吗?
我的代码:
with beam.Pipeline(options=Pipeline options()) as p:
read=(p|"Read BQ">>beam.io.Read(beam.io.BigQuerySource(
query='select empid from'\'`PRoject_Id.data_set.emp_details`',
use_standard_sql=True))|"process">>beam.Map(lambda ele:{'EMPID':ele['EMPID']})|
"Write">>beam.io.WriteToBigQuery(
'PROJECT_ID:data_set.emp_out',
schema='EMPID:STRING',
write_disposition=beam.io.BigQueryDisposition.WRITE_TRUNCATE,
create_dispositiom=beam.io.BigQueryDisposition.CREATE_IF_NEDED))
if __name__="__main__":
run().wait_until_finish()
【问题讨论】:
标签: google-bigquery google-cloud-dataflow apache-beam