【发布时间】:2016-11-18 10:06:43
【问题描述】:
是否有人与我发生了与 Google Cloud Dataflow BigQueryIO.Write 发生未知错误(http 代码 500)相同的问题?
我使用 Dataflow 处理 4 月、5 月、6 月的一些数据,我使用相同的代码来处理 4 月的数据 (400MB) 并写入 BigQuery 成功,但是当我处理 5 月 (60MB) 或 6 月 (90MB) 的数据时,它失败了。
- 四月、五月和六月的数据格式相同。
- 将编写器从 BigQuery 更改为 TextIO,工作会成功,所以我认为数据格式很好。
- Log Dashboard 没有任何错误日志.....
- 只有系统相同的未知错误
我写的代码在这里:http://pastie.org/10907947
“执行 BigQuery 导入作业”后的错误消息:
Workflow failed. Causes:
(cc846): S01:Read Files/Read+Window.Into()+AnonymousParDo+BigQueryIO.Write/DataflowPipelineRunner.BatchBigQueryIOWrite/DataflowPipelineRunner.BatchBigQueryIONativeWrite failed.,
(e19a27451b49ae8d): BigQuery import job "dataflow_job_631261" failed., (e19a745a666): BigQuery creation of import job for table "hi_event_m6" in dataset "TESTSET" in project "lib-ro-123" failed.,
(e19a2749ae3f): BigQuery execution failed.,
(e19a2745a618): Error: Message: An internal error occurred and the request could not be completed. HTTP Code: 500
【问题讨论】:
标签: java google-bigquery google-cloud-platform google-cloud-dataflow