【发布时间】:2016-12-30 07:22:58
【问题描述】:
我正在尝试使用以下脚本将 json 文件加载到 GoogleBigquery https://github.com/GoogleCloudPlatform/python-docs-samples/blob/master/bigquery/api/load_data_by_post.py 几乎没有修改。 我加了
,chunksize=10*1024*1024, resumable=True))
到 MediaFileUpload。
该脚本适用于包含几百万条记录的示例文件。实际文件大约 140 GB,包含大约 200,000,000 条记录。 insert_request.execute() 总是以
失败socket.error: `[Errno 32] Broken pipe`
半小时左右后。如何解决这个问题?每行小于 1 KB,因此不应该是配额问题。
【问题讨论】:
-
这里有同样的问题。 stackoverflow.com/questions/38971523/…
-
修正格式和错别字
-
您好 Jayadevan,我是 BigQuery 工程团队的一员,如果您想发布项目和工作 ID,我可以查看一下我们的日志中是否有任何突出的内容。跨度>
标签: python json google-bigquery