【发布时间】:2019-05-20 19:13:16
【问题描述】:
我一直在使用 Python 运行数据流作业,该 Python 使用了 pandas 库。它突然开始失败并出现以下错误:
文件“/usr/local/lib/python2.7/dist-packages/pandas_gbq/auth.py”,第 305 行,在 _try_credentials 客户端 = bigquery.Client(project=project_id, credentials=credentials)
文件“/usr/local/lib/python2.7/dist-packages/google/cloud/bigquery/client.py”,第 161 行,在 init 中 self._connection = Connection(self, client_info=client_info)
init 中的文件“/usr/local/lib/python2.7/dist-packages/google/cloud/bigquery/_http.py”,第 33 行 super(Connection, self).init(client, client_info)
TypeError: init() 只需要 2 个参数(给定 3 个)
这一步失败了:
import pandas as pd
data = pd.read_gbq(query=query, project_id=project, dialect='standard', private_key=credentials)
我的安装文件如下所示:
install_requires=[
'google-cloud-storage==1.11.0',
'requests==2.19.1',
'urllib3==1.23',
'pandas-gbq==0.6.1',
'pandas==0.23.4',
'protobuf==3.6.0'
]
这与我本地的版本相同,代码正在运行。 当作业开始失败时,尚未对作业进行任何更改。它在本地成功运行,但是当我使用 Dataflowrunner 运行时我看到了这个问题。我认为这是一个依赖问题。我正在使用的任何软件包版本是否存在记录在案的问题?或者我需要将特定的包版本添加到我的设置文件中吗?
【问题讨论】:
标签: pandas python-2.7 google-bigquery google-cloud-dataflow