【发布时间】:2017-08-15 01:04:46
【问题描述】:
在 Google Cloud Dataflow 上使用 Apache Beam Python SDK 2.0.0 时,安装 Pandas 0.20.3 需要很长时间(大约 8 分钟)。安装主要挂在消息Running setup.py bdist_wheel for pandas: still running...上。然而,在我的机器上,安装相同版本的 pandas 甚至不需要 30 秒(即使在清除 pip 缓存之后)。安装 pandas 大约需要现在运行我的管道的成本的三分之一。关于为什么这需要这么多时间的任何想法?
【问题讨论】:
标签: python pandas google-cloud-dataflow apache-beam