【发布时间】:2021-05-07 15:11:42
【问题描述】:
我已经编写了从 mongodb 集合中读取数据并将其写入 gcs 存储桶的 pyton 代码。
我的数据流管道如下:
p
| ReadFromMongoDB(uri='mongodb+srv://mongo_url',db='db_name',coll='column_name',bucket_auto=True)
| "WriteMyFile" >> beam.io.WriteToText('gs://bucket_name/file123.json')
p.run()
我的数据流管道失败并出现以下错误:
pymongo.errors.ConfigurationError: The "dnspython" module must be installed to use mongodb+srv:// URIs
根据this 文档,pymongo(解决 dnspython 问题所需的依赖项)已安装在数据流工作程序中。还需要做什么?
【问题讨论】:
标签: python-3.x mongodb google-cloud-platform google-cloud-dataflow apache-beam