【发布时间】:2015-06-18 07:47:51
【问题描述】:
这是一个 python appengine 问题,mapreduce library 1.9.21 。
我将代码写入本地 blobstore 中的 blob,然后使用 mapreduce BlobstoreLineInputReader 进行处理。
鉴于 files api 即将消失,我想我会将我的所有处理重新定位到云存储。
我希望找到一个名为 GoogleCloudStorageLineInputReader 的类,但没有类似的东西。它藏在什么地方吗?
有什么方法可以使用 GoogleCloudStorageInputReader 读取行吗?
另一种可能性是使用 GoogleCloudStorageRecordInputReader,但为此我的输入文件需要采用 LevelDB 格式,我不知道如何创建它,除非使用 GoogleCloudStorageConsistentRecordOutputWriter,我不知道如何在 mapreduce 上下文之外使用它。我该怎么做?
或者我做这一切都错了,还有其他我错过的可能性吗?
【问题讨论】:
标签: python google-app-engine mapreduce pipeline