【发布时间】:2021-10-19 17:19:58
【问题描述】:
我开始
client = storage.Client()
bucket = client.get_bucket(BUCKET_NAME)
<what's next? Need something like client.list_folders(path)>
我知道如何:
列出所有带有
bucket.list_blobs()的blob(包括子文件夹中任意深度的blob)或者如何使用
bucket.list_blobs(prefix=<path to subfolder>)递归地列出给定文件夹中的所有blob
但是如果我的文件系统结构有100 顶级文件夹,每个文件夹都有数千个文件。有什么有效的方法可以只获取那些 100 顶级文件夹名称而不列出所有内部 blob?
【问题讨论】:
-
是的,只处理返回的
prefixes。我没有要发布的示例。 Google Cloud Storage 使用prefix和separator来方便列出对象。希望这个提示对您有所帮助。 -
@JohnHanley 关于“
prefixes”的优秀提示。但是,在您迭代 list_blobs 第一个元素之前,它不会加载。 PS 实际上是delimiter而不是 GCS 上的separator但我们知道你的意思。
标签: python google-cloud-platform google-cloud-storage