【发布时间】:2023-03-14 15:35:02
【问题描述】:
我正在寻找一种方法来提取巨大的数据集(18 TB+ 在这里找到https://github.com/cvdfoundation/open-images-dataset#download-images-with-bounding-boxes-annotations)考虑到这一点我需要这个过程要快(即我不想花两倍的时间进行第一次复制和然后提取文件)另外我不希望档案占用额外的空间,甚至是一个 20 GB+ 的档案。
对如何实现这一目标有任何想法吗?
【问题讨论】: