【问题标题】:Unzip Voxceleb dataset on Google Colab在 Google Colab 上解压 Voxceleb 数据集
【发布时间】:2020-11-07 07:22:15
【问题描述】:

我正在尝试使用 voxceleb 数据集进行一些音频分类。我使用这个命令来下载数据集:

!wget --user=.... --password=... https://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1a/vox2_dev_aac_partaa

并使用filetype,我知道这是一个 zip 文件。但是,当我尝试从 python 以及通过终端解压缩它时,我无法解压。以下是错误:

通过 Python:

----------------------------------- ---------------------------- BadZipFile Traceback(最近调用 最后)在() ----> 1 使用 zipfile.ZipFile(f,'r') 作为 zip_ref: 2 zip_ref.extractall("audio_data") 3 # !解压vox2_dev_aac_partaa -d audio_data

1 帧 /usr/lib/python3.6/zipfile.py 在 _RealGetContents(self)
1196 raise BadZipFile("文件不是 zip 文件") 1197
如果不是 endrec: -> 1198 raise BadZipFile("File is not a zip file") 1199 if self.debug > 1: 1200 print(endrec)

BadZipFile:文件不是 zip 文件

并通过终端,运行以下命令unzip vox2_dev_aac_partaa -d audio_data

解压缩:找不到或打开vox2_dev_aac_partaa, vox2_dev_aac_partaa.zip 或 vox2_dev_aac_partaa.ZIP。

我该怎么办?

【问题讨论】:

  • 尝试手动登录下载文件并解压。看看这是否有效,如果无效,则说明文件本身有问题

标签: python-3.x terminal dataset unzip


【解决方案1】:

您需要下载dataset 中提供的所有 zip 文件,并按照上述方式连接它们。

另外,使用wget的时候好像有认证问题,所以我尝试了curl。

# Download all 8 files similarly.
curl -o vox2_dev_aac_partaa.zip -u <your username>:<your password> https://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox1a/vox2_dev_aac_partaa

然后按照他们网站上的说明连接它们

cat vox2_dev_aac* > vox2_aac.zip

然后解压。

unzip vox2_aac.zip -d audio_files

【讨论】:

    猜你喜欢
    • 2020-09-23
    • 2019-05-31
    • 1970-01-01
    • 2021-03-21
    • 2021-03-17
    • 2018-08-24
    • 2020-12-05
    • 1970-01-01
    • 2022-08-04
    相关资源
    最近更新 更多