【问题标题】:Are there similar datasets to MNIST?是否有与 MNIST 类似的数据集?
【发布时间】:2013-03-23 08:38:25
【问题描述】:

我正在研究机器学习。现在我想用一些著名的数据集来测试我的算法。由于我是这方面的新手,除了MNIST,我找不到其他合适的数据集。我觉得 MNIST 非常适合我们的研究。有谁知道一些与 MNIST 类似的数据集?

P.S 我知道另一个经常使用的手写数字数据集,称为 USPS 数据集。但是我需要一个包含更多训练示例的数据集(通常超过 10000 个并且与 MNIST 中的训练示例数量相当),因此 USPS 不在我的选择范围内。

【问题讨论】:

  • 这取决于你想做什么。 MNIST 是一个很棒的包含手写数字的数据集。你想处理手写数字还是其他东西(面孔、手写字母等)?
  • 您可以在此处找到已解码的 MNIST 数据集版本:mnist-decoded.000webhostapp.com

标签: machine-learning mnist


【解决方案1】:

机器学习档案 (http://archive.ics.uci.edu/ml/) 包含各种各样的数据集,包括适合分类的数据集,例如 MINIST。 (http://archive.ics.uci.edu/ml/datasets/Skin+Segmentation)。

如果不知道你想用你的算法演示什么,我不能说它们中的哪一个是合适的,但是 UCI 档案中的任何东西都是众所周知的。

【讨论】:

    【解决方案2】:

    您可以尝试Fashion MNISTKuzushiji MNIST,它们的属性与 MNIST 非常相似,但更难预测。来自 Fashion MNIST 的页面:

    说真的,我们正在讨论替换 MNIST。以下是一些很好的理由:

    • MNIST 太容易了。卷积网络在 MNIST 上可以达到 99.7%。经典的机器学习算法也可以轻松达到 97%。查看我们的 Fashion-MNIST 与 MNIST 的并行基准测试,并阅读“大多数 MNIST 数字对只需一个像素即可很好地区分。”
    • MNIST 被过度使用。在 2017 年 4 月的 Twitter 帖子中,Google Brain 研究科学家和深度学习专家 Ian Goodfellow 呼吁人们远离 MNIST。
    • 深度学习专家/Keras 作者 François Chollet 在 2017 年 4 月的 Twitter 帖子中指出,MNIST 不能代表现代 CV 任务。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2019-08-27
      • 1970-01-01
      • 2020-05-22
      • 2020-03-12
      • 2019-04-10
      • 2016-03-21
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多