【问题标题】:Using Deep Learning for sequencial data对序列数据使用深度学习
【发布时间】:2015-10-07 15:58:50
【问题描述】:

我有大量的标记数据序列,我想使用深度学习对它们进行分类。例如: 我有 n 个文件 (f1 f2 f3...fn) 每个文件都有非常多的序列:

f1

0 15 0 0 0 2...

0 2 4 4 4 8...

1 0 0 5 7 8...

0 3 5 6 0 22...

f2

0 0 0 0 1 0...

1 0 3 0 5 0...

3 0 0 0 11 4...

2 0 7 8 1 3...

现在对于给定的序列(例如:1 4 3 0 0 0 0....),(深度学习)程序应该能够将其分类到正确的文件中。您能否以 easy_to_understand 的方式解释如何使用深度学习来解决这个问题? 我打算使用 R 和/或 Python。我会很高兴听到一些有用的深度学习库来解决这些问题。

【问题讨论】:

  • Theano、Torch、DeepLearning4j、0xData-H2o、Berkely Caffe
  • 使用其中一个或部分库解决此问题的步骤是什么?

标签: deep-learning


【解决方案1】:

不确定这个问题是否真的需要机器学习(甚至深度学习)来解决。如果您可以找到每个文件的唯一序列,那么简单的映射就可以完成这项工作(因为您说过“每个文件都有非常多的序列”)。

如果不是这样,那么这是classification problem。简而言之,在分类问题中,我们学习 X 的模式来预测 y。在您的情况下, X 将是文件中的序列, y 将是文件名。在进入深度学习之前,我建议你看看here

【讨论】:

    【解决方案2】:

    尝试使用 LSTM 来完成这项任务。顺序任务是 LSTM 的自然使用。可以使用python,有theano、pybrain、tensorflow、torch等几个库。 例如,声音是一种顺序现象,现代语音识别(谷歌、微软、百度)使用 LST 来完成这项任务。

    【讨论】:

      猜你喜欢
      • 2021-01-30
      • 1970-01-01
      • 1970-01-01
      • 2016-09-07
      • 2017-10-20
      • 1970-01-01
      • 1970-01-01
      • 2018-03-29
      • 2019-09-13
      相关资源
      最近更新 更多