使用 Caffe 的基于 CNN 的一维信号分类

【问题标题】：CNN-based 1-D signal classification using Caffe使用 Caffe 的基于 CNN 的一维信号分类
【发布时间】：2015-06-30 18:30:22
【问题描述】：

我正在寻找一个使用 Caffe 基于 CNN 的简单直接的一维信号分类（例如语音信号）示例。

从Caffe 网站，可以学习一些图像分类任务的示例和教程。相反，我正在寻找有关一维信号的示例和教程。

非常感谢您的回答。

【问题讨论】：

【解决方案1】：

从概念上讲，使用 1D 数据与使用 2D 数据之间没有有意义的区别。您需要一个数据库，而不是 2D 图像，您将拥有 1D 形状“图像”（通道：1，高度：1，宽度：d），并确保所有内核都使用 kernel_w 和 kernel_h 而不是 kernel_size（将内核设置为方形）。

如果您正在寻找可以使用的示例架构，您可以参考这篇文章来训练基于原始波形语音数据的 CNN：Speech Acoustic Modeling from Raw Multichannel Waveforms。

还有an open issue on Caffe's Github page 要求提供语音领域的示例，您可以查看更多指向潜在实现的链接。

【讨论】：