【发布时间】:2015-06-30 18:30:22
【问题描述】:
我正在寻找一个使用 Caffe 基于 CNN 的简单直接的一维信号分类(例如语音信号)示例。
从Caffe 网站,可以学习一些图像分类任务的示例和教程。相反,我正在寻找有关一维信号的示例和教程。
非常感谢您的回答。
【问题讨论】:
我正在寻找一个使用 Caffe 基于 CNN 的简单直接的一维信号分类(例如语音信号)示例。
从Caffe 网站,可以学习一些图像分类任务的示例和教程。相反,我正在寻找有关一维信号的示例和教程。
非常感谢您的回答。
【问题讨论】:
从概念上讲,使用 1D 数据与使用 2D 数据之间没有有意义的区别。您需要一个数据库,而不是 2D 图像,您将拥有 1D 形状“图像”(通道:1,高度:1,宽度:d),并确保所有内核都使用 kernel_w 和 kernel_h 而不是 kernel_size(将内核设置为方形)。
如果您正在寻找可以使用的示例架构,您可以参考这篇文章来训练基于原始波形语音数据的 CNN:Speech Acoustic Modeling from Raw Multichannel Waveforms。
还有an open issue on Caffe's Github page 要求提供语音领域的示例,您可以查看更多指向潜在实现的链接。
【讨论】: