【问题标题】:Non-image data augmentation非图像数据增强
【发布时间】:2023-09-27 14:28:01
【问题描述】:

我正在寻找有关数据增强的算法和/或教程,但它们都属于图像增强,是否可以在其他数据集中这样做? 我正在研究帕金森数据集 (https://archive.ics.uci.edu/ml/datasets/parkinsons) 并想用 python 创建一个数据 aug 示例,这可能吗?还是我应该像 mnist/fmnist 一样使用 smt?

【问题讨论】:

  • 您的数据似乎没有问题?如果正确,您是否尝试过在谷歌中搜索“声音数据的数据增强”?您绝对可以通过将声音转换为频谱图来对声音进行数据增强,然后进行类似于图像但在频谱图上的数据增强。就像在这个 towardsdatascience.com/… 中的特定示例一样

标签: python machine-learning data-augmentation


【解决方案1】:

如果您可以访问实际的录音,您可以应用一些增强技术used in speech recognition,然后重新提取基频等特征。但是,由于您直接处理功能,因此增强更加棘手。可以通过在现有样本之间进行插值或添加噪声来生成合成样本,但由于特征高度相关,因此您需要一种聪明的方法(参见this paper 获取简单方法,this one 获取更先进的技术)。如果您遇到类不平衡问题,您可以尝试简单地过采样或过采样。

【讨论】: