【发布时间】:2017-08-22 21:36:21
【问题描述】:
我正在研究类语音识别,从而处理音频信号,即对原始音频信号应用一系列变换和数字信号处理 (DSP) 技术,以获得有价值的表示,然后将其输入机器学习算法。
我的代码库完全用 Matlab 编写,仅适用于有限(有界)信号。我计划迁移到一个可以处理有限和无限(流)音频信号的解决方案,最好是在 python 中(主要用于机器学习和音频信号处理中的第三方库可用性)。
经过一些研究,我发现 Apache Beam 非常适合我的情况,但是,python SDK 中似乎没有某些功能,比如对我来说非常重要的窗口概念,两者都适用于有界和无限信号(通常,我的代码处理 32 毫秒的帧/窗口)。
所以,我正在寻求建议:
- Apache Beam(python SDK)对音频信号的针对性 处理;
- 如何解决我刚才提到的限制;
- 在我的情况下还有其他选择吗?
【问题讨论】:
标签: python audio apache-beam