【发布时间】:2019-10-04 14:18:33
【问题描述】:
我想使用 python 来处理只能识别我的声音的音频文件。例如,我和一辆树莓派汽车谈论“前进”。它会直走,但其他说“向前”的人无法控制我的车。
或者我想将另一个人的声音视为噪音并消除它。我能怎么做?有人告诉我可以使用 pca 或 ica 来减少那些噪音。
【问题讨论】:
标签: python pca voice-recognition noise noise-reduction
我想使用 python 来处理只能识别我的声音的音频文件。例如,我和一辆树莓派汽车谈论“前进”。它会直走,但其他说“向前”的人无法控制我的车。
或者我想将另一个人的声音视为噪音并消除它。我能怎么做?有人告诉我可以使用 pca 或 ica 来减少那些噪音。
【问题讨论】:
标签: python pca voice-recognition noise noise-reduction
您首先识别命令,然后使用 i-vector 或 d-vector 提取说话者以识别您。
例如,您可以找到算法in Apple's blog 的描述。您可以在Kaldi 中找到上述算法的实现,但它们不太容易集成。
【讨论】: