【发布时间】:2024-05-01 23:05:03
【问题描述】:
如何从声音流中提取特征?
我尝试将 htk、pytorch 或其他库用于 filterbank。
但他们需要加载 wav 文件。
我想直接处理pyaudio的麦克风输入。
p = pyaudio.PyAudio()
stream = p.open(format=pyaudio.paInt16, channels=1, rate=44100, input=True)
while stream.is_active():
input = stream.read(CHUNK)
【问题讨论】:
标签: python speech-recognition audio-streaming speech-to-text pyaudio