使用 Python 读取输入声音信号答案

【问题标题】：Reading input sound signal using Python使用 Python 读取输入声音信号
【发布时间】：2016-05-22 13:01:58
【问题描述】：

我需要从连接了插孔的麦克风获取声音信号，并使用该数据在 Python 中立即进行处理。

处理及后续步骤一目了然。我只是在从程序中获取信号时迷失了方向。通道数量无关紧要，一个就足够了。我不会播放声音，所以声卡上应该不需要 ASIO。

我的问题是：如何从 Python 中捕获 Jack 音频？（如果有一个包，有据可查的例子，那就太好了:-)。

【问题讨论】：

【解决方案1】：

你试过pyaudio吗？安装：

python -m pip install pyaudio

录音示例，来自官网：

PyAudio 示例：录制几秒钟的音频并将其保存到 WAVE 文件中。

import pyaudio
import wave

CHUNK = 1024
FORMAT = pyaudio.paInt16
CHANNELS = 2
RATE = 44100
RECORD_SECONDS = 5
WAVE_OUTPUT_FILENAME = "output.wav"

p = pyaudio.PyAudio()

stream = p.open(format=FORMAT,
                channels=CHANNELS,
                rate=RATE,
                input=True,
                frames_per_buffer=CHUNK)

print("* recording")

frames = []

for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
    data = stream.read(CHUNK)
    frames.append(data)

print("* done recording")

stream.stop_stream()
stream.close()
p.terminate()

wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
wf.setnchannels(CHANNELS)
wf.setsampwidth(p.get_sample_size(FORMAT))
wf.setframerate(RATE)
wf.writeframes(b''.join(frames))
wf.close()

此示例适用于我的笔记本电脑，在 Windows 8.1 中使用 Python 2.7.11（和 3.5.1），pyaudio 0.2.9。

【讨论】：

是否可以同时从麦克风录制和播放到扬声器？从编程的角度来看，读取 CHUNK 大小数据后，通过扬声器的流播放。延迟太短，人耳无法察觉。

【解决方案2】：

您打算从麦克风中获取音频片段还是流式传输？无论哪种情况，都可以使用sounddevice。

您可以使用
pip install sounddevice --user

安装 python 模块

API详情请参考官网。

sounddevice 将从您的笔记本电脑麦克风录制音频（标准音频输入）并在扬声器或耳机上播放（标准音频输出）。您可以使用声音对象进行进一步处理。

import sounddevice as sd
import numpy as np
import scipy.io.wavfile as wav

fs=44100
duration = 5  # seconds
myrecording = sd.rec(duration * fs, samplerate=fs, channels=2,dtype='float64')
print "Recording Audio"
sd.wait()
print "Audio recording complete , Play Audio"
sd.play(myrecording, fs)
sd.wait()
print "Play Audio Complete"

这是输出： Python 2.7.9（默认，2014 年 12 月 10 日，12:24:55）[MSC v.1500 32 位（英特尔）] 在 win32 上键入“copyright”、“credits”或“license()”以获取更多信息。 =================================重新开始================= ==

录制音频
录音完成，播放音频
播放音频完成

【讨论】：

【解决方案3】：

我会考虑使用 pysox，这是 libsox 的 python 绑定。

你可以从 PyPI 获得pysox package。

【讨论】：

【解决方案4】：

如果要求是Jack，那么您可能想要使用PyJack，它是Jack 的Python 绑定。

此外，源代码中有一个示例说明您想要做什么，即捕获音频。见文件capture.py

您必须考虑到避免错过一个块，您必须每隔500 *(buffer_size/sample_rate) 毫秒调用一次jack.process。 jack.process 错过音频块时抛出异常（jack.InputSyncError 和 jack.OutputSyncError）。

【讨论】：

我认为jack 的 OP 意味着实际的音频插孔（不是 USB 或其他），但我可能错了。